这次的新型肺炎跟2003年非典谁更厉害?
一、先粗暴上结论:2020更凶猛


图中红线表示2020新型肺炎的确诊人数自1月11日以来逐日增长曲线,数据来自国家卫健委每天的通报;
蓝线表示2003年非典确诊人数自当年2月9日以来随时间的增长曲线(内地,不含港澳台),数据来自新华社稿库中搜到的通报稿件。
如果从公开数据的时间算起,2003年非典,新华社第一次发稿是在2月11日,报道中提到,截至2月9日有305人确诊,到5月8日公布的数据是4805人确诊,相当于3个月的时间增长了4500人。
2020年新型肺炎,1月11日确诊人数41,28日跳涨到5874,17天就增长5833人,这个增长速度是2003年的6.7倍!
而且轻易突破了8月16日新华社宣布非典告一段落的累计病例数5327!


从两条曲线来看,2020曲线是非常标准的指数曲线,而2003年非典,在最凶险的2月到5月初之间,也没有呈现指数趋势。


稍可安慰的是,从目前的数据来看,2020年的死亡率比2003年更低一些,截至28日,死亡132例,确诊数5974,死率2.2%;而根据上述2003年8月16日的总结数字,确诊数5327,死亡数349,死亡率是6.5%。
简单解释一下,这里的操作是,从稿库中搜索2002年12月1日至2003年12月31日与“非典型肺炎”相关的稿件,标题或正文中含有检索词的都会被命中。稿库显示命中了17872篇稿件,只抓取了标题含“非典”或“肺炎”的,经过去重后剩下9283篇。再研究一下当时通报数字的稿件大体有哪些格式和规则,筛选出426篇。然后就是用一坨坨的正则表达式,去提取出累计确诊人数、累计死亡人数、累计治愈(或出院)人数、当日新增人数这些字段的信息。


二、拐点何时到来?
目前还看不到拐点。不妨回顾一下2003年的拐点是如何到来的。
从新华社报道里提取出来的通报数据来看,2003年的拐点出现在4月28日。4月28日之前,新增确诊数呈上升趋势,到这天达到最大(203例),然后就呈下降趋势了(所以到5月份,新华社报道里基本不提累计数,只提新增数了)。


我们来看看当年4月发生了什么。




半个月之后,疫情得到了控制。
从新华社稿库来看,系统地发布通报数据是从4月9日开始的,4月17日报道数跳涨(很合理,上面开会了),到24日达到峰值。


从2月11日到4月9日之间,是一些什么样的描述呢?




顺便,2003年的春节没受影响,当年的除夕在1月31日,主流媒体开始报道是2月11日之后了。也还好当年的肇始地是广东,地理辐射性没有武汉那么强。
2003年从有感染病例到第一篇报道我们等待了两个月(12月中旬到2月11日);从第一篇报道到全面抗疫(从2月11日到4月17日),又花去了两个月。17年后,从第一起通报到全面报道,只用了不到一个月的时间(12月31日到1月20日钟南山接受央视专访)。一半是这病毒强大的传播力所赐,另一半,还是要感谢允许每一个人发声的互联网。唯有科技的方向,是向前不可扭转。