Day 80:预测

有时候对照着看一些故事,会挺有趣。

这本书中讲了一个Google预测流感的故事。传统的疫情预报,是由各地医院、诊所等机构和医务人员向美国疾病控制和预防中心上报,再由中心分析统计后发布。这种做法的最大问题在于,滞后性太大。

Google在2009年2月,在《自然》上发表了研究成果,他们研究了2007年到2008年,各地区搜索量和流行病传播之间的关系。依据用户搜索与流感相关的关键词的趋势变化,预测流感流行到什么地方了。工程师们挑选了几十种重要和次要的关键词作为特征,训练出了一个线性回归模型。这个模型在预测2007年和2008年流感趋势和地点的时候,准确率高达97%。

故事背后所用的技术,与作者吴军老师还有点关系。因为这项技术的发明人帕特尔,是吴军老师进入Google的面试官,并且当年面试时的一个问题就与此有关。

这个故事听起来非常振奋人心,然而这个预测是否真的很准呢?

另外一本书告诉我们别的故事。虽然2008年一次预测准了,甚至比美国疾病控制与防治中心提早了两周,但2009年全球爆发的H1N1,Google事先完全没有预测到,此外从2012年到2013年预测的很多流感也没有爆发。

有人分析其中的原因得出,搜索流感和真得流感,其实是两码事情,而不了解用户搜索的动机,就很难预测准确。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 亚楠 日更70天 今天不得已,只能在这里完成日更!看着还有38分钟就到了八点钟。心里不免有些着急! 六点开车出门,...
    幸福的小妮儿阅读 218评论 0 2
  • 文/爱笑的静姑娘 像许多高三党一样,我也曾有过万人过独木桥的恐慌。而当我真正踏出高考的考场时,所有的不安随...
    爱笑的静姑娘阅读 210评论 0 1
  • 麦兜:拿着包子,我忽然明白,原来有些东西,没有就是没有,不行就是不行,没有鱼丸,没有粗面,没有马尔代夫,没有奖牌,...
    韩美儿阅读 169评论 0 1
  • 去超市买些临行用品时听到了熟悉而又陌生的 《心愿》,眼角便多了一丝泪痕,许是想起了那些年。 初中那会,我...
    双林木兮阅读 250评论 0 0