拉斯维加斯太阳报的"拒绝伤害"
太阳报的拒绝伤害通过分析超过29万条医院帐单纪录揭示了3600件以上可避免的损伤、传染和手术医疗事故。他们通过公共记录申请获得数据并且认定了超过300件由于可预防的医疗事故导致的死亡案例。这项数据新闻系列报道运用了各种元素,包括能让读者自行查阅医院中超乎预料的手术损伤情况的互动表格;还包括了医院间疾病传染扩散情况的时间轴地图;另外还有一个能让用户按可预防的损伤类型或按医院分类查看人们受到伤害数据情况的互动图表。我喜欢这个作品因为他非常容易理解,导航也做的很到位。用户不加思考便能很容易的去探索这些数据。
同时这个系列报道也产生了真正的影响:内华达州立法会就此颁布了六合法规。记者们投入了巨大的精力去获取并清理数据。其中一名记者,亚历山大理查德,至少十二次发还数据给医院和州政府以核实、订正数据。
政府雇员薪资数据库
我非常喜欢一些小的独立机构每天发布的作品,比如ProPublica或者芝加哥论坛报一名优秀的数据新闻记者瑞恩·墨菲所做的政府雇员薪资数据库。这个项目收集了66万名政府雇员的薪水情况且建立了一个数据库以便用户检索,同时帮助人们从中挖掘故事。你能按机构、姓名和工资去分类检索。它十分简单但又很有意义,把这些平时接触不到的数据公之于众。它使用简单还能自动生成许多故事。这个案例就很好的解释了为什么芝加哥论坛报网站的大部分访问量都是从数据页来的。
伊拉克战争记录全文可视化,美联社
乔纳森·史特里(Jonathan Stray)和朱利安·伯格斯(Julian Burgess)进军文本分析和可视化领域用于处理伊拉克战争日志的工作非常具有启发性,通过使用这些试验性的科技,将有利于在大量的文本数据集中挖掘与主题相关的更深层次的见解。
通过文本分析技术和算法,乔纳森和朱利安创造了一种方法,以视觉化方式呈现维基解密泄露出的成千上万个有关伊拉克战争的美国政府报告中关键词的聚类。
虽然这种呈现的方法比较有限,整个方式也是实验性质的,但至少是一种创新的途径。相比于带着这样一种放入特定关键词搜索再检阅输出结构就能得到些什么的先入为主的观念去尝试读遍所有文件或者检阅战争日志,这种技术能够计算并且可视化特定相关内容的主题或关键词。
随着不断增长的数据——既包括文本的(电子邮件、报告等)也包括数字的——正在进入大众领域,找出能准确定位关键兴趣区域的方法变得越来越重要。这是数据新闻下一个非常令人振奋的分支。
谋杀秘闻
谋杀秘闻这个项目由斯克里普斯·霍华德新闻服务研究机构的汤姆·哈格罗夫负责。他建立了一个数据库,数据是向政府数据和公共记录申请到的超过18.5万件未破谋杀案件的详细人口统计记录,然后他设计了一个算法,试图从中找到作案模式,推测可能存在的连环杀手。这个项目包括了下列所有的优点:精心搜集到的优于政府所有的数据,独到的运用社会科学技术的分析,还有交互的在线数据展示以便读者能够自己对数据进行探索。
气泡图表
安德鲁·加西亚·菲利普所制作的气泡图表网站是我最喜欢的数据新闻项目之一。安德鲁是个对数据十分痴迷的铁杆体育迷,又同时具备极好的极好的设计感与写代码的能力。他通过气泡图这个网站不仅可视化出历史的广度,还在深度上把个人与球队胜败的细节一并呈现。他的制作能传达整个语境,而且他做的图表引人入胜并且深度、幽默、有趣并存他的作品当中。