阿旦的数新笔记:一
每每看到一则带着地图或图表或信息图,配上一点文字,再来点动态效果的文章,我总是怀疑:这玩意就是数据新闻?
到底什么才是数据新闻?这个疑问已经环绕我多时。在学校上课的时候,老师只不过很轻易地说:”这个概念还没有一个统一的定义,在我看来,所谓数据新闻,就是blablabla“。甩给我一个他的定义,如下:
以数据库和信息视觉化为基础,以事件可证性为特征,秉承调查性新闻报道的传统,在报道对象的某些相关关系中寻找难得的信息,通过事实的采集,借诸图表,地图,线图等视觉化技术的交互性呈现,来解读现象的复杂性,从而逼近事实的真实性和客观性,最大程度地满足用户的好奇心与期待,帮助人们更好地理解自己所处的时代的新闻报道方式。(刘昶 2015)
当然,这个定义没有什么不好。但是当我想用这个看上去复杂,我又不怎么理解的定义去鉴别茫茫“无良”媒体制作的“数据新闻”是不是真的时,简直无法下手。无奈,我只好自己努力去找寻鉴别的方法。(其实老师好像上课分析自己的定义分析地超棒,只不过已经忘却到九霄云外了。)
我找寻的方法是这样的:
-
第一步,尽可能多找到几个关于数据新闻的定义 。
别人现成的知识成果当然要捡。多看几个,可以发现大家所认为的数据新闻具备什么共同特征,以及,数据新闻的什么特性是被学者在不同定义里强调的。
分享两个我找到的其他定义,相比老师的长定义,这两个一个应该是最简版,一个是普通版。
最简版:用数据报道新闻。( 来源:欧洲新闻学中心和开放知识基金会联合开发的全球第一本介绍数据新闻概念的《数据新闻手册》)
普通版: 数据新闻是运用可视化和互动化手段,对社会某一热点问题进行宏观和中观的呈现、解释或预测的新闻样式。(张超、钟欣 2015)
由上三种定义,一眼望去,不用细看,大概可以得出两三个共通的关键词:数据、可视化及互动性、报道新闻。
哇哦!是不是同时包含这三种元素的东西就是数据新闻了?不是,别高兴太早,如果就这么简单,我老师会这么长篇大论地定义吗!
如果你学过一点新闻学的历史,那么你应该知道能同时包含这三种特性的新闻报道方式不仅仅只有数据新闻,还有精确新闻、计算机辅助报道新闻以及所谓的“数字新闻”。如果你没学过,也没关系,因为接下来要做的就是,教你区分它们。
-
第二步,区分数据新闻、数字新闻、精确新闻
这三种新闻在实践中经常被人混淆,因为它们往往都包含了数字信息和视觉化呈现形式。
然而,所谓数字新闻是指:
以数字、公式、字母等静态形式来辅助文字的报道。
例如:某媒体报道——全球化智库(CCG)与携程旅行网联合发布了《从出入境旅游看中国全球化发展》系列报告(下称《报告》),称中国入境游发展缓慢,外国人中国游增速赶不上中国人出国玩的速度,仅以游客人数计,顺差在2015年达到3000万人次。
简而言之,就是:
“这篇文章里有一个1000公里长的数字耶!”
“什么?一千公里长是多长?”
"就相当于环绕地球......我也不知道了,看图吧!"
另一种——精确新闻是指:
使用精准的数据分析新闻事件,以避免主观、人为的错误。它侧重于微观的具体调查、实验和内容分析。
最早,精确新闻兴起于美国北卡罗来纳大学新闻系教授迈尔(也译作迈耶)。他在1976年担任底特律《自由报》记者时恰遇该市发生严重的黑人暴动。他和另外两位社会科学家采用随机抽样的方法在暴乱地区抽选437位黑人进行访问,随后他将访问所得资料输人电脑以统计方法仔细分析黑人暴乱的原因并依据研究结果为《自由报》写了一系列报道。 迈尔的系列报道为该报赢得了普利策奖 ,后来迈尔便撰写了《精确新闻报道》一书(刘保全 2004)(不错的书!)
举一个最简单的例子,精确新闻后来被广泛应用在美国大选的报道中。对!就是大家所熟知的关于民意调查的报道。这些都是要通过抽样、收集、统计、分析再可视化报道的呀!
在许多中西方关于数据新闻定义阐释的文献中,“数据新闻”与基于科学的量化研究的“精确新闻”、计算机辅助报道新闻等概念息息相关。学者认为“数据新闻是精确新闻的延伸”(郭晓科 2013)。它具备了精确新闻和计算机辅助报道的客观、真实和高效的优势,是对这些传统报道样式的继承和发扬。数据新闻报道离不开社会科学的统计方法,只是在样本容量、呈现形式、传播手段方面更为先进(黄骏 2015)。
在样本容量方面,学者获取的数据通常分为三类:
1, 第一类是实验数据,这类数据的数据量大小往往在10-50条记录左右,在实验的控制下属于高质量数据,此时只适用于方差分析、回归分析等十分成熟的模型。
2, 第二类数据是问卷调查数据,这类数据的数量大小在60-3000条记录左右,数据质量中等,此时适用于传统统计分析的很多模型,包括生存分析、回归分析等等,并且经常考虑异方差问题。“精确新闻”的数据主要以前两类数据为主,数据量小于3000。
3, 第三类数据也就是现在我们如今在互联网时代常常遇到的数据库数据,适用于数据挖掘的模型,包括神经网络、聚类、决策树等等。“数据新闻”的数据来源主要是第三类数据,数据量较大。
看到这里,你应该理清了数据新闻与数字新闻、精确新闻的区别。总结一下:
数据新闻与数字新闻相比:
数据新闻不是简单地描述某个事件、事物有多重、多高、多大等等一系列表面的数字信息,而是需要将大量的数据进行量化分析,得出结果。
数据新闻与精确新闻相比:
数据新闻是精确新闻的发展,只是随着技术发展,数据新闻样本容量更为巨大,可视化形式更为丰富,传播手段更为多样。
这其中,决定数据新闻最为关键的特性就是大数据!
看到这里,恭喜你!离鉴别数据新闻只剩一步了!
-
第三步,了解什么是大数据
“大数据”(big data)概念从20世纪80年代诞生开始,如今已渗透入各个领域。它源于虚拟网络的极速发展以及现实世界的网络化。云计算、物联网、社交网络、即时通讯和移动互联等技术的涌现,产生了数量巨大、类型多样的原始数据(Raw Data)(黃骏 2015),使人們可以在数据海洋里,抓取有用的信息并对其进行解读,增加信息附加值。
与传统数据相比,大数据具有四大特征:
1, 数量(Volume),即数据量巨大,从TB级别跃升到PB级别,数据量的个数在100万到正无穷。
2, 多样性(Variety),即数据类型繁多,数据结构复杂。一方面数据来源不仅包括传统的格式化数据,还包括来自互联网的文章、视频、图片、地理位置信息等。另一方面,数据是复杂、非结构化的。
3, 速度(Velocity)快”亦指两方面,一是数据产生得快,例如欧洲核子研究中心的大型强子对撞机在工作状态下每秒产出PB级数据。二是数据处理的快。大数据处理技术与传统数据挖掘技术最大的区别,处理实时数据,并以实时结果为导向。
4, 真实性(Veracity),即追求高质量、真实的数据。
数据新闻是大数据在新闻领域的应用及体现,它与计算机辅助报道时代所用到的单一数据库来源不同,除了数据体量巨大,应用到新闻中的大数据最重要的特点是大部分为公开分享的数据,任何人或组织都可以借助手上的工具来求证新闻报道事实,完善新闻报道内容。
综上而言,我也对数据新闻下了一个定义:
数据新闻是采用科学量化研究逻辑,运用大数据作为信息来源,对大数据进行了清理、挖掘、分析,最终以视觉化、互动化手段为主要呈现方式,以期受众可以理解数据背后意义的新闻报道形式(阿旦 2017)
哈哈,你们更喜欢哪一个呢?
总结一下,当你遇见一篇有图表、有交互的新闻时,如何判断它是不是一篇(好的)数据新闻呢?
先看硬件要素:
1, 是否有且多个数据类型,有☑️继续
2,是否有可视化或互动,有☑️继续
3,是否能判断数据量大小达标,能☑️继续
4,原数据是否可以免费、公开获取并检验,可以☑️继续
再看内容:
1,是否有正确的量化分析数据,有☑️继续
2,是否尽最大努力地解释了数据分析结果代表的意义(我曾经对“美国媒体对今年美国大选进行的数据新闻报道”做过内容分析和个案分析,发现大多数据新闻报道都以“WHY和HOW”为标题,侧重解释数据结果)有☑️继续
3,是否用数据讲了一个好故事,而不是一个数据报告。有☑️完美
以上,就是我理想的数据新闻。
最后,本来想推荐一篇近期我看到很喜欢的数据新闻的——来自于《洛杉矶时报》。然而vpn突然连不上了,只能下期再推了。
####### 参考目录:
1, 黄骏. (2015). 從精確新聞到數據新聞:以 2014 央視《兩會大數據》解讀國內電視數據新聞,《中华传播学刊》, 1-27
2, 张超, & 钟新. (2015). 新闻业应用大数据: 展望, 误区与对策. 中州学刊, (6), 169-173.
3, 郭晓科. (2013). 数据新闻学的发展现状与功能. 编辑之友, (8), 87-89.
4, 胥琳佳. (2013). 大数据对于传播学研究内容和方法的影响——基于社交媒体和移动互联网的思考. 中国出版, (18), 3-6.
5, 刘保全. (2004).我国“精确新闻报道”发展综述. 当代传播,(3),37-40.
欢迎关注: