现在想一想,4月中上旬的数据新闻工作坊好像已经过去了很久,但那几天受到的多重折磨却犹在昨天。
剥离开课程安排的合理性,这次工作坊对我来说很大的一个收获在于直观的感受到一个数据新闻选题完成过程中可能遇到的种种困难。课程结束之后,我看完了方洁老师的《数据新闻概论》,有些问题得到了范式上的支撑,有些没有。现随笔记之。不过,文中的感受主要源于工作坊的实践过程,观点主观,且不适用于长线选题的操作过程。
选题:卡壳第一步
短期完成,无突发事件,无数据集——这种条件下,数据新闻选题的确立过程就是一步步退让的过程。虽然参与工作坊的过程中,我们基本上将前两天的时间全部用于选题工作,但最终定下的主体仍不甚满意。重要性、接近性、趣味性、可读性很难面面俱到,换言之,“专业性”和“大家乐意看”在数据新闻选题中会难以兼顾。
同时,在没有突发事件和大体方向的情况下,记者们选题时坚持的侧重点会产生冲突,陷入彼此的拉锯状态。在我看来,数据新闻选题,有很多是关于财经、关于科技的、体育的、环境的等等,这些专业性报道从来就不会像民生和娱乐话题,试图抓住所有人的眼球,创造巨大流量。所以,在选题时思考受众定位时,不能贪大求全。
虽然我们都要追求删繁就简、一目了然,追求数据新闻接地气、可读性。但放眼微博,看到那些每天陷入带节奏、乱呛声的“广大网民”,他们的状态会让人很怀疑——立场客观、信源丰富、放眼国际的报道,“摒弃扎眼网红标题、煽动性描述”的专业坚持,某种程度上来说可能是白费力气。
所以想明白一篇报道给谁看,之后怎么走会清楚很多。而选题如此让人挠头的另一个原因是数据新闻选题难以像消息、特稿等传统报道方式,可以在前期准备时轻易地调整报道角度,后期成稿时再根据采访情况修正行文逻辑,因为很多时候对数据的掌握情况就决定了一篇数新报道怎么做。
数据:秃头第二步
找选题和数据并不是剥离开的两个步骤,很多时候两者是是互相影响的。如果将数据新闻分为数据驱动和故事驱动两类,两者都需要数据获取、清洗、分析、呈现等步骤,故事驱动的报道中数据更多起辅助作用,对数据挖掘分析的需要稍弱一些。
而在搜索数据的时候往往会出现以下的bug:
找到数据集!但发现已经有媒体做过这个选题了且很完善。
找不到一手数据,只有一大堆行业报告里的二手数据。
发现了一些信息,现有技术难以在短时间内用爬虫获取相应的信息。
把需要的内容爬下来了,不知道何从下手,进行描述和量化。
需要政府公开数据官方信源佐证但并没有这种东西。
无法在短期内看懂专业领域和选题相关的一些数据,比如公司财报。
难以核查提供数据的机构性质,即便核查了,也难以判断是否应该放弃。
Finally,通过数据分析得出的结论(或选题本身)不符合社会主义核心价值观
……
很多时候,好选题和好数据不能并存,数据不足、不准确、不可信的情况往往导致一个选题的夭折,如果强行推进,一方面会大大削弱数据的科学性,一方面做到最后会自我怀疑——为什么不直接写一篇特稿呢?
视觉化:形式内容难两全
在日常的媒体报道中,很多以“数据新闻”冠名的报道实际上和数据没什么关系,报道中没有数据的处理分析,只是简单地罗列数字,对数字进行了显著排版——是“数值”不是“数据”。因而数据视觉化要以数据为基础,在前期数据分析的基础上进一步分析和研究数据如何应用于可视化,前期着重在“新闻价值”的挖掘,后期着重数据的“呈现价值”的分析。
在视觉化的过程中,数据呈现的科学性、可读性、简洁性、美观性又会产生冲突,不同的制作者在完成时的判断有时也会相左。脱离开特定作品可能很难谈这样的问题会如何解决,但这次工作坊让我觉得一定要克制用一张图里反应多个问题的愿望,在无法将各类图表用得游刃有余时,或许应该先简化图表,再复杂、有所创造,积累到一定程度时重新做回删繁就简、学会凝练。
此外,在视觉化的过程中,设计时政、经济等专业性选题,需要反复核实信息,避免错误和漏洞。
工作坊期间,同学们每天只睡四五个小时,不停争论、推翻、卡壳。小组选了年轻人在北京租房的选题,选题时大家就并不很满意,光策划就占去两天时间。做到最后,更是熬红了眼熬秃了头,那个时候觉得自己已经被动成为那些生活艰难的年轻人中的一个,觉得很好笑。被折磨到挠头的时候看到马云那个996的微博,更是讽刺。(不过最后的pre之后收到大家的点赞实在是让人感动)
最后一天的时候,走在去学院楼的路上,我突然想,如果非要苦哈哈的过247秃头生活,我也希望我做的是新闻作品,不是新闻产品。事实证明,我的专业技术水平决定了我成不了“懂新闻的数据人”,只能做“懂数据的新闻人”,目前来看,也还不够懂。
“做数据新闻和写文章一样,永远只有更好,没有最好。”
希望我们能更好。