第三届数据新闻比赛已经截止提交作品了,关于这三个月来的比赛过程,有一些心得体会(Q&A)如下:
Q:队员专业背景相关以及参赛由来
A:团队里面可以说是没有任何跟新闻专业有直接关系的队员,我们来自一个以测绘地理信息为特色的理工科学院。参加这个比赛纯属偶然,某天导师无意之间了解到比赛主办方提供一些我们专业平时可以用来做研究的数据,因此以“顺手牵羊”获取数据为主要目的我们,摇身一变成为了参赛方。我们利用了我们学科中特有的空间分析的理论与方法,对武汉市的房价数据进行处理,从而分析得到一些有趣的信息,进而结合新闻的可视化方法,以网页交互形式展现这样一份数据分析报告。
Q:什么是数据新闻?
A:按照个人理解,这是几种元素的有机结合,这几种元素包括:新闻本体(核心),数据处理,分析&可视化(提供结论&新闻表达形式的辅助工具)。简单理解为新闻图表可视化,将过去的文本为主的新闻形式转变为文字结合图表可视化,赋予读者以精确且丰富的信息传达。
Q:数据新闻相对于传统新闻的优势所在?
A:图表交互可视化相较于过去的文本形式,所能够更为直观反映出新闻内数据关系,eg:柱状图能够直观体现不同类别的数据量大小关系,如果是文本结合数字的形式,读者难免会进行深入思考的过程,如果是图表形式,则会降低读者的阅读成本;数据新闻蕴含更多的信息,一张图表,可能会花费大量的信息调研时间,上面的每个数字,是经过分析的结果。总而言之:图表更大程度上将一篇新闻内的所有信息串联起来,使读者更为直观了解what happened。
Q:非新闻背景专业的选手参赛的优劣势所在?
A:这个比赛是“数据新闻比赛”,自然而然是为广大新闻行业人士准备的。但是。。。。这恰恰也是“数据新闻比赛”,数据新闻这个概念类似交叉学科(很巧我们专业也是交叉学科,所以干什么都带有跨界的思想在当下还是蛮混得开的),言归正传,上面也说过了,数据新闻结合了新闻+数据分析+可视化,换句话说,这个比赛最理想的人员配置是新闻专业+计算机专业+美术设计。这也意味着每个人都能最大可能发挥自身优势做自己擅长的部分。这个时候,非新闻背景的coder和PSer就站了出来,你写代码我抠图,一副琴瑟和鸣的景象。
Q:数据新闻的侧重点在于新闻还是可视化效果?
A:无论何时何地,数据新闻的重点仍然落在新闻二字上,一篇没有任何可视化效果的文本新闻仍然是一篇新闻,仍然具有可读价值。但是一篇没有新闻价值的可视化效果极佳的读物,则只是一件华美的外衣而不能为人们提供衣物最基本的功能。新闻制作者需要把极大的精力投入到新闻的意义表达上来,表现了多少事实or分析结论才是重中之重,把握好新闻意义才去追求可视化的极佳体验。单纯做数据可视化亦是如此,将故事说好说清楚比起极客的可视化体验来的重要。
Q: 新闻给予读者什么?
A:回答这个问题需要顾及的面很大,新闻之于读者好比产品之于顾客,产品不仅要把“可用”属性卖给顾客,还要把“好用”甚至高端体验这一类属性作为产品的目标。新闻亦是如此,不仅仅是将信息全盘塞给读者,而要引导读者去探索他们感兴趣的信息。Eg:不同房价下适宜居住指数的对比,提供多种交互的方式,给予读者不同的价格选择区间,读者可以根据自己的需求,筛选出他们希望看到的对比分析结果。
Q:数据新闻未来发展趋势?
A:比如说玫瑰图,这个图已经用了很久了,但是现在有人用看到它仍然会觉得很新奇。这是一个很奇怪的事情,这证明什么?证明我们的基础数据可视化的表达图表在很多年很多年都不再有更多的创新了,就是那么几种图形。
Q:技术上的细节?
A:就我们的作品而言。数据获取用到了爬虫,数据的清洗用的excel和Java,HPM模型中的计算用到了SPSS,而最终的H5页面的数据可视化主要用到了百度开源的Echarts,少部分图以及数据的展示用到了Leaflet(一个开源的前端库)。总之技术上也没什么太大的难点,大部分时间花在了Idea的构思以及数据的处理上,当然细心整理出来的数据对于后续的研究也有一定的价值,这波不亏。
Q:参赛的过程中的体会?
A:从最初的Idea提出到中期的数据处理环节,到后续的数据分析以至于最后的作品设计/整合提交等过程中,前后断断续续持续2个多月的时间,中间有因为工作繁琐重复而厌烦过,也有因思路不合而迷茫过,更有因琐事缠身(同时兼顾两个比赛以及实习和论文的修改等)而差点放弃过。我在写这篇比赛总结的当天凌晨,远在美国的导师发信息询问另外一个软件开发比赛的进展….不管如何,这个比赛算是坚持下来并且有了一个看来虽不尽完美但着实拥有自己想法的作品。截至目前,作品的阅读量在所有作品中位列第二(小伙伴们比较给力哈哈哈,增加了不少流量)。不管最终结果如何,这段经历算是不错的。
Q:比赛收获?
A:8.15提交的作品,之后三天时间,我阅读了大部分他人的作品。不得不说,这次主题较为开放:“探索数据与社会的关系”,意味着从社会这个数据制造器中流出来的数据都是新闻的有机原料。因此,探索文化差异的/文化遗产保护/绿色环保主题/恐怖事件/时尚娱乐圈/婚恋状况/医疗情况等等紧跟社会发展相关的主题层出不穷,学习了不少(感谢其他所有参赛选手)。
PS.近日阅读《数据科学中的R语言》,里面有句话很好地描述了“可视化”的作用:
可视化之所以有用,是因为人类是视觉动物,其视觉神经系统不善于处理原始的数据,但是非常善于阅读和分析图形,可视化的工作就是将各种类型的数据映射到不同类型的图形上面,使人们能够利用其天生的识别系统来快速获取信息,所以可视化的关键步骤就是从数据特征映射到图形元素。
作品链接:更多信息与互动内容请访问我们的H5页面http://163.44.113.133/project/index.html查看。(推荐使用 Chrome 浏览器观看。我也不知道服务器能保证这个链接有效期多久.哈哈哈doge/face)