数据新闻比赛的一点心得

第三届数据新闻比赛已经截止提交作品了,关于这三个月来的比赛过程,有一些心得体会(Q&A)如下:

Q:队员专业背景相关以及参赛由来

A:团队里面可以说是没有任何跟新闻专业有直接关系的队员,我们来自一个以测绘地理信息为特色的理工科学院。参加这个比赛纯属偶然,某天导师无意之间了解到比赛主办方提供一些我们专业平时可以用来做研究的数据,因此以“顺手牵羊”获取数据为主要目的我们,摇身一变成为了参赛方。我们利用了我们学科中特有的空间分析的理论与方法,对武汉市的房价数据进行处理,从而分析得到一些有趣的信息,进而结合新闻的可视化方法,以网页交互形式展现这样一份数据分析报告。

Q:什么是数据新闻?

A:按照个人理解,这是几种元素的有机结合,这几种元素包括:新闻本体(核心),数据处理,分析&可视化(提供结论&新闻表达形式的辅助工具)。简单理解为新闻图表可视化,将过去的文本为主的新闻形式转变为文字结合图表可视化,赋予读者以精确且丰富的信息传达。

Q:数据新闻相对于传统新闻的优势所在?

A:图表交互可视化相较于过去的文本形式,所能够更为直观反映出新闻内数据关系,eg:柱状图能够直观体现不同类别的数据量大小关系,如果是文本结合数字的形式,读者难免会进行深入思考的过程,如果是图表形式,则会降低读者的阅读成本;数据新闻蕴含更多的信息,一张图表,可能会花费大量的信息调研时间,上面的每个数字,是经过分析的结果。总而言之:图表更大程度上将一篇新闻内的所有信息串联起来,使读者更为直观了解what happened。

Q:非新闻背景专业的选手参赛的优劣势所在?

A:这个比赛是“数据新闻比赛”,自然而然是为广大新闻行业人士准备的。但是。。。。这恰恰也是“数据新闻比赛”,数据新闻这个概念类似交叉学科(很巧我们专业也是交叉学科,所以干什么都带有跨界的思想在当下还是蛮混得开的),言归正传,上面也说过了,数据新闻结合了新闻+数据分析+可视化,换句话说,这个比赛最理想的人员配置是新闻专业+计算机专业+美术设计。这也意味着每个人都能最大可能发挥自身优势做自己擅长的部分。这个时候,非新闻背景的coder和PSer就站了出来,你写代码我抠图,一副琴瑟和鸣的景象。

Q:数据新闻的侧重点在于新闻还是可视化效果?

A:无论何时何地,数据新闻的重点仍然落在新闻二字上,一篇没有任何可视化效果的文本新闻仍然是一篇新闻,仍然具有可读价值。但是一篇没有新闻价值的可视化效果极佳的读物,则只是一件华美的外衣而不能为人们提供衣物最基本的功能。新闻制作者需要把极大的精力投入到新闻的意义表达上来,表现了多少事实or分析结论才是重中之重,把握好新闻意义才去追求可视化的极佳体验。单纯做数据可视化亦是如此,将故事说好说清楚比起极客的可视化体验来的重要。

Q: 新闻给予读者什么?

A:回答这个问题需要顾及的面很大,新闻之于读者好比产品之于顾客,产品不仅要把“可用”属性卖给顾客,还要把“好用”甚至高端体验这一类属性作为产品的目标。新闻亦是如此,不仅仅是将信息全盘塞给读者,而要引导读者去探索他们感兴趣的信息。Eg:不同房价下适宜居住指数的对比,提供多种交互的方式,给予读者不同的价格选择区间,读者可以根据自己的需求,筛选出他们希望看到的对比分析结果。

Q:数据新闻未来发展趋势?

A:比如说玫瑰图,这个图已经用了很久了,但是现在有人用看到它仍然会觉得很新奇。这是一个很奇怪的事情,这证明什么?证明我们的基础数据可视化的表达图表在很多年很多年都不再有更多的创新了,就是那么几种图形。

Q:技术上的细节?

A:就我们的作品而言。数据获取用到了爬虫,数据的清洗用的excel和Java,HPM模型中的计算用到了SPSS,而最终的H5页面的数据可视化主要用到了百度开源的Echarts,少部分图以及数据的展示用到了Leaflet(一个开源的前端库)。总之技术上也没什么太大的难点,大部分时间花在了Idea的构思以及数据的处理上,当然细心整理出来的数据对于后续的研究也有一定的价值,这波不亏。

Q:参赛的过程中的体会?

A:从最初的Idea提出到中期的数据处理环节,到后续的数据分析以至于最后的作品设计/整合提交等过程中,前后断断续续持续2个多月的时间,中间有因为工作繁琐重复而厌烦过,也有因思路不合而迷茫过,更有因琐事缠身(同时兼顾两个比赛以及实习和论文的修改等)而差点放弃过。我在写这篇比赛总结的当天凌晨,远在美国的导师发信息询问另外一个软件开发比赛的进展….不管如何,这个比赛算是坚持下来并且有了一个看来虽不尽完美但着实拥有自己想法的作品。截至目前,作品的阅读量在所有作品中位列第二(小伙伴们比较给力哈哈哈,增加了不少流量)。不管最终结果如何,这段经历算是不错的。


Q:比赛收获?

A:8.15提交的作品,之后三天时间,我阅读了大部分他人的作品。不得不说,这次主题较为开放:“探索数据与社会的关系”,意味着从社会这个数据制造器中流出来的数据都是新闻的有机原料。因此,探索文化差异的/文化遗产保护/绿色环保主题/恐怖事件/时尚娱乐圈/婚恋状况/医疗情况等等紧跟社会发展相关的主题层出不穷,学习了不少(感谢其他所有参赛选手)。

PS.近日阅读《数据科学中的R语言》,里面有句话很好地描述了“可视化”的作用:

可视化之所以有用,是因为人类是视觉动物,其视觉神经系统不善于处理原始的数据,但是非常善于阅读和分析图形,可视化的工作就是将各种类型的数据映射到不同类型的图形上面,使人们能够利用其天生的识别系统来快速获取信息,所以可视化的关键步骤就是从数据特征映射到图形元素。

作品链接:更多信息与互动内容请访问我们的H5页面http://163.44.113.133/project/index.html查看。(推荐使用 Chrome 浏览器观看。我也不知道服务器能保证这个链接有效期多久.哈哈哈doge/face)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,657评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,662评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,143评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,732评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,837评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,036评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,126评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,868评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,315评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,641评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,773评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,470评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,126评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,859评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,095评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,584评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,676评论 2 351

推荐阅读更多精彩内容