数据可视化和大数据

最近在练习专注力,这是我用来联系的第一本书,大概总耗时是4小时。这本书的观点很有意思,作者会讲很多商业故事来为自己的观点做铺垫,所以还是挺适合练习专注力和速读的。关于数据可视化的时候,我度了《数据可视化之美》,主要是讲述关于什么是数据可视化,如何进行数据可视化,对可视化讲的非常细节。这本书相对比较不太一样,更多是从商业的角度来讲述为什么要进行数据可视化,数据可视化的好处,以及数据可视化在大数据中的位置,从一个较为宏观的角度来讲故事。

Tableau是一家专职做数据可视化工具的公司,这样一家公司,在2013年的5月,于华尔街上市,得到了2.5亿美元的融资。在大数据如此广泛的今日,可能还有的人还没有停过数据可视化这个词,而早在五年前,便有人早早的看到了数据可视化的价值。

image.png

(https://ss.csdn.net/p?http://mmbiz.qpic.cn/mmbiz_gif/KfLGF0ibu6cIHtAwwXZbvPz3oqXnDszPibgQn9L0s1Z5Xk3UHd74rA3kU1aUfm9ib3PD4k063QIrZSA7ZbMpbjePw/0?wx_fmt=gif

动图无法上传,因此贴出网址)

上图便是滴滴用大数据描绘出全国400城24小时的出行热力变化图。通过动图的方式,可以看到人们出行的高峰时间、人们集中在哪些城市等等信息。数据可视化就是这样一种工具,通过可视化的方式,将大量的数据甚至是成PB级的数据,直观的展示给观众,不再只是一些枯燥的数据。

可以说,数据可视化降低了数据分析的门槛,即使观众不是统计学专家,不懂各种复杂的数学公式,也一样可以快速的从图中发现一些问题,探察到潜在的商业价值,从而帮助制定更好的商业决策。同时,数据可视化工具也降低了观众的学习成本,观众并不需要了解那些专业的统计学工具、建模工具,如Matlab等如何使用,也不需要回任何编程语言,只需要将数据连接上,通过托拉拽等方式,就可以很容易地构建出相对定制化的可视化图形来供其进行研究。

数据可视化为什么是大数据中重要的一环

大数据是当今非常炙手可热的话题。很多公司通过正当或非正当的手段将一些用户数据收集起来据为己有,之前蚂蚁金服闹的沸沸扬扬的用一个很扯的年度关键字来诱使用户同意其收集数据就是一个很好的案例。关于数据的产生,这几年随着互联网的发展越发的快速了起来,曾有统计显示,全球数据量正以平均年增长率50%的速度在增长着,而当前数据总量的80%都是最近两年产生的。由此可见,现在正是数据的时代。

面对如此庞大的数据量,如何利用是一个关键。大数据可以做很多事,例如预测、推荐引擎等,而在这之前便是方向和目标的确定。这就是数据可视化的目的。借用Tableau的目标:

  • 使数据能被更好地理解
  • 与其他工具一道,使企业能够把握不断增长的数据流
  • 促进数据发现
  • 帮助人们进行更好地决策
image.png

大数据是把双刃剑,用好了可以造福用户,如自动驾驶、阿尔法狗都是人类智慧、机器智能和大数据的结晶,而如果用不好,其实就是对资源的浪费和对个人隐私的侵犯,如携程滴滴的杀熟、棱镜门事件都是很好的佐证。借用狄更斯的话:

这是最好的时代,也是最坏的时代;这是智慧的年代,也是愚蠢的年代;这是信仰的时期,也是怀疑的时期;这是光明的季节,也是黑暗的季节;这是希望的春天,也是失望的冬天;大伙儿面前应有尽有,大伙儿面前一无所有。

数据可视化与报表

对于数据可视化这个词以及数据可视化工具与报表和传统的报表工具如Excel、PPT有什么区别呢?确实二者有很多相似之处,而且很多数据可视化的展示就是静态报表。然而数据可视化很重要的一点在于其交互性,如上面滴滴的例子,通过动态的方式来展示,相较于静态的报表涵盖的信息量更大,讲的故事也多。

如Excel等的报表工具在现在也依旧很好的工具,但是相较于数据可视化工具来说,其数据来源更加单一,可展示的数据量也有很大的限制。数据可视化工具可以直接与用户的数据库相连,可以更高效的达到数据展示的目的,同时很多工具还支持分布式工具如Hadoop等。

不过想提一个个人观点,数据可视化工具虽然具备很大的优势,但并不是必需品。如果一个企业的数据没有达到一定量级,数据没有较大的复杂性,或许使用数据可视化工具是个良好的开端,但并不一定会被持续使用,毕竟Excel就可以很好的达到其目标。不能被持续使用的工具,学习使用它或许只是对时间的浪费。

不是银弹

数据可视化是大数据中重要的一环,是帮助企业更好地利用数据进行商业决策的一个步骤。然而数据可视化并不是银弹,其强烈依赖对于受众的良好把握、真实有效的大数据的支撑、良好的可视化设计以及其他一些因素。

把握好受众

天下并不存在放之四海皆准的真理,数据可视化也同样如此,并非所有的数据可视化都面向同样的手中,对于某一群手中起作用的可视化对于另一群手中未必起作用。因此把握好手中非常关键。

真实有效的数据支撑

英国数学家和发明家Charles Babbage曾说,

利用不充分数据印方的错误更甚于那些完全不用数据的错误

真实有效的数据支撑是利用数据可视化进行决策非常重要的一个前提。利用书中的一句话,数据可视化和大数据只是增加了做出更优决策和实现更大成果的机会而已,更重要的是,可视化并不代表“绝对的”和“永恒的”真理。数据可以操纵我们,混淆我们,也可以导致糟糕的决策。

良好的可视化设计

援引《英国卫报》数据记者John Burn-Murdoch的话:

即使简单如配色也会对可视化所呈现信息的可信度感知造成显著影响--通常这种影响较数据源的真实权威性还更强烈。

良好的可视化设计可以帮助用户更好的理解数据,从而制定明智的决策。而糟糕的设计,则会混淆用户的感知,将信息完全掩盖住,使用户制定糟糕的决策。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,869评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,716评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,223评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,047评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,089评论 6 395
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,839评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,516评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,410评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,920评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,052评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,179评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,868评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,522评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,070评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,186评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,487评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,162评论 2 356

推荐阅读更多精彩内容