最近有在了解数据可视化相关的内容,翻看一些数据领域的文章,多数只是对数据可视化工具进行了简单罗列,并没有对每种工具的特性及其使用场景进行细致剖析,对从事数据领域的人提供的参考价值不大。况且在工作过一段时间之后,数据人员从事的业务领域其实决定了其使用该类工具的局限性,这意味着在一个业务领域其实不必掌握可视化的方方面面,抓住其中一小部分的共通点和核心往往就足以应付绝大部分的业务需求。
通常来说,数据可视化要求:
(1)实时性:数据可视化工具必须适应大数据时代数据量的爆炸式增长需求,必须快速的收集分析数据、并对数据信息进行实时更新;
(2)简单操作:数据可视化工具满足快速开发、易于操作的特性,能满足互联网时代信息多变的特点;
(3)更丰富的展现:数据可视化工具需具有更丰富的展现方式,能充分满足数据展现的多维度要求;
(4)多种数据集成支持方式:数据的来源不仅仅局限于数据库,数据可视化工具将支持团队协作数据、数据仓库、文本等多种方式,并能够通过互联网进行展现。
由于作者从事的是在线视频行业,所负责产品为后台大数据产品,需要为各个端提供数据处理分析及决策支持,故而涉及到大量的数据指标收集、处理和展示。尽管当前系统大部分数据展示模块用ECharts工具足以展示,但其在分析层面并不能做到很深入的程度,多维度数据的交叉分析更是无可奈何。通过调研一些国外数据可视化工具,总结了以下可能会结合到工作中的产品。
(1)D3.js
D3(Data Driven Documents)是支持SVG渲染的另一种JavaScript库,能够提供大量线性图和条形图之外的复杂图表样式,例如Voronoi图、树形图、圆形集群和单词云等。
例1:数据可视化之地域分布-面临冰雪融化灾难的阿拉斯加土著居民分布
http://www.theguardian.com/environment/interactive/2013/may/14/alaska-villages-frontline-global-warming
通过D3,右边的地域分布图很好地与左边的tab及数据图表联动起来,极为形象生动地展现了当今环境变化引发的生态问题,令人印象深刻。数据的及时响应方面也做的十分出色,基本上做到了区域间数据的无缝切换。
例2:数据可视化之时间分布-航空准时情况表现
http://square.github.io/crossfilter/
上半部分的四个图表分别为四个查询维度,每个维度都支持单独的区间选择,下方的表格则实时展示所选查询维度下的指标数据。这种方法提供了很好的多维度实时查询功能,手动选择区间也让用户有更直观的体验和参与感。
PS:带着以下几个趣味问题看上面的数据的话,就差不多算是步入数据挖掘和数据分析的大门啦~
1.When is the best time of day/day of week/time of year to fly to minimise delays?
2.Do older planes suffer more delays?
3.How does the number of people flying between different locations change over time?
4.How well does weather predict plane delays?
5.Can you detect cascading failures as delays in one airport create delays in others? Are there critical links in the system?
(2)Visual.ly
http://visual.ly/solutions/data-visualization-information-design
以下数据可视化方式供参考
- Area Charts(面积图,将折线图与横轴围起来的面积进行填充计算)
- Bar Charts(条形图,横的)
- Choropleth Maps(专题地图,用色块填充区域表示数据变量)
- Column Charts(柱状图,竖的)
- Common Chart Types(常用图表类型)
- Coxcomb Chart(鸡冠花图,有时也称作极地区域图)
- Create Interactive Infographics(交互图,可以对数据进行操作)
- Create Motion Graphics(使用电子媒体加以解释)
- Create the Best Explainer Videos(说明视频)
- Creating Infographics: The Basics(包含更多内容的信息图)
- Donut Charts(甜甜圈图,功能类似于饼图)
- Heat Maps(往往有着二维数据的热力图)
- Histograms(直方图)
- Isopleth Maps(等值线图)
- Line Charts(折线图)
- Pie Charts(饼图)
- Pin Maps(引脚图)
- Scatter Plots & Regression Lines(散点图与回归线)
- Time Series Visualizations(时间序列可视化)
- Timelines
- Treemaps(树图,使用嵌套矩阵代表整体,展示数据继承关系)
- Word Clouds(标签云)