你的图表会说话吗?

本文出自我的好友,Excel图表大神:苏有熊。

为保持风格一致,稍作排版和内容修改,具体可以点击【阅读原文】。

更多图表干货,请关注《商业图表指南》。

这两天我工作中遇到一个新问题,需要比较两组数据的整体差异性,各有约900个数据点。

从数据结构上来看,是关于 900个类别对象、两组相关数据 的度量值;而本质上,这可以算是,一个统计问题,术语可以称作“多样本的成对数据分析”

/ 1 /

从一个散点图开始

900个数据密密麻麻,单凭对数据的直接观察,很难看出什么东西来。

于是我画了下面这张图,通过可视化的方式去比较这两组数据的整体差异表现:

img

简单说明一下,这个图表的阅读方法:

1- XY轴最大最小值相同(但是Y轴不等距,为对数刻度),表示数据X和Y因子。加入一条趋势线,可以清晰的表达数据的X和Y坐标关系。

2- 理论上来讲,离趋势线越近的数据点,其XY值之间的差异越小。

为了验证这个猜测,我挑选了几个趋势线上的数据点,利用数据标签显示其XY值,得到如下图形:

img

成功!趋势线将整个数据区域分割成了两个对等的区域。

拉登解说:因为Y轴是对数刻度,所以视觉上看着是不对等的....

另外,仔细观察,我们不难发现,图表中的几条规律。

1- 趋势线的上方区域,表示Y值大于X值;反之,趋势线的下方,表示X值大于Y值。

2- 通过图形观察数据点与趋势线的分离程度,则可以直观反映出所有数据对象两个度量值的整体差异。

3- 加入R平方值可以量化这个两组数据的吻合度,在这里R平方值等于0.8661,可以看做两组数据的整体吻合程度达到了86.61%,差异是一个较小的程度。

拉登解说:为了让图表的信息传递的更精确,备注图表的阅读方法、关键信息,是非常有必要的,也能体现图表作者的专业度。

/ 2 /

7个会说话的图表

通过上面这个案例,我们可以感受到图表的魅力:让数据变的更加的直观,简单易懂!

实际上,这种呈现的方式在《经济学人》的图表中最为常见。

下面是从经济学人的图表库中挑选的一些例图,我们来感受一下,其应用的方式和细节的处理。

1- 高血压患病率分析图

img

这个图表的数据,源自是对数十个国家高血压患病率的采样分析,目标是确定高血压的性别差异,其中:

1- X轴为女性高血压的患病率

2- Y轴为男性高血压的患病率

这张图的样式非常好。利用一条对角线将散点图分为对等的两部分,我们可以很清楚的观察出:

1- 数据点,大部分落在上方的三角区域(男性)。这表明,大部分所选国家,男性高血压的患病率远高于女性,女性患病率高于男性的,集中在部分非洲国家;

2- 黄色圆点(高收入西方国家)代表的高血压患病率,整体处于较低水平。

3- 相对的,深蓝色圆点(中欧和东欧国家的男性)高血压患病率在所有样本国家中处于最高水平。

通过对样本国家以所属地理位置的分组,也可以很清晰的观察出各地域之间的差异。

2-GDP和献血次量关系分析图

img

这个图反映的是,样本国家的人均GDP,和每1000人献血次数的两组度量值的成对比较。

上面的类似,但是稍有不同的是,分割数据区域的趋势线是一个弧形,将XY轴的其中一个设置为对数刻度可以实现这个效果。同样的:

1- 高于趋势线的数据点所代表的国家,居民的献血意愿较强;

2- 反之,趋势线以下的,献血意愿较低。

3- 出生率和财富关系图

img

第2个图表中,两指标间呈现正相关,而上面这张例图,两指标间呈负相关关系。

4-政府工信度和媒体满意度关系图

img

同样的,图中的斜线代表政府工信度,和媒体可信度的关系。

1- 数据越靠上,代表更相信媒体的可信度。

2- 数据越靠下,则代表相信政府的工信度。

5-男女员工薪酬对比图

img

数据偏向右侧,表示男性的薪水,高于女性的薪水。

6- 薪酬分布图

img

7- 一胎生育年龄直方图

img

/ 3 /

商业图表巨头《经济学人》

以上7幅世界顶尖水准的例图,除例图5来自于FT金融时报外,其余均来自于世界商业图表领域的巨头、或者说是王者——《经济学人》

大家可以细细品味每一张图表的制图思路,以及细节处理。

更多优质的图表,可以通过下面几种方式,关注经济学人。

1- 官方网站

http://www.economist.com/(需要梯子)

2- 官方微博

image.png

3- 官方微信公众号

image.png

看得多了,遇到合适的案例数据,试着去用自己熟悉的工具去实现,其表现力将是强大的,外观也称得上超凡脱俗、别具一格。

最后强调一句,以上图表样式,均可以用Excel实现。

footer

本文首发公众号【拉小登】
我是拉小登,源于Excel,不只是Excel

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 一、实验目的 学习使用 weka 中的常用分类器,完成数据分类任务。 二、实验内容 了解 weka 中 explo...
    yigoh阅读 12,784评论 5 4
  • 关于Mongodb的全面总结 MongoDB的内部构造《MongoDB The Definitive Guide》...
    中v中阅读 32,195评论 2 89
  • 三毛曾经说,在这个日渐快速的时代里,我们张望街头,每每看见一张张冷漠麻木,没有表情的面容匆匆行过,我总是警惕自己,...
    丁海鹏阅读 2,854评论 0 0
  • 在微信上参加了两三个活动,都正在进行,我不想说自己在坚持。 所谓的坚持是你骨子里并不喜欢,有可能无疾而终,而相信自...
    大麦茶的故事阅读 1,846评论 0 0
  • 无伤心之色,无离别之感。恣意妄为,随心洒脱。 这半个月足够让人成长一次,所做出的一切必须付出相应的代价,曾经的不负...
    伪船长阅读 1,319评论 0 2

友情链接更多精彩内容