一. 图表的基本概念
图表包括统计图和统计表
1-1. 统计图
概念: 统计图是根据统计数字,用几何图形、事物形象和地图等绘制的各种图形。它具
有直观、形象、生动、具体等特点。
塔夫特认为的一张好图应具由的基本特征:
- 显示数据
- 避免歪曲
- 强调数据之间的比较
- 服务于一个明确的目的
- 有对图形的统计描述和文字说明
- 让读者把注意力集中在图形的内容上,而不是制作图形的程序上
塔夫特提出的五条鉴别图形优劣的准则:
- 一张好图应当精心设计,有助于洞察问题的实质
- 一张好图应当使复杂的观点得到建明、确切、高效的阐述
- 一张好图应当能在最短的时间内以最少的笔墨给读者提供最大量的信息
- 一张好图应当是多维的
- 一张好图应当表述数据的真实情况
1-2. 统计表
概念: 统计表是反映统计资料的表格,它一般由四个主要部分组成,即表头、行标题、列
标题和数据资料。
设计和使用统计表要注意的几点:
- 首先,要合理安排统计表的结构。由于强调的问题不同,行标题和列标题可以互换,但应使统计表的横竖长度比例适当,避免出现过高或过宽的表格形式
- 其次,表头一般应包括表号、总标题和表中数据的单位等内容
- 再次,表中的上下两条横线一般用粗线,中间的其他线用细线
- 最后,在使用统计表时,必要时可在表的下方加上注释,特别要注意应注明数据来源
二.双变量-品质数据的常用图表
品质型数据是指按品质标志分组所得到数据,包括分类数据和顺序数据
2-1. 分类数据的常用图表
①. 条形图
-
概念: 条形图是用宽度相同的条形的高度或长短来表示数据多少的图形,包括简单条
形图、复式条形图等 -
图示:
②. 帕累托图
- 概念: 帕累托图是按各类别数据出现的频数多少排序后绘制的条形图
-
图示:
③. 饼图
-
概念: 饼图是用圆形及圆内扇形的角度来表示数值大小的图形,主要用于表示一个样
本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十
分有用 -
图示:
④. 环形图
-
概念: 环形图与饼图类似,但是环形图中间有一个空洞,每个样本用一个环来表示,
样本中的每一部分数据用环中的一段表示 -
图示:
2-2. 顺序数据的常用图表
顺序数据常用的只有一种,也就是累积分布图。
概念: 是指类别数据从某一个方向(最大比率或最小比率)开始向上累积或向下累积
图示:
三.双变量-数值型数据的常用图表
数值型数据同品质数据一样,也有多个分类,包括分组数据、未分组数据和时间序列数据。
3-1. 分组数据的常用图表
①. 直方图
-
概念: 直方图用于展示分组数据分布,使用矩形的宽度和高度(即面积)来表示频数
分布; -
图示:
②. 折线图
- 概念: 以折线的上升或下降来表示统计数量的增减变化的统计图,叫作折线图
-
图示:
3-2. 未分组数据的常用图表
①. 茎叶图
- 概念: 茎叶图是反映原始数据分布的图形,由茎和叶构成,其图形由数字组成
-
图示:
②. 箱线图
-
概念: 箱线图是根据一组数据的最大值、最小值、中位数、两个四分位数这五个特征
值绘制而成的,主要用于反映原始数据的分布特征,还可以进行多组数据分布特
征的比较; -
图示:
3-3. 时间序列数据的常用图表
时间序列数据的常用图表主要为线图,即以时间为自变量在图表上表示具体事物随时间的变化情况
图示:
四. 多变量数据的常用图表
多变量数据的常用图表主要有三种:散点图(双变量)、气泡图(三变量)、雷达图(多变量)
①. 散点图
-
概念: 散点图也叫 X-Y 图,它将所有的数据以点的形式展现在直角坐标系上,以显示
变量之间的相互影响程度,点的位置由变量的数值决定 -
图示:
②. 气泡图
-
概念: 将一个变量放在横轴,另一个变量放在纵轴,第三个变量则用气泡的大小来表
示的图表 -
图示:
③. 雷达图
-
概念: 雷达图是以从同一点开始的轴上表示的三个或更多个定量变量的二维图表的形
式显示多变量数据的图形方法 -
绘制方法:
- ⑴. 先画一个圆,然后把圆P等分,得到P个点,令这P个点分别对应P个变量
- ⑵. 再将这P个点与圆心连线,得到P个辐射状的半径,这P个半径分别作为P个变量
的坐标轴,每个变量值的大小由半径上的点到圆心的距离表示 - ⑶. 再将同一个样本的值在P个坐标上的点连线
-
图示: