可视化试图划分为4类
1.比较,各类别的关系
2.联系个或者两个以上变量的关系
3.构成,每个部分占总体的百分比
4.分布,关注但个变量,或者多个变量的分布情况
散点图
scater plot,将两个变量的值显示在二维坐标上,还有三维散点图
import matplotlib.pyplot as plt
还可以用seaborn进行散点图绘制
import seaborn as sns
如果说直方图可以看到变量的数值分布,那么条形图可以帮我们查看类别的特征。在条形图中,长度表示类别的频数,宽度表示类别。
热力图,heat map,是一种矩阵表示方法,矩阵中元素值用颜色代表,不同颜色代表不同的值。通过颜色能直观的知道某个位置数值的大小,也可以将这个位置上的颜色和数据集中的其他颜色进行对比
蜘蛛图是一种现实一对多关系的方法。一个表量相对于另一个变量的显著性是清晰可见的。作图需要两个数组labels,stats,保存这些属性的名称和属性值。
蜘蛛图是圆形,需要计算每个坐标的角度,然后对数值进行设置,画完最后一个点,需要与第一个点进行连线。