seaborn常见绘图学习总结(分类图)

接着上次的分布图继续总结

一、目录:

分布图

  • displot (直方图)
  • kedplot(概率密度图)
  • jointplot(联合密度图)
  • pairplot(多变量图)

分类图

  • boxplot(箱线图)
  • violinplot(提琴图)

回归图

  • lmplot (回归图)

矩阵图

  • heatmap (热力图)

二、分类图

2.1、boxplot(箱线图)

箱线图是用来表示跨类别变量之间的定量数据的分布情况。框体表示上下四分位数、线显示分布的其余部分,中间线表示的是中位数,在线外的则为离群值(异常数据)。具体参数为:

seaborn.boxplot(x=None, y=None, hue=None, data=None, order=None, 
hue_order=None, orient=None, color=None, palette=None, saturation=0.75, 
width=0.8, dodge=True, fliersize=5, linewidth=None, whis=1.5, notch=False, ax=None, **kwargs)

  • data:数据集
  • x:数据集中哪一列数据作为x轴的分类变量
  • y:数据变量
  • hue:分类
  • saturation:float,饱和度
  • width:float,控制箱型图的宽度
  • fliersize:float,用于指示离群值观察标记大小
区分不同区的房屋面积
用hue进行分类

2.2、提琴图

提琴图与箱线图类似,都是用来表示不同类别数据之间定量数据的分布情况。但是提琴图的绘图基础是密度图,通过提琴图可以知道定量数据的分布情况。在图中,白点是中位数,黑色盒型的范围是下四分位数到上四分位数,细黑线表示须。外部形状为密度分布曲线。

seaborn.violinplot(x=None, y=None, hue=None, data=None, order=None, 
hue_order=None, bw='scott', cut=2, scale='area', scale_hue=True, gridsize=100, 
width=0.8, inner='box', split=False, dodge=True, orient=None, linewidth=None, 
color=None, palette=None, saturation=0.75, ax=None, **kwargs)

  • data,x,y,hue:含义同上
  • bw:‘scott’, ‘silverman’, float,控制拟合程度。在计算内核带宽时,可以引用规则的名称(‘scott’, ‘silverman’)或者使用比例(float)。实际内核大小将通过将比例乘以每个bin内数据的标准差来确定
  • scale:“area”,“count”,“width”,用来缩放每个提琴图的宽度的方法。
    *scale_hue:当使用hue分类后,设置为True时,此参数确定是否在主分组变量进行缩放
  • gridsize:设置提琴图平滑度,越高越平滑
  • inner:“box”, “quartile”, “point”, “stick”, None,小提琴内部数据点的表示。分别表示:箱子,四分位,点,数据线和不表示;
  • split:是否拆分,与hue的分类结合使用
默认情况
根据hue分类进行split,并根据count计数来画概率分布
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。