1.图形种类
seaborn 常用 基于matplotlib, 解决分组问题。【横轴,纵轴,数据集】
往往画的聚合指标图像
barplot() 条形图
scatterplot() 散点图
swarmplot()
sns.violinplot() 琴图
sns.countplot() 统计条形图
sns.pairplot() 成对图像
sns.heatmap() 热力图 用颜色深浅表达大小
sns.boxplot() 箱线图
sns.displot()直方图
数据: tips = sns.load_dataset('tips')
tips.groupby('sex')['total_bill'].mean()
sns.boxplot(x='sex',y='total_bill',data=tips) 横轴,纵轴,数据。
sns.distplot(tips.total_bill)
连续 VS 连续
离散 VS 连续
sns的hue参数:分组因子 hue_order:分组的顺序
1.1 线型图
例:股票随着时间的变化
人随着每次考试的分数的变化
1.2 条形图
比较大小
例:在某一时期内两个同学的成绩谁高谁低。(通过高矮或宽窄表示大小)
组与组数据比较大小
竖线为置信水平 95% ,置信水平描述置信区间,根据这个样本数据,抽100次,其中95次这个区间会包含总体的真实平均值。
算出来的,均值加减标准差得到置信区间。
1.3 散点图
两个维度表达对应关系(映射关系,函数关系)
例:经纬度
所有样本点自变量和因变量的关系
增加1个维度,气泡的大小,成为气泡图。
1.4 直方图
描述数据分布。(可看数据异常)
例:看一组数据是否符合正态分布
原理:数据按大小划分几个区域,在哪个区域加1。 分高度和宽度:宽度:数据区域,高度:落在区域里数据个数。(转换成概率称为kde图像)
IQR = Q3- Q1
upper = Q3 + 1.5IQR
bottom = Q1 + 1.5*IQR
箱线图(数据分布)
sns.boxplot()
琴图 (swan)
1.5 饼图
1.6 热图
描述两组数据关系
注:卡方验证主要是离散数据和离散数据之间的关系
corr()关系函数,默认person系数。
矩阵的值对应两个值的关系。
极浅的点和及深的点需要注意。