seaborn应用之回归分析绘图

多变量分析绘图

%matplotlib inline
import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt

import seaborn as sns
sns.set(color_codes=True)

np.random.seed(sum(map(ord, "regression")))

tips = sns.load_dataset("tips")

tips.head()
image.png

regplot()和lmplot()都可以绘制回归关系,推荐regplot()
regplot可传的参数更多(高手可以用,功能多,规范多)

sns.regplot(x="total_bill", y="tip", data=tips)   #传入数据集  及字段
<matplotlib.axes._subplots.AxesSubplot at 0x20543531470>

可以查看小费和消费总额之间的关系


output_2_1.png
sns.lmplot(x="total_bill", y="tip", data=tips);
output_3_0.png
sns.regplot(data=tips,x="size",y="tip")
<matplotlib.axes._subplots.AxesSubplot at 0x20543649b70>
output_4_1.png
sns.regplot(x="size", y="tip", data=tips, x_jitter=.05)   # x_jitter 加入范围浮动
<matplotlib.axes._subplots.AxesSubplot at 0x205437d3f60>
output_5_1.png
anscombe = sns.load_dataset("anscombe")
sns.regplot(x="x", y="y", data=anscombe.query("dataset == 'I'"),
           ci=None, scatter_kws={"s": 100})
<matplotlib.axes._subplots.AxesSubplot at 0x205451a0908>
output_6_1.png
sns.lmplot(x="x", y="y", data=anscombe.query("dataset == 'II'"),
           ci=None, scatter_kws={"s": 80})
<seaborn.axisgrid.FacetGrid at 0x20543912e48>
output_7_1.png
sns.lmplot(x="x", y="y", data=anscombe.query("dataset == 'II'"),
           order=2, ci=None, scatter_kws={"s": 80});
output_8_0.png
sns.lmplot(x="total_bill", y="tip", hue="smoker", data=tips);
output_9_0.png
sns.lmplot(x="total_bill", y="tip", hue="smoker", data=tips,
           markers=["o", "x"], palette="Set1");
output_10_0.png
sns.lmplot(x="total_bill", y="tip", hue="smoker", col="time", data=tips);
output_11_0.png
sns.lmplot(x="total_bill", y="tip", hue="smoker",
           col="time", row="sex", data=tips);
output_12_0.png
f, ax = plt.subplots(figsize=(5, 5))
sns.regplot(x="total_bill", y="tip", data=tips, ax=ax);
output_13_0.png

col_wrap:“Wrap” the column variable at this width, so that the column facets span multiple rows

size :Height (in inches) of each facet

sns.lmplot(x="total_bill", y="tip", col="day", data=tips,
           col_wrap=2, size=4);
output_15_0.png
sns.lmplot(x="total_bill", y="tip", col="day", data=tips,
           aspect=.8);
output_16_0.png

分析-----------------------------------------------------------------------

%matplotlib inline
import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
import seaborn as sns
sns.set(style="whitegrid", color_codes=True)

np.random.seed(sum(map(ord, "categorical")))
titanic = sns.load_dataset("titanic")
tips = sns.load_dataset("tips")
iris = sns.load_dataset("iris")
sns.stripplot(x="day", y="total_bill", data=tips);
output_1_0.png

重叠是很常见的现象,但是重叠影响我观察数据的量了

sns.stripplot(x="day", y="total_bill", data=tips, jitter=True)
<matplotlib.axes._subplots.AxesSubplot at 0x26b010c6860>
output_3_1.png
sns.swarmplot(x="day", y="total_bill", data=tips)
<matplotlib.axes._subplots.AxesSubplot at 0x26b0112b908>
output_4_1.png
sns.swarmplot(x="day", y="total_bill", hue="sex",data=tips)
<matplotlib.axes._subplots.AxesSubplot at 0x26b01154b70>
output_5_1.png
sns.swarmplot(x="total_bill", y="day", hue="time", data=tips);
output_6_0.png

盒图

  • IQR即统计学概念四分位距,第一/四分位与第三/四分位之间的距离
  • N = 1.5IQR 如果一个值>Q3+N或 < Q1-N,则为离群点
sns.boxplot(x="day", y="total_bill", hue="time", data=tips);
output_8_0.png
sns.violinplot(x="total_bill", y="day", hue="time", data=tips);
output_9_0.png
#小提琴图
sns.violinplot(x="day", y="total_bill", hue="sex", data=tips, split=True);  #split拆分
output_10_0.png
sns.violinplot(x="day", y="total_bill", data=tips, inner=None)
sns.swarmplot(x="day", y="total_bill", data=tips, color="w", alpha=.5)
<matplotlib.axes._subplots.AxesSubplot at 0x26b01147b38>
output_11_1.png

显示值的集中趋势可以用条形图

sns.barplot(x="sex", y="survived", hue="class", data=titanic);
output_13_0.png

点图可以更好的描述变化差异

sns.pointplot(x="sex", y="survived", hue="class", data=titanic);
output_15_0.png
sns.pointplot(x="class", y="survived", hue="sex", data=titanic,
              palette={"male": "g", "female": "m"},
              markers=["^", "o"], linestyles=["-", "--"]);  #指定线型及符号(三角形与圆)
output_16_0.png

宽形数据

sns.boxplot(data=iris,orient="h");  # orient :h  横着画盒图
output_18_0.png

多层面板分类图

sns.factorplot(x="day", y="total_bill", hue="smoker", data=tips)
<seaborn.axisgrid.FacetGrid at 0x26b016a8860>
output_20_1.png
sns.factorplot(x="day", y="total_bill", hue="smoker", data=tips, kind="bar")
<seaborn.axisgrid.FacetGrid at 0x26b01692978>
output_21_1.png
sns.factorplot(x="day", y="total_bill", hue="smoker",
               col="time", data=tips, kind="swarm")
<seaborn.axisgrid.FacetGrid at 0x26b0290e6d8>
output_22_1.png
sns.factorplot(x="time", y="total_bill", hue="smoker",
               col="day", data=tips, kind="box", size=4, aspect=.5)
<seaborn.axisgrid.FacetGrid at 0x26b0280b3c8>
output_23_1.png

seaborn.factorplot(x=None, y=None, hue=None, data=None, row=None, col=None, col_wrap=None, estimator=<function mean>, ci=95, n_boot=1000, units=None, order=None, hue_order=None, row_order=None, col_order=None, kind='point', size=4, aspect=1, orient=None, color=None, palette=None, legend=True, legend_out=True, sharex=True, sharey=True, margin_titles=False, facet_kws=None, **kwargs)

Parameters:

  • x,y,hue 数据集变量 变量名
  • date 数据集 数据集名
  • row,col 更多分类变量进行平铺显示 变量名
  • col_wrap 每行的最高平铺数 整数
  • estimator 在每个分类中进行矢量到标量的映射 矢量
  • ci 置信区间 浮点数或None
  • n_boot 计算置信区间时使用的引导迭代次数 整数
  • units 采样单元的标识符,用于执行多级引导和重复测量设计 数据变量或向量数据
  • order, hue_order 对应排序列表 字符串列表
  • row_order, col_order 对应排序列表 字符串列表
  • kind : 可选:point 默认, bar 柱形图, count 频次, box 箱体, violin 提琴, strip 散点,swarm 分散点
    size 每个面的高度(英寸) 标量
    aspect 纵横比 标量
    orient 方向 "v"/"h"
    color 颜色 matplotlib颜色
    palette 调色板 seaborn颜色色板或字典
    legend hue的信息面板 True/False
    legend_out 是否扩展图形,并将信息框绘制在中心右边 True/False
    share{x,y} 共享轴线 True/False

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,919评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,567评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,316评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,294评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,318评论 6 390
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,245评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,120评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,964评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,376评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,592评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,764评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,460评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,070评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,697评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,846评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,819评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,665评论 2 354

推荐阅读更多精彩内容