数据科学 IPython 笔记本 8.5 简单的散点图

8.5 简单的散点图

原文:Simple Scatter Plots

译者:飞龙

协议:CC BY-NC-SA 4.0

本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。

另一种常用的绘图类型是简单的散点图,是折线图的近亲。这里的点并不由线连接,而是单独表示的点,圆或其他形状。我们首先为绘图配置笔记本,并导入我们将使用的函数:

%matplotlib inline
import matplotlib.pyplot as plt
plt.style.use('seaborn-whitegrid')
import numpy as np

散点图和plt.plot

在上一节中,我们查看了生成折线图的plt.plot /ax.plot。事实证明,同样的函数也可以生成散点图:

x = np.linspace(0, 10, 30)
y = np.sin(x)

plt.plot(x, y, 'o', color='black');
png

函数调用中的第三个参数是一个字符,表示用于绘图的符号类型。正如你可以指定选项,例如'-''--'`来控制线条样式,标记样式有自己的一组短字符串代码。完整的可用符号列表,可以在plt.plot``的文档中找到,或者在Matplotlib 的在线文档中看到。大多数选项非常直观,我们将在这里展示一些更常见的:

rng = np.random.RandomState(0)
for marker in ['o', '.', ',', 'x', '+', 'v', '^', '<', '>', 's', 'd']:
    plt.plot(rng.rand(5), rng.rand(5), marker,
             label="marker='{0}'".format(marker))
plt.legend(numpoints=1)
plt.xlim(0, 1.8);
png

为了获得更多选项,这些字符代码可以与线条和颜色代码一起使用,来绘制点以及连接它们的线:

plt.plot(x, y, '-ok');
png

plt.plot的附加关键字参数,指定了线条和标记的各种属性:

plt.plot(x, y, '-p', color='gray',
         markersize=15, linewidth=4,
         markerfacecolor='white',
         markeredgecolor='gray',
         markeredgewidth=2)
plt.ylim(-1.2, 1.2);
png

plt.plot函数的这种灵活性支持各种可能的可视化选项。可用选项的完整说明,请参阅plt.plot文档。

散点图和plt.scatter

第二种更强大的创建散点图的方法是plt.scatter函数,它的用法与plt.plot函数非常相似:

plt.scatter(x, y, marker='o');
png

plt.scatterplt.plot的主要区别是,它可用于创建散点图,其中每个单独的点的属性(大小,填充颜色,边缘颜色等)可以单独控制,或映射到数据。

让我们通过创建一个随机散点图,包含多种颜色和大小的点,来展示它。为了更好地查看重叠结果,我们还将使用alpha关键字来调整透明度:

rng = np.random.RandomState(0)
x = rng.randn(100)
y = rng.randn(100)
colors = rng.rand(100)
sizes = 1000 * rng.rand(100)

plt.scatter(x, y, c=colors, s=sizes, alpha=0.3,
            cmap='viridis')
plt.colorbar();  # show color scale
png

请注意,颜色参数自动映射到颜色标度(此处由colorbar()命令显示),size参数以像素为单位。通过这种方式,点的颜色和大小可用于在可视化中传达信息,以便可视化多维数据。

例如,我们可能会使用来自 Scikit-Learn 的 Iris 数据,其中每个样本是三种类型的花朵中的一种,其花瓣和萼片的大小是仔细测量的:

from sklearn.datasets import load_iris
iris = load_iris()
features = iris.data.T

plt.scatter(features[0], features[1], alpha=0.2,
            s=100*features[3], c=iris.target, cmap='viridis')
plt.xlabel(iris.feature_names[0])
plt.ylabel(iris.feature_names[1]);
png

我们可以看到,这个散点图使我们能够同时探索数据的四个不同维度:每个点的(x, y)位置对应于萼片的长度和宽度,该点的大小与花瓣宽度有关,并且颜色与花的特定种类有关。像这样的多颜色和多特征散点图,对于数据探索和展示都是有用的。

plot VS scatter:效率的注解

除了plt.plotplt.scatter中提供的不同功能之外,为什么你选择使用一个而不是另一个? 虽然对于少量数据而言并不重要,因为数据集大于几千个点,plt.plot可能比plt.scatter明显更高效。原因是plt.scatter能够为每个点渲染不同的大小和/或颜色,因此渲染器必须执行单独构建每个点的额外工作。

另一方面,在plt.plot中,点基本上总是彼此的克隆,因此确定点的外观的工作,仅对整个数据集执行一次。对于大型数据集,这两者之间的差异可能会使性能大不相同,因此,对于大型数据集,plt.plot应优于plt.scatter

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,444评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,421评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,363评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,460评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,502评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,511评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,280评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,736评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,014评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,190评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,848评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,531评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,159评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,411评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,067评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,078评论 2 352

推荐阅读更多精彩内容