在pandas中画图和使用matplotlib一样,这里记录一下使用
很久之前有些过matplotlib的散点图,参考:matplotlib手册(11) - 散点图
散点图,通常是用来观察数据之间相关性的
pandas.DataFrame.plot.scatter
DataFrame.plot.scatter(self, x, y, s=None, c=None, **kwargs)
Create a scatter plot with varying marker point size and color.
df = pd.DataFrame([[5.1, 3.5, 0], [4.9, 3.0, 0], [7.0, 3.2, 1],
[6.4, 3.2, 1], [5.9, 3.0, 2]],
columns=['length', 'width', 'species'])
最简单的参数,是X轴和Y轴的值
我们可以直接使用column来指定
df.plot.scatter(x='width' , y='length')
参数s
控制每一个点的大小
df.plot.scatter(x='width' , y='length' , s=500)
参数c
用来指定每一个点的颜色
df.plot.scatter(x='width' , y='length' , s=500 , c='green')
这里还可以调用其他matplotlib中的参数,
df.plot.scatter(x='width' , y='length' , s=500 , c='green' , alpha=0.4)
关于参数c
参数c,不单单可以用来指定颜色,还可以传入一个column name
A column name or position whose values will be used to color the marker points according to a colormap.
就是说,我们可以引入第3个维度,来指定点的颜色
df.plot.scatter(x='width' , y='length' , s=500 , c='species' , colormap='viridis')
回去看一眼,我们的数据,这个species就是不同的种类
关于colormap,可以参考下官方介绍:https://matplotlib.org/tutorials/colors/colormaps.html
补充一下,关于这个参数c,刚才使用的时候报错了,发现是我理解错了
pandas异常-'c' argument must either be valid as mpl color(s) or as numbers to be mapped to colors