Matplotlib Story:
Matplotlib 是一款python内嵌的数据可视化绘图库. 在机器学习中,结合numpy, sklean强大的数据处理工具,可以高效的对数据进行矩阵,算法模拟与实现, 训练数据样本图示等工作. 本文是数据处理和分析的举例.
题目:
一张excel表里面, 有项目名称,编码语言,及每个项目的代码量. 其中编码语言有四种,go, java, php, vue js. 利用机器学习中的 matplotlib 包绘图方法, 绘制2行2列的图形, 统计该四种语言所属的项目名称和对应的代码量!
raw data 举例
解题思路:
1. 用groupby 将表中的语言分类
2. 遍历groupby之后的每种programming language, 找到编码语言对应的代码量和项目名称
3. 以项目名称为x轴, 代码量为y轴,绘制2*2 图形. 用到subplot (行, 列, index) , 其中index 是该sub 子图所在的位置个数
具体详解参考代码的注释:
代码实现
运行结果:
显示结果
题目扩展 1:
要求四种不同颜色区分四张图, 且代码量排序线性显示出来 (Line Chart)
解题思路:
1. 先把代码量做 sorted_value , 该方法相当于order by,保证代码量从小到大排序
2. 在groupby 分类,制图
参考如下代码:
代码实现
运行结果:
执行结果
题目扩展 2:
绘制在一张图, 且满足四个编码语言维度项目量的对比 (Bar Chart)
解题思路:
1. Group by 语言类型
2. 遍历每个类型,且用plt.bar() 方法制图,其他参数使用方式同上
参考代码:
题目扩展2 代码展示
运行结果:
bar chart 显示