参考书目:《Python机器学习基础教程》,Andreas 等人著;
1. basic concept
1.1 sample & feature
column1 | column2 | column3 |
---|---|---|
sample1 | feature1 | feature2 |
sample2 | feature1 | feature2 |
1.2 notation
- X :大写字母X表示matrix;
- y: 小写字母y表示vector;
1.3 Python常用库
name | function |
---|---|
numpy | 多维数组、高级数学函数、伪随机数生成器 |
scipy | 线性代数、数学函数优化、信号处理、特殊数学函数、统计分布 |
matplotlib | 科学绘图库 |
pandas | 分析处理数据 |
mglearn是本书作者自行编写的库,用于简化绘图与加载数据的细节;
1.4 常见函数与方法
名称 | 所在库 | 功能 |
---|---|---|
train_test_split | scikit-learn | 打乱数据集,并按照3:1的比例划分training set and test set |
scatter——matrix | pandas | 绘制散点图矩阵 |