1 什么是机器学习
机器学习:能从数据中自动提取有价值信息的算法设计。
三要素:数据、模型、学习。模型(model)描述了从一个数据集生成另一个数据集的过程。从数据中学习而得到模型,学习的过程就是不断调整模型参数的过程。(笔者:好的模型能应用于新的数据,称为泛化。)
1.1 正名
算法(algorithm):一指模型预测(predictors);二值模型训练(training)。
看待数据(data)的三个视角:
- 数组(计算机科学视角)
- 向量(物理视角)
- 遵循加法和缩放(scaling)规则的对象(代数视角)
本节小结
- 把数据看成向量。
- 从统计或优化的视角选择合适的模型。
- 学习就是基于已有数据使用优化方法使得模型能应用于新的数据。
1.2 本书的两种阅读方式
- 自底向上。优点基础扎,步步为营;缺点,缺少应用路径,容易忘记不感兴趣的点。
- 自顶向下。优点:问题导向,目标驱动,所学既所用;缺点:基础不牢,部分概念不清。
本书组织方式: - 第一部分。按自底向上组织数学基础。包括:
- 线性代数(linear algebra)
- 解析几何(analytic geometry)
- 矩阵分解(matrix decomposition)
- 矢量验算(vector calculus)
- 统计理论(probability theory)
- 最优化(optimization)
- 第二部分。分为四大类问题:
- 回归(regression)
- 降维(dimensionality reduction)
- 密度估计(density estimation)
- 分类(classification)。
两个部分之间可以方便导航。