1 Introduction and Motivation

1 什么是机器学习

机器学习:能从数据中自动提取有价值信息的算法设计。
三要素:数据、模型、学习。模型(model)描述了从一个数据集生成另一个数据集的过程。从数据中学习而得到模型,学习的过程就是不断调整模型参数的过程。(笔者:好的模型能应用于新的数据,称为泛化。)

1.1 正名

算法(algorithm):一指模型预测(predictors);二值模型训练(training)。
看待数据(data)的三个视角:

  1. 数组(计算机科学视角)
  2. 向量(物理视角)
  3. 遵循加法和缩放(scaling)规则的对象(代数视角)

本节小结

  1. 把数据看成向量。
  2. 从统计或优化的视角选择合适的模型。
  3. 学习就是基于已有数据使用优化方法使得模型能应用于新的数据。

1.2 本书的两种阅读方式

  1. 自底向上。优点基础扎,步步为营;缺点,缺少应用路径,容易忘记不感兴趣的点。
  2. 自顶向下。优点:问题导向,目标驱动,所学既所用;缺点:基础不牢,部分概念不清。
    本书组织方式:
  3. 第一部分。按自底向上组织数学基础。包括:
  • 线性代数(linear algebra)
  • 解析几何(analytic geometry)
  • 矩阵分解(matrix decomposition)
  • 矢量验算(vector calculus)
  • 统计理论(probability theory)
  • 最优化(optimization)
  1. 第二部分。分为四大类问题:
  • 回归(regression)
  • 降维(dimensionality reduction)
  • 密度估计(density estimation)
  • 分类(classification)。

两个部分之间可以方便导航。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 16宿命:用概率思维提高你的胜算 以前的我是风险厌恶者,不喜欢去冒险,但是人生放弃了冒险,也就放弃了无数的可能。 ...
    yichen大刀阅读 6,109评论 0 4
  • 公元:2019年11月28日19时42分农历:二零一九年 十一月 初三日 戌时干支:己亥乙亥己巳甲戌当月节气:立冬...
    石放阅读 6,917评论 0 2
  • 今天上午陪老妈看病,下午健身房跑步,晚上想想今天还没有断舍离,马上做,衣架和旁边的的布衣架,一看乱乱,又想想自己是...
    影子3623253阅读 2,935评论 3 8