登录注册写文章

1 Introduction and Motivation

1 Introduction and Motivation

1 什么是机器学习

机器学习：能从数据中自动提取有价值信息的算法设计。
三要素：数据、模型、学习。模型（model）描述了从一个数据集生成另一个数据集的过程。从数据中学习而得到模型，学习的过程就是不断调整模型参数的过程。（笔者：好的模型能应用于新的数据，称为泛化。）

1.1 正名

算法（algorithm）：一指模型预测（predictors）；二值模型训练（training）。
看待数据（data）的三个视角：

数组（计算机科学视角）
向量（物理视角）
遵循加法和缩放（scaling）规则的对象（代数视角）

本节小结

把数据看成向量。
从统计或优化的视角选择合适的模型。
学习就是基于已有数据使用优化方法使得模型能应用于新的数据。

1.2 本书的两种阅读方式

自底向上。优点基础扎，步步为营；缺点，缺少应用路径，容易忘记不感兴趣的点。
自顶向下。优点：问题导向，目标驱动，所学既所用；缺点：基础不牢，部分概念不清。
本书组织方式：
第一部分。按自底向上组织数学基础。包括：

线性代数（linear algebra）
解析几何（analytic geometry）
矩阵分解（matrix decomposition）
矢量验算（vector calculus）
统计理论（probability theory）
最优化（optimization）

第二部分。分为四大类问题：

回归（regression）
降维（dimensionality reduction）
密度估计（density estimation）
分类（classification）。

两个部分之间可以方便导航。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

2019-11-28 173
16宿命：用概率思维提高你的胜算以前的我是风险厌恶者，不喜欢去冒险，但是人生放弃了冒险，也就放弃了无数的可能。 ...
yichen大刀阅读 11,301评论 0赞 4
2019-11-28三数灯谜分析
公元：2019年11月28日19时42分农历：二零一九年十一月初三日戌时干支：己亥乙亥己巳甲戌当月节气：立冬...
石放阅读 11,818评论 0赞 2

断舍离第四天2019.11.28
今天上午陪老妈看病，下午健身房跑步，晚上想想今天还没有断舍离，马上做，衣架和旁边的的布衣架，一看乱乱，又想想自己是...
影子3623253阅读 7,978评论 3赞 8

友情链接更多精彩内容

赞1赞

赞赏

手机看全文