机器学习—数学知识点清单

深度学习数学知识点清单

根据原文:机器学习数学篇—基础数学知识清单 进行修改和补充


说明:字体加粗表示该知识点很重要,需要重点掌握

一. 线性代数

  • 向量

  • 矩阵

  • 集合

  • 标量

  • 张量

  • 范数

  • 内积

  • 向量正交

  • 正交基

  • 特征值分解

  • 奇异值分解

  • 矩阵分解

  • 总结:前面的都是基础概念性的内容,后面的三个分解很重要,奇异值分解也属于矩阵分解里的一种,在很多应用中其实都会用到,譬如推荐系统,主题模型等。在一些其他的算法思想里其实也有用到,我们求特征向量的时候,其实也是在做特征值分解,主成分分析/因子分析 其实都用到了矩阵分解。尤其是当数据量比较小的时候,可以先不上深度学习,先用简单又基础的方法试一下,看看效果怎么样,作为baseline,加大数据集后,再采取更深层次的算法来做。

二. 概率论

  • 条件概率

  • 联合概率

  • 全概率公式

  • 逆概率

  • 贝叶斯公式

  • 贝叶斯定理

  • 先验概率

  • 后验概率

  • 似然概率

  • 最大似然估计法

  • 最大后验概率法

  • 离散型随机变量

  • 连续型随机变量

  • 概率质量函数

  • 概率密度函数

  • 两点分布

  • 二项分布

  • 泊松分布

  • 均匀分布

  • 指数分布

  • 正态分布

  • 数字特征

  • 数学期望

  • 方差

  • 协方差

  • 总结:概率论的内容也非常重要,掌握好了才能理解我们在机器学习/深度学习里经常出现的一些概念。它包含在我们算法的很多方面,譬如,数据是否符合正态分布/泊松分布,什么情况下可以用最大似然估计法等等,贝叶斯的定理除了运用在贝叶斯算法中,还有没有其他的算法有运用到这个思想的,条件概率个联合概率等,在后续的信息论出现的作用是什么?都需要我们队每个知识点好好掌握。重点掌握我加粗的知识点。

三. 数理统计

  • 样本

  • 总体

  • 统计量

  • 参数估计

  • 假设检验

  • 置信区间

  • 区间估计

  • 泛化能力

  • 泛化误差

  • 欠拟合

  • 过拟合

  • 噪声

  • 偏差

  • 总结:同样,前面是基础知识,后面的几点更为关键。泛化能力和泛化误差是我们衡量这个模型跑完了能否拿到实际场景中去应用的一个重要指标;欠拟合 or 过拟合 也是我们在模型训练的过程中需要注意和解决的两点;偏差方差等也属于评价指标,我们需要达到一个trade-off,所以如何平衡也是需要关注的。其实也可以这样看,如果数据中出现了噪音,迭代次数过少(或者一些其他原因),导致模型欠拟合,那么它的偏差大,方差小,如果过拟合,则偏差小,方差大,不管哪种情况,这个模型的泛化能力都不行,没法拿到真实场景中去用,所以我们需要对其进行调整,这个时候我们就会关注到数据本身和模型调参上。数据本身如果有噪音和异常点应该如何找到并去除,模型跳槽应该如何避免欠拟合和过拟合,都是我们在掌握这些知识点时需要重点关注的点。

四. 优化相关

  • 目标函数

  • 全局最小值

  • 局部极小值

  • 无约束优化

  • 约束优化

  • 拉格朗日函数

  • KKT条件与对偶函数

  • 梯度下降法

  • 一阶导数

  • 二阶导数

  • 牛顿法

  • 泰勒展开

  • 线性搜索方法

  • 置信域方法

  • 启发式算法

  • 总结:优化部分的内容也是非常重要的一环。当我们设定了目标函数后,就会采取各种优化算法来去优化目标函数的值,使目标函数的值最小(/最大,一般是最小,根据具体情况而定),如何使目标函数的值下降的最快,这时我们就引出了梯度下降,因为沿着负梯度下降的方向是函数值减小的最快方向,由此我们可以引出多种梯度下降的方法,包括批梯度,随机梯度,mini-batch等等。当然,这是针对一阶函数优化来说的,如果是二阶函数,我们就会考虑到用牛顿法,什么时候会出现二阶函数呢?在xgboost里针对目标函数的优化我们就会涉及到二阶函数的优化。而在这些优化函数的计算中,都会涉及到泰勒展开,在SVM里又会因为要求支持向量所以会引出拉格朗日乘子法和KKT条件,从一点去发散,我们可以发现很多知识点。所以在针对具体的算法学习过程中再去掌握这些数学知识点,高效而且有用。在深度学习中涉及到的优化算法相对就少一些,没有机器学习里的那么多,但是这些基础性的东西还是需要掌握的。

五.信息论

  • 信息熵

  • 互信息

  • 信息增益

  • KL 散度

  • 最大熵原理

  • 交叉熵和相对熵的对比

  • 各种熵之间的关系

  • 总结:信息论这一章非常重要,基本上每个知识点都是重点,因为很多情况下我们都会使用交叉熵作为损失函数,所以得弄明白它的原理和为什么我们经常使用它做损失函数的原因。对于一些特殊的情况,可以做出哪些变型,也是在掌握了这些基础上才会做的,所以大家要好好掌握。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,377评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,390评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,967评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,344评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,441评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,492评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,497评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,274评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,732评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,008评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,184评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,837评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,520评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,156评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,407评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,056评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,074评论 2 352

推荐阅读更多精彩内容

  • 第二个Topic讲深度学习,承接前面的《浅谈机器学习基础》。 深度学习简介 前面也提到过,机器学习的本质就是寻找最...
    我偏笑_NSNirvana阅读 15,597评论 7 49
  • 机器学习是做NLP和计算机视觉这类应用算法的基础,虽然现在深度学习模型大行其道,但是懂一些传统算法的原理和它们之间...
    在河之简阅读 20,497评论 4 65
  • 文章主要分为:一、深度学习概念;二、国内外研究现状;三、深度学习模型结构;四、深度学习训练算法;五、深度学习的优点...
    艾剪疏阅读 21,820评论 0 58
  • 轮播图是一种如此美丽的存 ——来自一只小白的一次记录··· 有人说,知道的越多,生活也就越没意思?就像你...
    yamei_wu阅读 306评论 0 0
  • 一切好像都如约而至,一切都好像从未开始。回忆起这段时光,我当时……很困惑也很迷茫,很快乐也很无奈,很清楚确却不知所...
    顾木阅读 275评论 1 1