数学——你与机器学习之间的距离

机器学习里,数学为什么很重要?

做机器学习数学基础系列专栏和大家一起共同交流学习,是我们准备了很久的一个计划。因为在当下,机器学习、人工智能领域吸引了许多同学投身其中,其中包含了大量非科班出身或者从其他行业切换赛道转行而来的朋友们,大家在学习的过程中发现学习曲线陡峭、难度较大,普遍的心声就是:机器学习难,首要就是数学知识需要的太多了

的确如此,机器学习是一个综合性强、知识栈长的学科,需要大量的前序知识作为铺垫,最核心、最基础的就是他的绝大多数算法模型和实际应用都依赖于以概率统计线性代数微积分为代表的数学理论和思想方法。

比方说吧:

  • 面对一个统计样本,你想估计出你感兴趣的参数,极大似然估计以及有偏性无偏性你能不掌握?如果不巧碰上包含隐变量的场景,EM迭代的思想你可是躲都躲不开;

  • 想进行语音识别?隐马尔可夫模型你不可不会;想对一句话进行词性标注?条件随机场你敢不懂?

  • 在进行贝叶斯推断的时候,如果对马尔科夫链蒙特卡洛方法等近似推断一无所知,可能一个复杂的概率分布就让你举步维艰;

  • 对时间序列进行预测,或许卡尔曼滤波、粒子滤波对你来说是一个好的选择;

  • 进行样本分类、聚类这些常规操作时,逻辑回归、高斯判别、高斯混合等各种模型都应该如数家珍;

  • 对高维数据进行降维分析,提取和聚焦他的主成分,背后就是线性代数中空间的概念和矩阵分解的技巧;

  • 想将待处理的数据在不同维度的空间中进行变换处理,以寻找到最佳的观测角度,使得数据处理达到最好的效果,矩阵的相似变换是不是得好好理解?

  • 想在不太影响观察效果的前提下,利用很小的存储空间就能近似的达到原有图像的视觉效果,利用矩阵进行图像的数字表示和变换处理是基础之中的基础;

  • 想理解神经网络的训练过程,想获取复杂函数的最值,离不开梯度的概念以及多元微分和优化方法;

因此,可以看出,数学基础是机器学习绕不开的一块阵地

机器学习里,这几门数学课各自扮演的角色?

围绕概率统计线性代数微积分这三大核心内容,
在进入到专栏大纲之前,我们首先来看看这四门专栏在机器学习中各自都扮演了什么样的角色,细致的梳理一下学科的内在逻辑。

第一:概率统计是利用数据发现规律、推测未知的思想方法

其实这和机器学习的目标是高度一致的。机器学习中的思想方法和核心算法大多是构筑在统计思维方法之上的。核心的概率思想和基础概念将围绕着条件概率、随机变量、随机过程、统计推断、概率图等内容展开,体现了概率统计在机器学习中的灵魂作用。

第二:线性代数是利用空间投射和表征数据的基本工具

还有 78% 的精彩内容
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
支付 ¥2.99 继续阅读