在人工智能领域内,我们往往重视项目和实战,大多数初级入行者总是享受完成一个项目带来的成就感和快感,简历上写的满当当的项目经历。
但一旦在工作中遭遇复杂问题,就发现自己处处有短板,同样的问题,别人花费一周就能达到90%的精准度,自己用一个模型跑了快1个月,才70%,问题在哪?
重点就是——
在于理论扎实与否。一个看似简单的线性回归模型,就有34种不同的解法,而你却只会一种。高低效率的工作,其差别并不在于实战经验的多少,而在于在动手前,知道选择什么样的模型是最优解仅仅只会调参未来你的竟争力将会越来越低,或许理论者上手没有有经验的那么快,但一旦熟悉,他的成长空间是巨大的,这也是为什么很多大厂考察面试员工,更多的是对算法细节的理解程度,而不仅仅是项目经验。
20%的理论基础往往决定了你80%的上升高度。
而想要深层次掌握这些理论,在工作和研究中得心应手,你就必须依赖于学习和拿握大量的经典教材。
根本的理论基础可以为我们选择模型和调参提供有效的指导方向,从而提高工作效率。
当你不仅知道知识怎么用,还知道为什么这么用时,再去实践,能收获比他人成倍的成果。
——然而人工智能方向的书籍这么多,复杂程度各不相同,那如何学习呢?
——我们可以分成“五大步骤”
步骤一 初始体系
首先在我们决定看教材之前,需要有一个笼统的认知根据自己已经了解的机器学习、深度学习的核心模型建立一个初始的框架。
而人工智能必须体系化地进行学习,数学基础是你要打好的基石,机器学习和深度学习很多算法是并行的关系,但推荐从机器学习开始入门。你需要掌握以下知识点:
“数学基础-机器学习-深度学习”
(1)数学基础:线性代数——微积分——最优化理论——概率论
(2)机器学习:机器学习导论、 评估模型 、线性模型 、决策树模型 、集成学习、支持向量机 贝叶斯模型
(3)深度学习:神经网络基础、卷积神经网络及其应用、 循环神经网络及其应用 、提升神经网络的高效性
步骤二 遴选核心
建立初始体系后,对各个教材中的每一个知识点进行内容确认,看不同教材对同一知识点是如何阐述的。(常用教材我在末尾做了分类)
可能大家会觉得线性模型很简单,那我们就拿最简单线性模型举例,让你加深对线性模型的认知,感受到不样的线性模型。首先根据教材,确定哪几本讲到了线性模型由于篇幅限制,那这里只把西瓜书、统计学习方法、PRML、ESL这四本的内容列在这里。
1、西瓜书:
(1)介绍了线性模型的「基本形式」,线性回1归、线性分类都是基于这个基本的线性模型形式而来的。
(2)在「基本形式」的基础上讲解了如何构建「一元线性回归」问题的目标函数,一元结束后开始介绍多元的情况。
(3)开始讲解「线性分类」模型,介绍了种不同于解析解的数值解方法。
(4)介绍了线性模型的LDA的形式以及如何处理类别不平衡的问题。
2、统计学:
(1) 第二章主要是对「感知机」这种线性分1类模型的研究:2.2.2部分讲解模型的求解策略,即 如何构建目标函数。
(2) 介绍了原始形式下的随机梯度下降法2(算法21),并且给出了算法收敛性的证明
(3)第六章涉及逻辑回归问题,介绍了logistics distributionl的基本概念、如何
用「极大似然」方法构建目标函数以及如何求参(6.13)
(4)6.2节介绍了 logistic regression形式的一些由来,即关于最大熵问题的讨论。
6.3节则主要是介绍数值解的方法。
3、PRML
(1)在1.5节中主要是介绍了构建目标函数的思想以及解决分类问题的三种方式。
(2)第三章主要讲线性回归模型:一开始就引入了「基函数」的概念,在基函数的概念下来构建模型。
(3)32讲了频率学派的关于模型复杂度的观点,即var- bias trade off. 3.3、3.4、3.5主要讲解贝叶斯下的线性回归。
(4)第四章节是线性分类模型.二分类问题与多分类问题下的模型设置以及最小平方方法为什么不适用于二分类问题。
4、ESL
ESL中讲解的东西很多:其中比较有代表性的是它突出了u1范数的正则化方法,也就是所谓的lasso回归(L2正则化的叫岭回归)。
3、梳理逻辑
这样看来,仅线性模型我们就能找到如此多的理论依据,如果靠我们自己无法找全。
大量信息+不加梳理=自相矛盾
所以只对上面的知识进行归类是不够的,我们还需要进行合理的梳理,对照不同书籍,把同样内容的不同解释角度从逻辑上打通,融会贯通后才能真正把知识变成自己的。
还是以线性模型为例,我们应该将零碎的知识点进行梳理,最后整合归纳到一起。
通过思维导图,你会发现这些原来复杂凌乱的知识变成了自己的体系,而自己理出来的体系,印象也会更加深刻。当然不同人理出来的可能会不一样。这个不重要,关键是自己去理!
4、划分难度
从难到易的学习顺序才是正确的姿势,所以通过上述的梳理之后进行一个汇总整合、划分出难度等级,使得学习路径更加清晰。
5、查漏补缺
前面构建的知识体系是骨架,接下来需要丰富骨架上的血肉,让它更加完善。
很多不以为然的细节,可能正是解决问题的关键。所以对其他教材中讲解到的,又是自己体系里面没有涉及的内容,应及时补充到自己体系中。
只有反复实践这五个步骤,我们才能打下扎实的理论基础。
——————————————————————————————————
关于教材,我们做了以下分类:
初级阶段
1、《线性代数》同济大学
2.《高等数学》同济大学
3.《概率论与数理统计》浙江大学
4.《最优化方法》清华大学(何坚勇)
5.《机器学习》西瓜书(周志华)
6.深度学习的数学
中级阶段:
1.《统计学习方法》(李航)
2.《深度学习》花书
3.Introduction to Machine Learning
4.An Introduction to Optimization
5.Convex Optimization
6.Reinforcement Learning:An Introduction
7.神经网络设计
8.基于深度学习的自然语言处理
9.统计学核心方法及其应用
10.统计强化学习:现代机器学习方法
高级阶段:
1.Pattern Recognition and Machine Learning
2.The Elements of Statistical Learning
3.Machine Learning:A Probabilistic Perspective
4、.Neural Networks and Learning Machines
5、.统计学习理论的本质
6、.Foundations of Machine Learning
7.机器学习基础
以上教材内容我们都帮你整理好了,
关注我们的公众号『深度之眼』回复“教材班”即可获取~