前言
我不知道大家要花多长时间学习机器学习?前文我们已经介绍的Python爬虫和数据分析的知识,如果只是做入门,平均每门一个月,问题也是不大的;但大部分觉得机器学习很难学,需要很好的数学基础,现在毕业那么久,看到数学公式就晕,机器学习可能从入门直接到放弃,花很长时间都学不会。
大家可能会去百度或者Google搜索,如何学习机器学习。大部分的推荐都是这些:
- 视频:吴恩达大佬,台大李宏毅的视频
- 书:西瓜书和统计学习方法
这些都是大佬们的精髓,内容质量都是很高的。但是这些真的适合所有新手么?不见得,这些书中大量的推导公式,其实对于意志不坚定者,是很难啃下去的。
个人学习路径
基于此,分享下个人的学习Python机器学习的经验给大家。大家应该都知道二八法则,二八法则起初的研究是在经济学当中的。现在也用于教育行业,说的就是,学习一个行业最重要的20%知识点,可以解决80%的行业问题。
对于我这个学林学的扫地僧而已,Python机器学习最主要的是用于写论文。我就会问自己,是不是要把整个机器学习算法都推导一遍?其实不需要,我只需要了解算法,并会应用到我的林业数据上即可。
那对于以后想从事机器学习方面的人来说,其实这种方法也是实用的。如果一开始就来啃西瓜书,很有可能打击自己的积极性,没有学习动力。那我们先简单的入门后,在回来系统学习这些知识点,看这些大佬的书,就会有事半功倍的效果。
那怎么简单入门机器学习了?前面我已经大概提到了,就是简单了解算法+应用算法。那具体该怎么做了,这是我之前的学习方法和路径,仅仅供大家参考。
- 《机器学习实战》,这本书是纯Python(但是是python2)代码实现机器学习的书籍,对于算法的介绍,很简单明了,公式不多。如果自己的代码能力有限的话,可以先大概了解其算法原理和编程步骤,自己能写伪代码即可。
- 博客,虽然《机器学习实战》在介绍算法原理的时候,简单明了,但有时候太过简单,不是特别的清楚。这时,可以百度看一些博客,有些博客还是写的很不错的。
- sklearn实践,了解算法原理后,就可以用我们Python的第三方库sklearn来实践啦。推荐的书为《Python机器学习基础教程》,其实随便找本sklearn实践的书都可以,英语好的直接看sklearn官方文档。
最后,这是我2018年文章合集(https://mp.weixin.qq.com/s/frJa361AW9-NqvyDdtGPDg),大部分是机器学习方法的文章,也是按这个流程走的,供大家学习和参考。
今日互动
留言打卡:说说你们平时是怎么学习的吧。公众号后台回复【打卡】,加入打卡学习群,2019年一起搞事情。