1 我的数据分析学习顺序
2 书籍介绍
2.1 基础
《Python编程:从入门到实践》易读,最常用的入门语法,比《Python编程快速上手》更适合。
《流畅的Python》想深入了解Python语法的必备书籍。
2.2 算法
《算法图解》、《Python程序员面试算法宝典》大部分算法数据是用C++或Java,喜欢用Python写数据结构与算法的可以阅读。
2.3 数据分析
主要学习Numpy、Pandas、Matplotlib。
《利用Python进行数据分析》大部分人使用老鼠书入门,但版本是Python2的。
《Python数据科学手册》前半部分是数据分析,虽然比较厚,但可以系统学习Numpy、Pandas。
《Python数据可视化编程实战(第2版)》Python可视化一直比较难轻易实现,书籍较少,需要多结合网络代码才能熟练。
2.4 机器学习
机器学习有监督学习如决策树、线性回归等,无监督学习聚类、主成分分析,主要是用Scikit-Learn实现。
《Python机器学习基础教程》Scikit-Learn轻松入门。
《机器学习实战:基于Scikit-Learn和TensorFlow》前半部分是Scikit-Learn,讲解深入,适合进阶,后半部分TensorFlow过于粗浅。
《集体智慧编程》学完Scikit-Learn,可以尝试从零开始写机器学习,适合想钻研算法的使用,比《机器学习实战》版本较新。
2.5 深度学习
主要学习各种神经网络算法,熟练使用Keras、TensorFlow。
《深度学习入门》从零开始写神经网络,代码比《Python神经网络编程》更详细。
《深度学习入门》Keras入门书籍。
《深度学习之TensorFlow》TensorFlow入门书籍。
《Python和NLTK自然语言处理》自然语言一直没有针对汉语的版本,只能尽量挑新版书籍。
2.6 网络爬虫
《Python 3网络爬虫开发实战》网络爬虫由于更新快,很少有深入学习的书籍,国内就属崔庆才版本比较全面,其他书籍都是强调某个功能,其他功能略过。
3 建议学习流程
3.1 第1年按顺序看这6本基础书籍,每本约2-3个月:
《Python编程:从入门到实践》
《Python数据科学手册》数据分析部分
《Python机器学习基础教程》
《深度学习入门》神经网络入门
《Python深度学习》Keras入门
《Python 3网络爬虫开发实战》
3.2 第2年看5本进阶书籍,顺序不限,每本2-3个月
《流畅的Python》
《Python数据可视化编程实战(第2版)》或其他可视化书籍
《集体智慧编程》从零开始写机器学习代码
《深度学习之TensorFlow》TensorFlow
《Python和NLTK自然语言处理》
4 后续补充一些看过但觉得没必要的书籍
PS:如果有其他好的数据分析书籍,大家也可以推荐