学习的第一步是先规划好学习路径,想成为一个数据分析师,需要完成以下课程
1)Python工作环境及基础语法知识了解(包括正则表达式相关知识学习);
2)数据采集相关知识(python爬虫相关知识);
3)数据分析学习;
4)数据可视化学习。
全部掌握以上课程大概需要120天左右
Python工作环境及基础语法知识了解
对于Python基础语法学习部分,学习周期大概为4周,需要的相关资源在网络上都能找到免费的资源,而且质量都不错。相关中文资源如下:
1.python工作集成环境包
Python(x,y):下载地址
Pycharm:下载地址
2.python数据分析相关库(Pandas/ Numpy/
Scipy/ Matplotlib)
如果安装了上面集成工作包,则下面的包不需要重新安装了。关于包的安装方法在学习资源图书中都有介绍,通常安装库采用pip方法,也可以用pip list查询系统安装了哪些库。
3.学习资源
图书:1)Python基础教程(第2版)[电子版图书自行百度]
2)深入浅出Head First python(中文版)[电子版图书自行百度]
在线教程:1)廖雪峰的python教程
2)正则式学习
视频教程:1)慕课网python入门
3)正则式学习视频
数据采集学习
对于数据采集部分的学习主要是通过python爬虫的学习了解基本的外部数据采集情况,当然也可以借助别人写好的规则库直接完成某些数据的采集。这部分内容的学习周期大概也为四周,需要的相关资源在网络上都能找到免费的资源,而且质量都不错。相关中文资源如下:
爬虫学习在线教程:
视频教程:Python简单爬虫开发
数据分析
Python数据分析的学习主要是对相关库的使用,比如数据整理需要用到numpy和pandas库,数据描述与分析分析则主要用到pandas库,从某种程度上讲,利用python进行数据分析的学习过程就是对库的学习过程。由于有了前面2部分内容的学习基础,本部分内容的建议学习练习时间也为4周,相关免费学习资源如下:
图书:利用python进行数据分析[电子版图书自行百度]
视频:用python玩转数据[视频为cousera认证课程,全程中文]
数据可视化
Python数据可视化学习的过程就是学习matplotlib库的过程,matplotlib库包含有丰富的数据可视化资源,地图、3D等等都有涉及,如果有前面3部分的学习经验的话,这部分内容在4周内也能解决。相关中文学习资源如下:
图书:Python数据可视化编程实战[电子版图书自行百度]
在线教程:
作者:程序猿联盟
链接:http://www.jianshu.com/p/14017390e05b
來源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。