Python是一种面向对象、直译式计算机程序设计语言,由Guido van Rossum于1989年底发明。由于他简单、易学、免费开源、可移植性、可扩展性等特点,Python又被称之为胶水语言。小编查看了近年来主要程序语言的流行趋势,Python受欢迎程度扶摇直上。
由于Python拥有非常丰富的库,使其在数据分析领域也有广泛的应用。由于Python本身有十分广泛的应用,本期Python数据分析路线图主要从数据分析从业人员的角度讲述Python数据分析路线图。整个路线图计划分成16周,120天左右。主要学习内容包括四大部分:
1、Python工作环境及基础语法知识了解(包括正则表达式相关知识学习);
2、数据采集相关知识(python爬虫相关知识);
3、数据分析学习;
4、数据可视化学习。
1、Python工作环境及基础语法知识了解
对于Python基础语法学习部分,学习周期大概为4周,需要相关免费资源可以找小编,而且质量都还不错。相关中文资源如下:
(1)python工作集成环境包(Python(x,y)/Pycharm)
(2)python数据分析相关库(Pandas/ Numpy/Scipy/ Matplotlib)
如果安装了上面集成工作包,则下面的包不需要重新安装了。关于包的安装方法在学习资源图书中都有介绍,通常安装库采用pip方法,也可以用pip list查询系统安装了哪些库。
(3)学习资源
【图书】:Python基础教程(第2版)(电子版图书自行百度)
深入浅出Head First python(中文版)(电子版图书自行百度)
【在线教程】
【视频教程】:python基础、python进阶、Web前端补充大纲等等
2、数据采集学习
对于数据采集部分的学习主要是通过python爬虫的学习了解基本的外部数据采集情况,当然也可以借助别人写好的规则库直接完成某些数据的采集。这部分内容的学习周期大概也为四周,需要相关免费资源可以找小编,而且质量都还不错。相关中文资源如下:
【爬虫学习在线教程】:
(1)Python爬虫入门一之综述
(2)Python爬虫入门二之爬虫基础了解
(3)Python爬虫入门三之Urllib库的基本使用
(4)Python爬虫入门四之Urllib库的高级用法
(5)Python爬虫入门五之URLError异常处理
(6)Python爬虫入门六之Cookie的使用
(7)Python爬虫入门七之正则表达式
(8)Python爬虫实战一之爬取糗事百科段子
(9)Python爬虫实战二之爬取百度贴吧帖子
(10)Python爬虫实战三之计算大学本学期绩点
(11)Python爬虫实战四之抓取淘宝MM照片
(12)Python爬虫进阶一之爬虫框架Scrapy安装配置
【在线教程】
【视频教程】:Python简单爬虫开发、爬虫基础反爬、爬虫高级框架
3、数据分析
Python数据分析的学习主要是对相关库的使用,比如数据整理需要用到numpy和pandas库,数据描述与分析分析则主要用到pandas库,从某种程度上讲,利用python进行数据分析的学习过程就是对库的学习过程。由于有了前面2部分内容的学习基础,本部分内容的建议学习练习时间也为4周,相关免费学习资源如下:
【图书】:利用python进行数据分析
【视频】:用python玩转数据
4、数据可视化
Python数据可视化学习的过程就是学习matplotlib库的过程,matplotlib库包含有丰富的数据可视化资源,地图、3D等等都有涉及,如果有前面3部分的学习经验的话,这部分内容在4周内也能解决。相关中文学习资源如下:
【图书】:Python数据可视化编程实战
【在线教程】:
(1)利用Python绘图和可视化(1)
(2)利用Python绘图和可视化(2)
注意啦:朋友需要Django、Web项目、Tornado、AI、多线程相关资料跟视频的可私聊小编哟~