Python数据分析学习路线

#Python数据分析学习路线

一、数据获取

1、从公开数据源

UCI:加州大学欧文分校开放的经典数据集,真的很经典,被很多机器学习实验室采用。

http://archive.ics.uci.edu/ml/datasets.html

国家数据:数据来源于中国国家统计局,包含了我国经济民生等多个方面的数据。

http://data.stats.gov.cn/index.htm

CEIC:超过128个国家的经济数据,能够精确查找GDP、CPI、进出口以及国际利率等深度数据。

https://www.ceicdata.com/zh-hans

中国统计信息网:国家统计局的官方网站,汇集了海量的全国各级政府各年度的国民经济和社会发展统计信息。

http://www.tjcn.org/

政务数据网站:现在各个省都在很大程度上地开放政务数据,比如北京、上海、广东、贵州等等,都有专门的数据开放网站,搜索比如“北京政务数据开放”。

2、网络爬虫

通过爬虫获取数据

3、其他数据获取方式

如果你暂时不会爬虫,但又有采集数据的需求,可以尝试各种采集软件,不需要编程知识也可以轻松爬取信息,比如火车头、八爪鱼等。很多数据竞赛网站也会公开不错的数据集,比如国外的Kaggle,国内的DataCastle、天池。这些数据都是真实的业务数据,且规模通常不小,可以经常去搜集和整理。

推荐数据汇总资源:

数据获取方式汇总  https://dwz.cn/Q44MsDkH

二、数据存储与提取(以MySQL为例)

1、【数据库】数据库连接、创建、删除、查看、选择

https://www.runoob.com/python/python-mysql.html

2、【数据增删改】创建表、删除表、修改表、插入行、删除行、更新行

https://blog.csdn.net/qq_36761831/article/details/83245727

3、【数据查询】之基础查询

https://www.cnblogs.com/wangwei13631476567/p/8999429.html

4、【数据查询】之子查询

https://blog.csdn.net/weixin_44699728/article/details/90320104

5、【排序与索引】之排序语句

https://www.runoob.com/mysql/mysql-order-by.html

6、【排序与索引】之索引:创建索引、添加索引、建表时指定索引、删除索引

https://www.runoob.com/mysql/mysql-index.html

三、数据清洗与预分析(以Pandas框架为例)

1、【生成数据表】之数据读取

https://blog.csdn.net/weixin_42223833/article/details/92841384

2、【生成数据表】之创建数据表

https://blog.csdn.net/mengenqing/article/details/80548208

3、【数据查看】之基本信息

https://blog.csdn.net/qq1195365047/article/details/88561518

4、【数据查看】之查看空值和唯一值

https://blog.csdn.net/starter_____/article/details/79184196

5、【数据查看】之查看前/后 10行

http://sofasofa.io/forum_main_post.php?postid=1004019

6、【数据清洗】之缺失值处理

https://blog.csdn.net/lwgkzl/article/details/80948548

7、【数据清洗】之字符处理

https://www.cnblogs.com/gloria-zhang/p/10696307.html

8、【数据清洗】之重复值处理

https://www.cnblogs.com/hankleo/p/11462532.html

9、【数据预处理】之数据表合并

https://blog.csdn.net/qq_42413820/article/details/80780886

10、【数据预处理】之排序

https://blog.csdn.net/sinat_29957455/article/details/78993732

11、【数据提取】之loc和iloc

https://blog.csdn.net/jiangjiang_jian/article/details/81038638

12、【数据提取】之ix

https://blog.csdn.net/anshuai_aw1/article/details/82801435

13、【数据统计】之采样

https://blog.csdn.net/u013069552/article/details/88935644

14、【数据统计】之汇总

https://www.cnblogs.com/zhanghongfeng/p/8438891.html

四、Numpy框架

1、【数组】之创建数组

https://blog.csdn.net/qq_28893679/article/details/80969005

2、【数组】之切片和索引

https://www.cnblogs.com/sunshinewang/p/6882031.html

3、【数组】之数组操作

https://blog.csdn.net/somilong/article/details/79065847

4、【函数】之字符串函数

https://blog.csdn.net/phinoo/article/details/89678395

5、【函数】之数学函数

https://blog.csdn.net/mooneve/article/details/80156316

6、【函数】之统计函数

https://blog.csdn.net/weixin_44056331/article/details/89949742

五、数据分析统计

【描述性分析】之统计学基础:均值,中位数、众数、百分位数、极值

【描述性分析】之统计学基础:偏度、方差、标准差、显著性

【描述性分析】之统计学基础:总体和样本,参数和统计量,ErrorBar

【描述性分析】之统计学基础:概率分布和假设检验,各种分布,假设检验流程

【描述性分析】之统计学基础:条件概率,贝叶斯

【探索性分析及可视化】之直方图

【探索性分析及可视化】之条形图

【探索性分析及可视化】之计数图

【探索性分析及可视化】之散点图

【探索性分析及可视化】之箱线图

【探索性分析及可视化】之回归图

【探索性分析及可视化】之热力图

【预测性分析】之基本算法模型《回归》:一元线性回归

【预测性分析】之基本算法模型《回归》:多重线性回归

【预测性分析】之基本算法模型《回归》:逻辑回归

【预测性分析】之基本算法模型《分类》:决策树

【预测性分析】之基本算法模型《分类》:朴素贝叶斯

【预测性分析】之基本算法模型《分类》:KNN

【预测性分析】之基本算法模型《聚类》:Kmeans

【预测性分析】之基本算法模型《聚类》:密度聚类

推荐看,可汗学院的公开课-统计学:

http://open.163.com/movie/2011/6/6/0/M82IC6GQU_M83J9IK60.html

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,948评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,371评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,490评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,521评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,627评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,842评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,997评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,741评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,203评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,534评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,673评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,339评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,955评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,770评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,000评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,394评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,562评论 2 349

推荐阅读更多精彩内容