一、图书介绍
图书作者:Wes Mckinney
本书数据文件GitHub仓库地址:https://github.com/wesm/pydata-book
本书内容:本书关注的是利用Python处理、清洗和操作数据的基本要点。专注于Python语言的编程、类库、工具而不是数据分析方法论。
二、重要的Python库
Numpy(http://numpy.org):数值计算
pandas(http://pandas.pydata.org) : 数据操作、预处理、清洗
matplotlib(http://matplotlib.org) : 制图、数据可视化
Scipy(http://scipy.org):科学计算
scikit-learn(http://scikit-learn.org): 机器学习
statsmodels(http://statsmodels.org): 统计分析
三、常用模块命名约定
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
import statsmodels as sm