DataFrame
删掉有缺失值的数据
我们可以删掉有缺失值的数据,你可以选择删除行或者删除列
用的都是DataFrame.dropna(),当然Series也有dropna方法
cframe = frame[frame.a.notnull()]
去掉frame中key = 'a'标签中value为空的数据
使用pandas.read_table将表读到一个pandas DataFrame对象中
pandas.read_table('文件地址',sep='::',header=None,names=[key值/列名])
使用pands.merge函数将dataframe进行合并,自动根据列名进行区分
pd.merge(表1,表2)
使用pivot_table进行聚合操作
data.pivot_table('列rating',rows='列title',cols='列gender',aggfunc='mean')
合并数组dataframe pd.concat([],ignore_index = Ture),ignore_index = Ture新编行号 不保留read_csv的原始行号,concat默认是按行将多个dataframe组合到一起的
DataFrame.tail(n=5)返回最后n行
DataFrame.groupby([列名]) 对该列名进行聚合 DataFrameGroupBy
groupby 具体先看文档吧😓还不怎么懂
DataFrame.apply(函数名) 调用函数传参为DataFrame
读取文件
读取Excel文件需要安装 xlrd工具
pip install xlrd
读取文件pandas.read_excel