1. 数据读取与写入
pd.read_csv():读取 CSV 文件为 DataFrame。
pd.read_excel():读取 Excel 文件。
DataFrame.to_csv():将 DataFrame 保存为 CSV 文件。
DataFrame.to_excel():将 DataFrame 保存为 Excel 文件。
2. 数据查看与基本操作
DataFrame.head(n):查看前 n 行数据。
DataFrame.tail(n):查看后 n 行数据。
DataFrame.info():显示数据的基本信息(行数、列数、数据类型等)。
DataFrame.describe():显示数值型数据的统计摘要。
DataFrame.shape:返回数据的行数和列数。
3. 数据选择与切片
DataFrame['列名']:选择某一列。
DataFrame.loc[行标签, 列标签]:按标签选择数据。
DataFrame.iloc[行号, 列号]:按位置选择数据。
DataFrame[条件]:按条件筛选数据。
4. 数据清洗
DataFrame.isnull():判断缺失值。
DataFrame.dropna():删除缺失值。
DataFrame.fillna(值):填充缺失值。
DataFrame.duplicated():判断重复行。
DataFrame.drop_duplicates():删除重复行。
DataFrame.astype(类型):转换数据类型。
5. 数据处理与变换
DataFrame.apply(函数):对每一行或列应用函数。
DataFrame.map(函数):对 Series 应用函数。
DataFrame.replace(旧值, 新值):替换数据。
DataFrame.sort_values(by='列名'):按某列排序。
DataFrame.groupby('列名'):分组聚合。
6. 统计分析
DataFrame.mean():求均值。
DataFrame.sum():求和。
DataFrame.count():计数。
DataFrame.max() / min():最大/最小值。
DataFrame.value_counts():统计唯一值的个数。
7. 其他常用方法
DataFrame.merge():合并数据表(类似 SQL 的 join)。
DataFrame.concat():拼接数据表。
DataFrame.pivot_table():生成数据透视表。