本篇笔记为原书第十章节的内容。
- Merging, joining, and concatenating
DataFrame数据concatenate
主要是针对DataFrame数据进行行列的拼接构成新的数据集
-
pd.concat(objs=[df1, df2], axis=0, keys=['df1-group', 'df2-group'], ignore_index=True)
说明:
-- objs参数为要拼接的df数据
-- axis参数指定行(0)或列(1)进行拼接
-- keys参数对应前面objs里的df数据的组别index
-- ignore_index参数忽略原来各df的index,重新生成新的index
Join操作
-
左连接 df.merge(df1, how='left', on='join_id')
-
内连接 df.merge(df1, how='inner', on='join_id')
-
外连接(全连接) df.merge(df1, how='outer', left_on='left_df_id', right_on='right_df1_id')