pandas 高级用法

处理缺失值


数据离散化

  1. 分组
    • 自动分组 new_sr = pd.qcut(sr, bins=3)
    • 自定义分组 new_sr = pd.cut(sr, bins=[0, 165, 185, 300])
  2. one-hot编码
    df = pd.get_dummies(new_sr , prefix=)

合并

  • 方向合并
    pd.concat([df1, df2], axis=0)

    axis=0竖直合并
    axis=1 水平合并

  • 索引合并
    pd.merge()
    • 内连接


      pd.merge(left, right, how='inner', on=['key1', 'key2'])
    • 左连接


      pd.merge(left, right, how='left', on=['key1', 'key2'])
  • 右连接


    pd.merge(left, right, how='right', on=['key1', 'key2'])
  • 外连接


    pd.merge(left, right, how='outer', on=['key1', 'key2'])

交叉表与透视表

分组与聚合

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容