简介: 本文主要介绍在pandas中如何处理缺失数据。
主要方法有:
- isnull()
- notnull()
- dropna()
- fillna()
-
判断数据是否缺失
使用isnull()函数,返回bool类型数据
dataframe.isnull()
使用notnull()函数,同样返回bool类型数据
dataframe.notnull()
使用sum()函数,统计缺失数据
dataframe.isnull().sum()
-
过滤缺失数据
dataframe[dataframe.colname.isnull()]
dataframe[dataframe.colname.notnull()]
-
丢弃缺失数据
how按行row判断
dataframe.dropna(how='any')
dataframe.dropna(how='any', inplace=True)
dataframe.dropna(how='all')
dataframe.dropna(how='all', inplace=True)
对特定列操作
dataframe.dropna(subset=["col1", "col2"], how='any')
dataframe.dropna(subset=["col1", "col2"], how='all')
-
填充缺失数据
fillna()函数
附上小哥哥的视频链接Data analysis in Python with pandas
Youtube 🔗
哔哩哔哩 🔗
所有文章列表
pandas使用技巧总览