在本章中,我们进行了缺失值的观察与处理、重复值的观察与处理以及特征的观察与处理等等任务。
这其中我将浅谈自己对于缺失值处理的一点感想。在pandas中,None能够直接被导入数据库作为空值处理, 包含NaN的数据导入时会报错,另外numpy和pandas的很多函数能处理NaN,但是如果遇到None就会报错。np.isnan()和pd.isnull()都可以对不论是DataFrame、Python list还是仅仅一个数值进行空值检测。但一般在实际应用中,np.isnan()多用于单个值的检验,pd.isnull()用于对一个DataFrame或Series(整体)的检验。
Datawhale七月组队——动手学数据分析 Task02 数据清洗及特征整理
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
相关阅读更多精彩内容
- 一、Pandas数据结构 S1=pd.Series([‘a’,’b’,’c’]) series是一组数据与一组索引...
- 官方教程 读取写入文件 官方IO 读取 写入 read_csv to_csv read_excel to_exce...
- ''' 上期回顾: 学习对DataFrame数据记录中含有空值记录的选择,并初次和.loc[]、.iloc[]见了...