在本章中,我们进行了缺失值的观察与处理、重复值的观察与处理以及特征的观察与处理等等任务。
这其中我将浅谈自己对于缺失值处理的一点感想。在pandas中,None能够直接被导入数据库作为空值处理, 包含NaN的数据导入时会报错,另外numpy和pandas的很多函数能处理NaN,但是如果遇到None就会报错。np.isnan()和pd.isnull()都可以对不论是DataFrame、Python list还是仅仅一个数值进行空值检测。但一般在实际应用中,np.isnan()多用于单个值的检验,pd.isnull()用于对一个DataFrame或Series(整体)的检验。
Datawhale七月组队——动手学数据分析 Task02 数据清洗及特征整理
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- 一、Pandas数据结构 S1=pd.Series([‘a’,’b’,’c’]) series是一组数据与一组索引...
- 官方教程 读取写入文件 官方IO 读取 写入 read_csv to_csv read_excel to_exce...
- ''' 上期回顾: 学习对DataFrame数据记录中含有空值记录的选择,并初次和.loc[]、.iloc[]见了...