使用pandas做数据筛选,使用简单的列值筛选的方法非常简单,比如需要找出列type不属于[30,40,56]集合的列:
subreview = parray[(parray['type']!=30) & (parray['type']!=56) &(parray['type']!=40) ]
但是发现结果不符合预期,没有筛选功能,小编排查之后发现,是pandas加载的时候,‘type’列默认是string格式,不是整形数值,因此用
[parray['type']!=30]的筛选是无法正常进行的,需要使用astype转化一下就可以了,后续的同学也注意,不要踩这个坑了。
parray['type'] = parray['type'].astype(int)