数据清洗的犯得错误

在平安实习,一些关于数据分析的:

用正则表达式分割字符,保留分割字符 的:

txt=“日期:2018年2月3日 日期:2019年3月2日”

res=re.split(['日期'],txt)

Res=res[1:]

Res=[''.join(i).strip() for i in zip(res[0::2],res[1::2])]


pandas:找到某值对应的某行:df[df['xx'].isin([value])]


创建一个空的DataFrame后,往里面添加series,一定要df=df.append(df1),df1进行concat得到,被读取dataframe格式,注意,一定不能有重复字段,会报错!!!!!!!!!

在进行拼接的时候,两个dateframe concat在一起(axis=1)按照列拼接,但是最后仍然不能显示在一行,试了很多方法均不可行,解决方法:提取前面两个dateframe的values拼接到data,之后给定columns 写入dateframe


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容