re 过滤中文

# -*- coding: utf-8 -*-

importre

#过滤掉除了中文以外的字符

str="hello,world!!%[545]你好234世界。。。"

str=re.sub("[A-Za-z0-9\!\%\[\]\,\。]", "", str)

print(str)


#提取字符串里的中文,返回数组

pattern="[\u4e00-\u9fa5]+"

regex =re.compile(pattern)

results =regex.findall("adf中文adf发京东方")

print(results)

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容