python 正则表达式:只保留字符串中的中英文和数字

问题描述

在做字符串比较的时候,一般不希望有特殊字符。比如:我要判断“某某(集团)股份有限公司”是否是上市公司,这时我便需要将该字符串和上市公司池的的字符串进行比较。但如果我这里的是中文的,二上市公司池里的却是英文的字符(,便会导致做出该公司不是上市公司的误判。所以,在进行比较前,需要去除这样的无实际意义的字符。

解决方法

正则表达式

import re
cop = re.compile("[^\u4e00-\u9fa5^a-z^A-Z^0-9]") # 匹配不是中文、大小写、数字的其他字符
string1 = '@ad&*jfad张132(www)。。。'
string1 = cop.sub('', string1) #将string1中匹配到的字符替换成空字符

参考

https://blog.csdn.net/github_37412255/article/details/78499071

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 一、字符串在C#中,字符串是一系列不可修改的Unicode字符,创建字符串后,就不能修改它。要创建字符串,最常用的...
    CarlDonitz阅读 5,059评论 0 2
  • Python中的正则表达式(re) import rere.match #从开始位置开始匹配,如果开头没有则无re...
    BigJeffWang阅读 12,015评论 0 99
  • python的re模块--细说正则表达式 可能是东半球最详细最全面的re教程,翻译自官方文档,因为官方文档写的是真...
    立而人阅读 23,122评论 4 46
  • 女人似花,摇曳多姿,风情万种。男人则是赏花人,花是风景,有人赏景是最寻常不过了,因为风景就是叫人欣赏的。男人看美女...
    雨霖铃_a97c阅读 4,251评论 0 0
  • 一 我二十二岁那年过得并不好,我可能一生过得都不好。这一年我快要挺不下去了,十二月底我给我继父于勒写信解释——前段...
    夕阳下t阅读 3,880评论 0 0