在sublime中正则匹配中文汉字:\u
即可
在python中匹配中文:[\u4e00-\u9fa5]
,正确与否,待验证
测试代码如下:
import re
# re.search返回第一个match对象,搜索匹配正则表达式的第一个位置
match1 = re.search(r'[1-9]\d{5}', 'BIT 100081')
if match1:
print(match1.group(0))
# 从字符串的第一个位置开始匹配正则表达式,返回match对象
match2 = re.match(r'[1-9]\d{5}', '100081 BIT')
if match2:
print(match2.group(0))
# 搜索字符串,以列表形式返回全部能匹配的子串
ls = re.findall(r'[1-9]\d{5}', '100081 BIT BIT 100084 100085')
if ls:
print(ls)
# 分割字符串,按照正则表达式的形式,返回列表形式,去掉匹配的部分
sp = re.split(r'[1-9]\d{5}', '100081 BIT 100078 TSU100084 ')
print(sp)
sp2 = re.split(r'[1-9]\d{5}', '100081 BIT 100078 TSU100084 ', maxsplit=1)
print(sp2)
# 迭代类型:匹配内容
for m in re.finditer(r'[1-9]\d{5}', "BIT100081 TsU100084"):
if m:
print(m.group(0))
# 替换string字符串,用新的字符串repl来替换匹配字符串pattern匹配成功部分
re.sub(r'[1-9]\d{5}', ':zipcode', 'BIT100081 TUS100083')
regex = re.compiler(r'[1-9]\d{5}')
match对象
当匹配结果是多个字符串时,默认匹配最长的,即贪婪匹配
最小字符串匹配: