re模块中的常用函数:
1、search():
在整个字符串中查找,返回第一个匹配内容,如果找到返回match对象,没找到返回None
2、match():
从字符串的第一个字符开始匹配,如果找到返回match对象,没找到返回None
3、findall():
在字符串中匹配,如果成功返回match对象,如果失败返回None
4、finditer():
在字符串中匹配,如果成功返回match可迭代对象,如果失败返回None
5、split():
按照匹配的字符串进行分割
6、sub():
替换匹配的子字符串,返回替换之后的字符串
---------------------------------------------------
举例说明:
ret = re.findall('a','eva egon yuan')# 返回所有满足匹配条件的结果,放在列表里print(ret) #结果 : ['a', 'a']
ret = re.search('a','eva egon yuan').group() print(ret)#结果 : 'a'# 函数会在字符串内查找模式匹配,只到找到第一个匹配然后返回一个包含匹配信息的对象,该对象可以# 通过调用group()方法得到匹配的字符串,如果字符串没有匹配,则返回None。
ret = re.match('a','abc').group()# 同search,不过尽在字符串开始处进行匹配print(ret)#结果 : 'a'ret = re.split('[ab]','abcd')# 先按'a'分割得到''和'bcd',在对''和'bcd'分别按'b'分割print(ret)# ['', '', 'cd']
ret = re.sub('\d','H','eva3egon4yuan4', 1)#将数字替换成'H',参数1表示只替换1个print(ret)#evaHegon4yuan4
ret = re.subn('\d','H','eva3egon4yuan4')#将数字替换成'H',返回元组(替换的结果,替换了多少次)print(ret)
obj = re.compile('\d{3}')#将正则表达式编译成为一个 正则表达式对象,规则要匹配的是3个数字
ret = obj.search('abc123eeee')#正则表达式对象调用search,参数为待匹配的字符串print(ret.group())#结果 : 123import re
ret = re.finditer('\d','ds3sy4784a')#finditer返回一个存放匹配结果的迭代器print(ret)# <callable_iterator object at 0x10195f940>print(next(ret).group())#查看第一个结果print(next(ret).group())#查看第二个结果print([i.group()foriinret])#查看剩余的左右结果
'.' 默认匹配除\n之外的任意一个字符,若指定flag DOTALL,则匹配任意字符,包括换行
'^' 匹配字符开头,若指定flags MULTILINE,这种也可以匹配上(r"^a","\nabc\neee",flags=re.MULTILINE)
'$' 匹配字符结尾, 若指定flags MULTILINE ,re.search('foo.$','foo1\nfoo2\n',re.MULTILINE).group() 会匹配到foo1
'*' 匹配*号前的字符0次或多次, re.search('a*','aaaabac') 结果'aaaa'
'+' 匹配前一个字符1次或多次,re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb']
'?' 匹配前一个字符1次或0次 ,re.search('b?','alex').group() 匹配b 0次
'{m}' 匹配前一个字符m次 ,re.search('b{3}','alexbbbs').group() 匹配到'bbb'
'{n,m}' 匹配前一个字符n到m次,re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb']
'|' 匹配|左或|右的字符,re.search("abc|ABC","ABCBabcCD").group() 结果'ABC'
'(...)' 分组匹配, re.search("(abc){2}a(123|45)", "abcabca456c").group() 结果为'abcabca45'
'\A' 只从字符开头匹配,re.search("\Aabc","alexabc") 是匹配不到的,相当于re.match('abc',"alexabc") 或^
'\Z' 匹配字符结尾,同$
'\d' 匹配数字0-9
'\D' 匹配非数字
'\w' 匹配[A-Za-z0-9],还包括下划线‘_’
'\W' 匹配非[A-Za-z0-9]
's' 匹配空白字符、\t、\n、\r , re.search("\s+","ab\tc1\n3").group() 结果 '\t'