Python中级篇（十五）re模块

re模块中的常用函数：

1、search():

在整个字符串中查找，返回第一个匹配内容，如果找到返回match对象，没找到返回None

2、match()：

从字符串的第一个字符开始匹配，如果找到返回match对象，没找到返回None

3、findall()：

在字符串中匹配，如果成功返回match对象，如果失败返回None

4、finditer():

在字符串中匹配，如果成功返回match可迭代对象，如果失败返回None

5、split():

按照匹配的字符串进行分割

6、sub():

替换匹配的子字符串，返回替换之后的字符串

---------------------------------------------------

举例说明：

ret = re.findall('a','eva egon yuan')# 返回所有满足匹配条件的结果,放在列表里print(ret) #结果 : ['a', 'a']

ret = re.search('a','eva egon yuan').group() print(ret)#结果 : 'a'# 函数会在字符串内查找模式匹配,只到找到第一个匹配然后返回一个包含匹配信息的对象,该对象可以# 通过调用group()方法得到匹配的字符串,如果字符串没有匹配，则返回None。

ret = re.match('a','abc').group()# 同search,不过尽在字符串开始处进行匹配print(ret)#结果 : 'a'ret = re.split('[ab]','abcd')# 先按'a'分割得到''和'bcd',在对''和'bcd'分别按'b'分割print(ret)# ['', '', 'cd']

ret = re.sub('\d','H','eva3egon4yuan4', 1)#将数字替换成'H'，参数1表示只替换1个print(ret)#evaHegon4yuan4

ret = re.subn('\d','H','eva3egon4yuan4')#将数字替换成'H'，返回元组(替换的结果,替换了多少次)print(ret)

obj = re.compile('\d{3}')#将正则表达式编译成为一个正则表达式对象，规则要匹配的是3个数字

ret = obj.search('abc123eeee')#正则表达式对象调用search，参数为待匹配的字符串print(ret.group())#结果： 123import re

ret = re.finditer('\d','ds3sy4784a')#finditer返回一个存放匹配结果的迭代器print(ret)# <callable_iterator object at 0x10195f940>print(next(ret).group())#查看第一个结果print(next(ret).group())#查看第二个结果print([i.group()foriinret])#查看剩余的左右结果

'.' 默认匹配除\n之外的任意一个字符，若指定flag DOTALL,则匹配任意字符，包括换行

'^' 匹配字符开头，若指定flags MULTILINE,这种也可以匹配上(r"^a","\nabc\neee",flags=re.MULTILINE)

'$' 匹配字符结尾，若指定flags MULTILINE ,re.search('foo.$','foo1\nfoo2\n',re.MULTILINE).group() 会匹配到foo1

'*' 匹配*号前的字符0次或多次， re.search('a*','aaaabac') 结果'aaaa'

'+' 匹配前一个字符1次或多次，re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb']

'?' 匹配前一个字符1次或0次 ,re.search('b?','alex').group() 匹配b 0次

'{m}' 匹配前一个字符m次 ,re.search('b{3}','alexbbbs').group() 匹配到'bbb'

'{n,m}' 匹配前一个字符n到m次，re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb']

'|' 匹配|左或|右的字符，re.search("abc|ABC","ABCBabcCD").group() 结果'ABC'

'(...)' 分组匹配， re.search("(abc){2}a(123|45)", "abcabca456c").group() 结果为'abcabca45'

'\A' 只从字符开头匹配，re.search("\Aabc","alexabc") 是匹配不到的，相当于re.match('abc',"alexabc") 或^

'\Z' 匹配字符结尾，同$

'\d' 匹配数字0-9

'\D' 匹配非数字

'\w' 匹配[A-Za-z0-9],还包括下划线‘_’

'\W' 匹配非[A-Za-z0-9]

's' 匹配空白字符、\t、\n、\r , re.search("\s+","ab\tc1\n3").group() 结果 '\t'

Python中级篇（十五）re模块

Python中级篇（十五）re模块

re模块中的常用函数：

举例说明：

相关阅读更多精彩内容

友情链接更多精彩内容