Python中正则表达式元字符

import re

print('------------------匹配单个字符与数字------------')

r'''

1：'.' ：匹配除换行符以外的任意字符

print(re.search('.','www.baidu.com')) #匹配的是w

2：[0123456789]：[]是字符集合，表示匹配方括号中所包含的任意一个字符

print(re.search([0123456789],'www.baidu.com.8')) #匹配的是w

3：[sunck]：匹配方括号中所包含的任意一个字符，则其匹配s，u，n，c，k字符串

print(re.search([sunck],'sunck.baidu.com.8')) #匹配的是s

4：[a-z]：表示匹配任意的小写字母

5：[A-Z]：表示匹配任意的大写字母

6：[0-9]：匹配任意数字，类似[0123456789]

7：[0-9a-zA-Z]：匹配任意的数字和字母

8：[0-9a-zA-Z_]：匹配任意的数字，字母和下划线

9：[^sunck]：匹配除了sunck这几个字母以为的所有字符，即不包括s，u，n，c，k的字符

[]里的'^'称为脱字符，表示不匹配集合中的字符

10：[^0-9]：匹配所有的非数字字符

11：\d：匹配所有的数字字符，效果同[0-9],有^时要加上[]

12：\D：匹配非数字字符，效果同[^0-9]

13：\w：匹配数字，字母和下划线，效果同[0-9a-zA-Z_]

14：\W：匹配非数字，字母和下划线，效果同[^0-9a-zA-Z_]

15：\s：匹配任意的空白符（空格，换行，会车，换页，制表），效果同[ \f\n\r\t]

16：\S：匹配任意的非空白符（空格，换行，会车，换页，制表），效果同[^ \f\n\r\t]

'''

print('---------------锚字符（边界字符）---------')

'''

1：^：行首匹配，，以xx开头，和在[]里的不一样

2：$：行尾匹配，以xx结尾

print('^sunck$','sunck is goods man')#返回None，找不到以sunck开头并结果的字符串

3：\A：匹配字符串开始（行首匹配），它和^的区别是，

\A：只匹配整个字符串的开头，即使在re.M模式下也不会匹配它的行首

；^只要是行首就匹配

4：\Z：匹配字符串结束，它和$的区别是，

\Z：只匹配整个字符串的结尾，即使在re.M模式下也不会匹配它的结尾

；$只要是行尾就匹配

5：\b：匹配一个单词的边界(要加r防止转义)，也就是指单词和空格间的位置,'er\b'可以匹配never，不能匹配nerve

6：\B：匹配非单词的边界，也就是指单词和空格间的位置，可以匹配nerve，不能匹配never

print(re.search(r'er\b','never'))

print(re.search(r'er\b','nerve'))

print(re.search(r'er\B','never'))

print(re.search(r'er\B','nerve'))

'''

print('----------------------匹配多个字符---------------')

'''

说明：下方的x，y，z均为假设的普通字符，m，n为非负整数，不是正则表达式的元字符

1：(xyz)：匹配小括号内的xyz(作为一个整体取匹配)

print(re.search(r'(sunck)','sunck is good man'))

2：x？：匹配0个或者1个x #非贪婪匹配

print(re.findall(r'a？','aaa'))#匹配3个a，即返回列表中的3个元素都是a

3：x*：匹配0个或者任意多个x #贪婪匹配

print(re.findall(r'a*','aaa'))#匹配aaa

4：x+：匹配至少一个x #贪婪匹配

5：x{n（n}：匹配确定的n个x

6：x{n，}：匹配至少n个x

7：x{n，m}：匹配至少n个最多m个x。注意n<=m

8：x|y：|表示或，匹配的x或y

'''

print('‘---------------------特殊--------------')

'''

1：*？ +？x？最小匹配（通常都是尽可能多的匹配）可以使用这种方式解决贪婪匹配

2：(？:x) 类似于（xyz）但不表示一个组

'''

#需求：提取sunck·····man

str='sunck is a good man! sunck is a nice man! sunck is a very handsome man'

print(re.findall(r'^sunck.*man$',str))

'''

Python中正则表达式元字符

友情链接更多精彩内容