import re
print('------------------匹配单个字符与数字------------')
r'''
1:'.' :匹配除换行符以外的任意字符
print(re.search('.','www.baidu.com')) #匹配的是w
2:[0123456789]:[]是字符集合,表示匹配方括号中所包含的任意一个字符
print(re.search([0123456789],'www.baidu.com.8')) #匹配的是w
3:[sunck]:匹配方括号中所包含的任意一个字符,则其匹配s,u,n,c,k字符串
print(re.search([sunck],'sunck.baidu.com.8')) #匹配的是s
4:[a-z]:表示匹配任意的小写字母
5:[A-Z]:表示匹配任意的大写字母
6:[0-9]:匹配任意数字,类似[0123456789]
7:[0-9a-zA-Z]:匹配任意的数字和字母
8:[0-9a-zA-Z_]:匹配任意的数字,字母和下划线
9:[^sunck]:匹配除了sunck这几个字母以为的所有字符,即不包括s,u,n,c,k的字符
[]里的'^'称为脱字符,表示不匹配集合中的字符
10:[^0-9]:匹配所有的非数字字符
11:\d:匹配所有的数字字符,效果同[0-9],有^时要加上[]
12:\D:匹配非数字字符,效果同[^0-9]
13:\w:匹配数字,字母和下划线,效果同[0-9a-zA-Z_]
14:\W:匹配非数字,字母和下划线,效果同[^0-9a-zA-Z_]
15:\s:匹配任意的空白符(空格,换行,会车,换页,制表),效果同[ \f\n\r\t]
16:\S:匹配任意的非空白符(空格,换行,会车,换页,制表),效果同[^ \f\n\r\t]
'''
print('---------------锚字符(边界字符)---------')
'''
1:^:行首匹配,,以xx开头,和在[]里的不一样
2:$:行尾匹配,以xx结尾
print('^sunck$','sunck is goods man')#返回None,找不到以sunck开头并结果的字符串
3:\A:匹配字符串开始(行首匹配),它和^的区别是,
\A:只匹配整个字符串的开头,即使在re.M模式下也不会匹配它的行首
;^只要是行首就匹配
4:\Z:匹配字符串结束,它和$的区别是,
\Z:只匹配整个字符串的结尾,即使在re.M模式下也不会匹配它的结尾
;$只要是行尾就匹配
5:\b:匹配一个单词的边界(要加r防止转义),也就是指单词和空格间的位置,'er\b'可以匹配never,不能匹配nerve
6:\B:匹配非单词的边界,也就是指单词和空格间的位置,可以匹配nerve,不能匹配never
print(re.search(r'er\b','never'))
print(re.search(r'er\b','nerve'))
print(re.search(r'er\B','never'))
print(re.search(r'er\B','nerve'))
'''
print('----------------------匹配多个字符---------------')
'''
说明:下方的x,y,z均为假设的普通字符,m,n为非负整数,不是正则表达式的元字符
1:(xyz):匹配小括号内的xyz(作为一个整体取匹配)
print(re.search(r'(sunck)','sunck is good man'))
2:x?:匹配0个或者1个x #非贪婪匹配
print(re.findall(r'a?','aaa'))#匹配3个a,即返回列表中的3个元素都是a
3:x*:匹配0个或者任意多个x #贪婪匹配
print(re.findall(r'a*','aaa'))#匹配aaa
4:x+:匹配至少一个x #贪婪匹配
5:x{n(n}:匹配确定的n个x
6:x{n,}:匹配至少n个x
7:x{n,m}:匹配至少n个最多m个x。注意n<=m
8:x|y:|表示或,匹配的x或y
'''
print('‘---------------------特殊--------------')
'''
1:*? +?x? 最小匹配 (通常都是尽可能多的匹配)可以使用这种方式解决贪婪匹配
2:(?:x) 类似于(xyz)但不表示一个组
'''
'''
#需求:提取sunck·····man
str='sunck is a good man! sunck is a nice man! sunck is a very handsome man'
print(re.findall(r'^sunck.*man$',str))
'''