1、什么是正则表达式
正则就是一种用来做字符串匹配的工具
2、python对正则表达式的支持
通过re模块提供相应支持正则表达式的方法.
a.fullmatch(正则表达式,字符串)---->用正则表达式来和指定字符串进行匹配,
如果匹配成功返回匹配对象,匹配失败返回None
a、普通字符(代表字符本身)
b、 . 匹配任意字符,不能匹配 '\n'
python中的正则表达式是写在字符串中的,但是一般情况下会在最前面加r/R
c、\w(匹配字母数字下划线)
d、 \s(匹配空白字符)
空白字符:指的是所有能产生空白的字符,包括空格、制表符、换行等
e、 \d(匹配数字字符)
f、 \b(检测单词边界检测正则表达式中\b所在的位置是否是单词边界)
单词边界:所有可以将两个单词区分开的符号都是单词边界,例如:空格,缩进,标点符号等
注意:\b不是匹配符号,不会匹配出一个字符,只是检测所在的位置是否满足要求
g、'^'(检测字符串开头)
h、 $(检测字符串结尾)
i、\B(检测非单词边界)
j、\W匹配非数字字母下划线
k、\S匹配非空白字符
l、\D匹配非数字字符
m、[字符集](匹配字符集中的任意一个字符)
n、[字符1-字符2] -- 匹配字符1到字符2中所有的字符.要求字符1的编码值小胡字符2的编码值
o、[^字符集]--匹配没有在字符集中的其他任意字符
注意:放在[]的最前面才表示匹配不在字符集中的其他任意字符;如果不放在[]的最前面,就表示字符^本身
3、转义字符
正则中也可以通过在特殊符号前加''来对符号进行转义
注意:转义字符是字符中的概念,转义符号是正则表达式的概念
b、除了在中括号中有特殊意义的符号,其他符号放在[] 表示符号本身
-;在中括号中的两个字符之间表示谁到谁;如果想要表示它本身就不要放在两个字符之间
^ :在中括号中的最前面有特殊意义;如果想要表示它本身就不要放在最前面
[]:在中括号中表示[],要加\
4
a、 *(匹配0次或多次)
b、 +(匹配1次或多次)
c、 ?(匹配0次或者1次)
d、 {M,N}--匹配M到N次(最少M次,最多N次)
d、 {M,}--(最少M次)
d、 {,N}--(最多N次)
e、{N}--匹配N次
5、分支
表达式|表达式2|表达式3---先用表达式进行匹配,匹配成功就直接成功;不成功就使用表达式2区匹配;匹配失败再用表达式3
去匹配 ...以此类推(三个表达式中只要有一个能够成功就成功,否则匹配失败)
7、分组--将()将括号中的内容看成一个整体
b、分组重复 -- 在有分组的正则表达式中,可以在分组后面通过\(数字)来重复前面第几个分组匹配到内容