- re.compile: 编译一个正则表达式模式(pattern)
- re.match: 从头开始匹配, 使用group()方法可以获取第一个匹配值
- re.search: 用包含方式匹配,使用group()方法可以获取第一个匹配值
- re.findall: 用包含方式匹配,把所有匹配到的字符放到以列表中的元素返回多个匹配值
- re.sub: 匹配字符并替换
- re.split: 以匹配到的字符当做列表分隔符,返回列表
正则表达式的表示方法
- 管道符(|)从多个模式中匹配一个
- 句点
.
匹配任意的单个字符 - 脱字符
^
匹配开头 - 美元符
$
匹配结尾 - 方括号
[ ]
匹配方括号中的任意字符;[ ~ ]
不匹配方括号中出现的任一字符 - 闭包操作符实现存在性和频率匹配
贪婪模式,尽量匹配多
星号(*): 匹配其左边出现的正则表达式0次或者多次
加号(+): 匹配其左边出现的正则表达式1次或者多次
问号(?): 匹配其左边出现的正则表达式0次或者1次
花括号{N}:匹配其左边出现的正则表达式N次
花括号{M, N}:匹配其左边出现的正则表达式M~N次
非贪婪模式,匹配尽量少
*?:匹配0次
+?:匹配1次
??:匹配0次
{M, N}?: 只匹配M次
- 使用圆括号()对正则表达式分组