正则表达式
字符规则
贪婪匹配
. : 除换行外任意字符
\d:匹配数字[0-9]
\D:匹配非数字
\w:匹配单词字符( a-z , A-Z , 0-9 , _ )
\W:匹配单词非字符
\s:匹配空白字符
\S:匹配非空白字符
^:以 .. 开头
$:以 .. 结尾
\\:转译符号
():分组
| :或
(P<name>\w+).*(P=name) 别名
* :匹配*号前面字符0次或者无限次
+:匹配+号前面字符1次或者无限次
?:匹配?号前面字符0次或者1次
{n,m}:匹配{n,m}前字符,n~m次
非贪婪匹配
>*?+?
??
re 模块
import re
re.compile(rule,re.rule)
- 生成一个正则匹配规则对象
re.match(rule,coutent)
- 从 起始 位置开始匹配,单次匹配,有结果则返回,无结果则返回None
re.search(rule,content)
- 从 整个字符串 中开始匹配,单次匹配,有结果则返回span,无结果则返回None
re.findall(rule,content)
- 将字符串中所有符合正则规则的结果全部匹配出来,最终返回的是 列表
re.finditer(rule,content)
- 将字符串中所有符合正则规则的结果全部匹配出来,最终返回的是 可迭代对象
re.sub(rule,result,content)
- 替换
- result支持函数
re.spilt(rule,content)
- 字符串分割