普通字符作为原子
通用字符作为原子:\w \s \d 等各代表的意思
原子表:[ ]取里面的任意一个字符. ^加在原子前面,表示非。取非原子的其他原子值
元字符:正则表达式里面具有一些特殊含义的字符。比如重复前面n次字符
. :除换行符外的任意字符
^: 若不在原子表中,代表匹配开始位置
$: 匹配结束位置
*: 前面原子重复出现一次0次 或多次
?: 前面原子出现0或1次 +:前面原子1或多次
{n}:恰好出现n次 {n,m}至少n次,至多m次
模式修正符:可以在不改变正则表达式的前提下,改变表达式的含义
I:代表忽略大小写
M:代表多行匹配
S 让点.匹配包括换行符*
在匹配的时候在函数里面加上(ptr,sritn,re.I)
贪婪模式 尽可能多的匹配,.*
懒惰模式:尽可能少的匹配 .*? 注意有问号是懒惰模式
正则表达式函数:re.search match findall 等
函数是正则表达式的实现功能,
全局匹配函数:
re.compile(正则表达式).findall(数据)
小知识: 在浏览器中输入 ctrl+F 可以显示输入框