正则表达式
定义:
正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
规则:
1 元字符. 匹配任何单个字符,除了换行
d 数字 \D 非数字 [0-9]
w 数字 字母 下划线 \W 非 [0-9a-zA-Z_]
\s 空白 \S 非空白
\n 换行
\t 制表符
2 范围-- 匹配的是一个字符[0-9] [0123] [a-z] [A-Z] 匹配的是一个字符
3 | 或者| 或者
4 量词 -只修饰一个字符a+ 1个或多个a
a? 1个或0个a
a* 0个或多个a
a{x} x个n
a{x,} 至少x个a
a{x,y} x-y个a
5 开始结束^a 以a开始
a$ 以a结束
6 ( ) 看成是一个整体,即分组
7 匹配汉字[\u4e00-\u9fa5]
8 参数i 忽略大小写
g 全局匹配
9 ^在[ ]中的作用——取反
10 贪婪模式和非贪婪模式默认情况 贪婪模式 <.+>
非贪婪模式 <.+?>