正则表达式:
概述
re.findall(pattern,string,flags=0):返回string中所有与pattern相匹配的全部字符串,返回形式为数组。
正则表达式的语法中将字符分为:普通字符(所有打印、不可打印的字符);非打印字符;特殊字符(如*¥,若要匹配这些字符本身需要加\转义);限定符;定位符
在java中用字符串保持正则表达式,所以其中所有用来转义的\都通过\表示。
r:代表后面是正则
普通字符
[]:匹配字符集;
\d:匹配0~9之间的数
\D:匹配除了0~9之外的所有字符
\w:匹配所有字母、数字字符、下划线
\W:匹配除了字母、数字之外的字符
非打印字符
\s:匹配所有空白字符,包括换行
\S:匹配所有非空白符,包括换行
\t:匹配一个制表符
\v:匹配一个垂直制表符
\56:表示字符.
\b:匹配一个单词边界
\B:匹配非单词边界
特殊字符
如果要匹配特殊字符,首先需要将字符转移将\放在他们前面
$:标定匹配的位置是尾部;可用于判断字符串是否为结束字符串
():标记一个正则子表达式的开始、结束位置;子表达式可被获取并使用
[:标记一个中括号表达式的开始
\:将下一个字符标记为特殊字符或原意字符、或向后引用、或八进制转义符号
{:标记限定符表达式的开始
|:指明两项之间的一个选择
.:匹配除换行符之外的任何单字符
^:匹配输入字符串的开始位置,在[]中使用表示不接受该表达式中的字符集合
*
+
?
限定表达式
*:匹配前面的的子表达式0次或多次
+:匹配前面的子表达式1次或多次
?:匹配前面的子表达式零次或1次;或指明一个非贪婪限定符
{n}:匹配前面的表达式n次
{n,m}:匹配前面的表达式最少n次,最多m次
{n,}:匹配前面的表达式最少n次