正则表达式
1.正则表达式的概念
正则表达式是可以匹配文本片段的模式。
最简单的正则表达式就是普通字符串,可以匹配其自身。
2.通配符(wildcard)
点号可以匹配任何字符串(除换行符外的其他单个字符),点号就称为通配符。
3.特殊字符串的转义(escape)
两个反斜线\\
如:'Python\\.org' 匹配 Python.org
4.字符集(character set)
[a-zA-Z0-9]
[^abc] 反转义字符集
5.选择符和字模式
管道:| python|perl
字模式(subpattern) p(ython|erl)
6.可选项和重复字模式
可选项: ?
(pattern)*:运行模式重复0次或多次
(pattern)+:运行模式重复一次或多次
(pattern){m,n}:运行模式重复m~n次
7.字符串的开始和结尾
开始:脱字符(^)
结尾:美元符号($)
只想在字符串的开头而不是其他位置匹配'ht+p',那么就可以使用脱字符标记开始,^ht+p会匹配 http://Python.org 以及 htttttp://Python.org 但不匹配www.http.org
常用的正则表达式:
00 数字:^[0-9]*$
11 汉字:^[\u4e00-\u9fa5]{0,}$
22 英文和数字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
1 Email地址:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
2 域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
3 InternetURL:[a-zA-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$
4 手机号码:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
5 电话号码("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX):^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$
6 国内电话号码(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d{7}
7 身份证号(15位、18位数字):^\d{15}|\d{18}$
8 短身份证号码(数字、字母x结尾):^([0-9]){7,18}(x|X)?$ 或 ^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$
9 帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
10 密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线):^[a-zA-Z]\w{5,17}$
11 强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
12 日期格式:^\d{4}-\d{1,2}-\d{1,2}
13 一年的12个月(01~09和1~12):^(0?[1-9]|1[0-2])$
14 一个月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$