简介
正则表达式:Regular Expression
是一种文本模式,包括普通字符(例如,a
到 z
之间的字母,数字)和特殊字符(称为"元字符")。
正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。
很强大,提高效率。
为何使用正则表达式?
测试字符串内的模式。
例如,可以测试输入字符串,以查看字符串内是否出现电话号码模式或信用卡号码模式。这称为数据验证。替换文本。
可以使用正则表达式来识别文档中的特定文本,完全删除该文本或者用其他文本替换它。基于模式匹配从字符串中提取子字符串。
可以查找文档内或输入域内特定的文本。
python正则表达式学习:http://www.runoob.com/python/python-reg-expressions.html
语法
正则表达式(regular expression
)描述了一种字符串匹配的模式(pattern
),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。
普通字符包括没有显式指定为元字符的所有可打印和不可打印字符。这包括所有大写和小写字母、所有数字、所有标点符号和一些其他符号。
非打印字符:
非打印字符也可以是正则表达式的组成部分。下表列出了表示非打印字符的转义序列:
特殊字符:
所谓特殊字符,就是一些有特殊含义的字符,如上面说的 runoo*b 中的 *,简单的说就是表示任何字符串的意思。如果要查找字符串中的 * 符号,则需要对 * 进行转义,即在其前加一个 : runo*ob 匹配 runo*ob
。
注意:换行符与回车符区别:http://www.cnblogs.com/yunf/archive/2011/04/20/2021830.html
制表符:
制表符可以用来制作表格,它们在第9区。它们有:
┌ └ ┐ ┘ ─ │ ├ ┤ ┬ ┴ ┼