正则表达式

简介

正则表达式:Regular Expression

是一种文本模式,包括普通字符(例如,az 之间的字母,数字)和特殊字符(称为"元字符")。

正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。

很强大,提高效率。

为何使用正则表达式?

  • 测试字符串内的模式。
    例如,可以测试输入字符串,以查看字符串内是否出现电话号码模式或信用卡号码模式。这称为数据验证。

  • 替换文本。
    可以使用正则表达式来识别文档中的特定文本,完全删除该文本或者用其他文本替换它。

  • 基于模式匹配从字符串中提取子字符串。
    可以查找文档内或输入域内特定的文本。

python正则表达式学习:http://www.runoob.com/python/python-reg-expressions.html


语法

正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。

普通字符包括没有显式指定为元字符的所有可打印和不可打印字符。这包括所有大写和小写字母、所有数字、所有标点符号和一些其他符号。

非打印字符:

非打印字符也可以是正则表达式的组成部分。下表列出了表示非打印字符的转义序列:

图片.png

特殊字符:

所谓特殊字符,就是一些有特殊含义的字符,如上面说的 runoo*b 中的 *,简单的说就是表示任何字符串的意思。如果要查找字符串中的 * 符号,则需要对 * 进行转义,即在其前加一个 : runo*ob 匹配 runo*ob

图片.png

注意:换行符与回车符区别:http://www.cnblogs.com/yunf/archive/2011/04/20/2021830.html

制表符:
制表符可以用来制作表格,它们在第9区。它们有:
┌ └ ┐ ┘ ─ │ ├ ┤ ┬ ┴ ┼

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容