正则表达式 - 元字符

基本

字符 描述
\ 将下一个字符转义
^ 匹配输入字符串的开始位置
$ 匹配输入字符串的结束位置
. 匹配除 "\n" 之外的任何单个字符。
|
[abc] 匹配包含abc的任意一个字符串
[^abc] 匹配未包含abc的任意字符串
[a-z] [A-Z] [0-9] 匹配指定范围的字符串
[\u4e00-\u9fa5] 匹配任意中文

限制符 - 匹配次数

表明前面的子表达式需要匹配几次

字符 描述
* 匹配零次或多次
+ 匹配一次或多次
? 匹配零次或一次
{n} 匹配n次
{n,} 至少匹配n次
{n,m} 至少匹配n次 至多匹配m次
限制符后跟? 将匹配模式改为非贪婪

子表达式

字符 描述 是否获取
(pattern) 匹配 pattern 通常和 | 连用
(?:pattern) 匹配 pattern 通常和 | 连用
(?=pattern) 正向预查 在任何匹配 pattern 的开始处查找
(?<=pattern) 正向预查 在任何匹配 pattern 的结束处查找
(?!pattern) 负向预查 在任何不匹配 pattern 的开始处查找

转义字符

字符 描述 等价于
\b 在单词的边界处匹配之前的字符串
\B 在非单词边界处匹配之前的字符串
\d 匹配一个数字字符 [0-9]
\D 匹配一个非数字字符 [^0-9]
\f 匹配一个换页符 \x0c 和 \cL
\n 匹配一个换行符 \x0a 和 \cJ
\r 匹配一个回车符 \x0d 和 \cM
\s 匹配任何空白字符,包括空格、制表符、换页符等等 [ \f\n\r\t\v]
\S 匹配任何非空白字符 [^ \f\n\r\t\v]
\t 匹配一个制表符 \x09 和 \cI
\v 匹配一个垂直制表符 \x0b 和 \cK
\w 匹配包括下划线的任何单词字符 [A-Za-z0-9_]
\W 匹配任何非单词字符 [^A-Za-z0-9_]
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • \d 代表 [0-9] \l 代表 [a-z] \u 代表 [A-Z] \a 代表 [A-Za-z] \w 代表 ...
    zhuoshao阅读 5,227评论 0 5
  • 正则表达式语言由两种基本字符类型组成:原义(正常)文本字符和元字符。元字符使正则表达式具有处理能力。元字符既可以...
    木有鱼丸啦阅读 3,056评论 0 0
  • 一、正则表达式的用途(搜索和替换) 1.1.正则表达式(regular expression,简称regex)是一...
    IIronMan阅读 13,410评论 0 14
  • python的re模块--细说正则表达式 可能是东半球最详细最全面的re教程,翻译自官方文档,因为官方文档写的是真...
    立而人阅读 23,157评论 4 46
  • arpa/inet.h所引起的Segmentation fault及网络编程常见的头文件 - disdader -...
    踩在浪花上00阅读 13,116评论 0 1