正则表达式符号含义

关键词：正则表达式

正则表达式是一种特殊的字符串模式，用于匹配一组字符串

元字符

字符	释义
"^"	^会匹配行或者字符串的起始位置，有时还会匹配整个文档的起始位置。
"$"	$会匹配行或字符串的结尾
"\b"	不会消耗任何字符只匹配一个位置，常用于匹配单词边界
"\d"	匹配数字，
"\w"	匹配字母，数字，下划线.
"\s"	匹配空格
"."	匹配除了换行符以外的任何字符这个算是"\w"的加强版"\w"不能匹配空格
"[abc]"	字符组匹配包含括号内元素的字符还可以写成[a-z]
"\W"	匹配任意不是字母，数字，下划线的字符
"\S"	匹配任意不是空白符的字符
"\D"	匹配任意非数字的字符
"\B"	匹配不是单词开头或结束的位置
[^abc]	匹配除了abc以外的任意字符

量词
关于量词所涉及到的重要的三个概念

1.贪婪: 如"*"字符

贪婪量词会首先匹配整个字符串，尝试匹配时，它会选定尽可能多的内容，如果失败则回退一个字符，然后再次尝试回退的过程就叫做回溯，它会每次回退一个字符，直到找到匹配的内容或者没有字符可以回退。
这种方法对资源消耗很大

2.懒惰：如 "?"

它从目标的起始位置开始尝试匹配，每次检查一个字符，并寻找它要匹配的内容，如此循环直到字符结尾处。

3.占有：如"+"

占有量词会覆盖事个目标字符串，然后尝试寻找匹配内容，但它只尝试一次，不会回溯

懒惰限定符

字符	释义
"*?"	重复任意次，但尽可能少重复如 "acbacb" 正则 "a.*?b" 只会取到第一个"acb"
"+?"	重复1次或更多次，但尽可能少重复，与上面一样，只是至少要重复1次
"??"	重复0次或1次，但尽可能少重复，如 "aaacb" 正则 "a.??b" 只会取到最后的三个字符"acb"
"{n,m}?"	重复n到m次，但尽可能少重复，如 "aaaaaaaa" 正则 "a{0,m}" 因为最少是0次所以取到结果为空
"{n,}?"	重复n次以上，但尽可能少重复，如 "aaaaaaa" 正则 "a{1,}" 最少是1次所以取到结果为 "a"

最后编辑于：2017.12.06 05:08:59

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。