re基础

re基础

image.png

‘.’用于匹配除换行符（\n）之外的所有字符。

‘^’用于匹配字符串的开始，即行首。

‘$’用于匹配字符串的末尾（末尾如果有换行符\n，就匹配\n前面的那个字符），即行尾。

‘*****’用于将前面的模式匹配0次或多次（贪婪模式，即尽可能多的匹配）

‘+’用于将前面的模式匹配1次或多次（贪婪模式）

‘？’用于将前面的模式匹配0次或1次（贪婪模式）

‘*？，+？，？？’即上面三种特殊字符的非贪婪模式（尽可能少的匹配）。

‘{m,n}’用于将前面的模式匹配m次到n次（贪婪模式），即最小匹配m次，最大匹配n次。

‘{m,n}？’即上面‘{m,n}’的非贪婪版本。

‘\’：''是转义字符，在特殊字符前面加上\，特殊字符就失去了其所代表的含义，比如+就仅仅代表加号+本身。

‘[]’用于标示一组字符，如果^是第一个字符，则标示的是一个补集。比如[0-9]表示所有的数字，[^0-9]表示除了数字外的字符。

‘|’比如A|B用于匹配A或B。

‘(...)’用于匹配括号中的模式，可以在字符串中检索或匹配我们所需要的内容。

\A：表示从字符串的开始处匹配

\Z：表示从字符串的结束处匹配，如果存在换行，只匹配到换行前的结束字符串。

\b：匹配一个单词边界，也就是指单词和空格间的位置。例如， 'py\b' 可以匹配"python" 中的 'py'，但不能匹配 "openpyxl" 中的 'py'。

\B：匹配非单词边界。 'py\b' 可以匹配"openpyxl" 中的 'py'，但不能匹配"python" 中的 'py'。

\d：匹配任意数字，等价于 [0-9]。

\D：匹配任意非数字字符，等价于 [^\d]。

\s：匹配任意空白字符，等价于 [\t\n\r\f]。

\S：匹配任意非空白字符，等价于 [^\s]。

\w：匹配任意字母数字及下划线，等价于[a-zA-Z0-9_]。

\W：匹配任意非字母数字及下划线，等价于[^\w]\：匹配原义的反斜杠\。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。