re基础

常用函数

image.png

符号

.’用于匹配除换行符(\n)之外的所有字符。

^’用于匹配字符串的开始,即行首。

$’用于匹配字符串的末尾(末尾如果有换行符\n,就匹配\n前面的那个字符),即行尾。

‘*****’用于将前面的模式匹配0次或多次(贪婪模式,即尽可能多的匹配)

+’用于将前面的模式匹配1次或多次(贪婪模式)

’用于将前面的模式匹配0次或1次(贪婪模式)

‘*?,+?,??’即上面三种特殊字符的非贪婪模式(尽可能少的匹配)。

{m,n}’用于将前面的模式匹配m次到n次(贪婪模式),即最小匹配m次,最大匹配n次。

{m,n}?’即上面‘{m,n}’的非贪婪版本。

\’:''是转义字符,在特殊字符前面加上\,特殊字符就失去了其所代表的含义,比如+就仅仅代表加号+本身。

[]’用于标示一组字符,如果^是第一个字符,则标示的是一个补集。比如[0-9]表示所有的数字,[^0-9]表示除了数字外的字符。

|’比如A|B用于匹配A或B。

(...)’用于匹配括号中的模式,可以在字符串中检索或匹配我们所需要的内容。

\A:表示从字符串的开始处匹配

\Z:表示从字符串的结束处匹配,如果存在换行,只匹配到换行前的结束字符串。

\b:匹配一个单词边界,也就是指单词和空格间的位置。例如, 'py\b' 可以匹配"python" 中的 'py',但不能匹配 "openpyxl" 中的 'py'。

\B:匹配非单词边界。 'py\b' 可以匹配"openpyxl" 中的 'py',但不能匹配"python" 中的 'py'。

\d:匹配任意数字,等价于 [0-9]。

\D:匹配任意非数字字符,等价于 [^\d]。

\s:匹配任意空白字符,等价于 [\t\n\r\f]。

\S:匹配任意非空白字符,等价于 [^\s]。

\w:匹配任意字母数字及下划线,等价于[a-zA-Z0-9_]。

\W:匹配任意非字母数字及下划线,等价于[^\w]\:匹配原义的反斜杠\。


©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • Python中的正则表达式(re) import rere.match #从开始位置开始匹配,如果开头没有则无re...
    BigJeffWang阅读 12,113评论 0 99
  • 搞懂Python 正则表达式用法 Python 正则表达式 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一...
    厦热阅读 5,589评论 0 2
  • 常用模块 认识模块 什么是模块 什么是模块? 常见的场景:一个模块就是一个包含了python定义和声明的文件,文...
    go以恒阅读 6,218评论 0 6
  • re模块手册 本模块提供了和Perl里的正则表达式类似的功能,不关是正则表达式本身还是被搜索的字符串,都可以...
    喜欢吃栗子阅读 9,496评论 0 13
  • 官网 中文版本 好的网站 Content-type: text/htmlBASH Section: User ...
    不排版阅读 10,018评论 0 5

友情链接更多精彩内容