RE正则语法

Python的正则包
import re

re的match函数,第1参数:目标字符串,第2参数:匹配模式。
match_obj = re.match(regex_str, line)
返回结果用match_obj.group()
注意:re.match是从字符串开头进行匹配,re.search可以在字符串任何位置匹配

.代表任意字符

*代表任意数量

^

匹配模式的^代表开头。^b代表是b开头的。
^b.*代表b开头的,任意字符的。

$

匹配模式的代表结尾。 3表示必须是以3结尾的。
.*3$代表以3结尾,前面是任意字符串。

贪婪、()、?

匹配模式?是贪婪模式。

  • 非贪婪模式,是从后往前、从右往左匹配。
  • 贪婪模式,就是加上?,从左边开始匹配。

+

+代表至少出现1次。

{1} {2,5} {2,}

{1}代表出现不多不少就1次。
{2,5}出现最少两次,最多5次。

|

(())

先提外层座位group(1),然后才是group(2)的内层。

[]

 * 任一字符

中括号表示其中任一一个都可以。[abcd] 是a, b, c, d中任何一个都可以。

 * 区间

中括号还可以表示区间[0-9],代表0到9中的数字。{0}是9位数字。

 * 不等于

"(1[48357][^1]{9})"

\s \S

\s 空格
\S 不为空格
如果要多个
"(a\S+b)"

\w\W

\w匹配包括下划线的任何单词字符,但不包含标点符号如',',它等价于[A-Za-z0-9_];

\W相反,代表与\w相反的字符。

\u4E00-\u9FA5

[\u4E00-\u9FA5]只提取汉字。

FireShot Capture 2 - 正则表达式速查表_脚本之家 - https___www.jb51.net_tools_regexsc.htm.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Python中的正则表达式(re) import rere.match #从开始位置开始匹配,如果开头没有则无re...
    BigJeffWang阅读 7,181评论 0 99
  • re模块手册 本模块提供了和Perl里的正则表达式类似的功能,不关是正则表达式本身还是被搜索的字符串,都可以...
    喜欢吃栗子阅读 4,051评论 0 13
  • python的re模块--细说正则表达式 可能是东半球最详细最全面的re教程,翻译自官方文档,因为官方文档写的是真...
    立而人阅读 23,013评论 4 46
  • 正则表达式到底是什么东西?字符是计算机软件处理文字时最基本的单位,可能是字母,数字,标点符号,空格,换行符,汉字等...
    狮子挽歌阅读 2,178评论 0 9
  • EileenZHY阅读 327评论 0 0