匹配开头结尾

匹配分组

re模块用法

# 导入re模块
import re

# 使用match方法进行匹配操作
result = re.match(正则表达式,要匹配的字符串)

# 如果上一步匹配到数据的话，可以使用group方法来提取数据
result.group()

re模块的高级用法

search 找出一个匹配的项

需求：匹配出文章阅读的次数

import re

ret = re.search(r"\d+", "阅读次数为 9999")
ret.group()

运行结果：
'9999'

findall 找出所有匹配的项

需求：统计出python、c、c++相应文章阅读的次数

import re

ret = re.findall(r"\d+", "python = 9999, c = 7890, c++ = 12345")
print(ret)

运行结果：
['9999', '7890', '12345']

sub 将匹配到的数据进行替换

需求：将匹配到的阅读次数加1

方法1：
import re

ret = re.sub(r"\d+", '998', "python = 997")
print(ret)
运行结果：
python = 998


方法2：
import re

def add(temp):
    strNum = temp.group()
    num = int(strNum) + 1
    return str(num)

ret = re.sub(r"\d+", add, "python = 997")
print(ret)

ret = re.sub(r"\d+", add, "python = 99")
print(ret)

运行结果：
python = 998
python = 100

python贪婪和非贪婪

Python里数量词默认是贪婪的（在少数语言里也可能是默认非贪婪），总是尝试匹配尽可能多的字符；

非贪婪则相反，总是尝试匹配尽可能少的字符。

在"*","?","+","{m,n}"后面加上？，使贪婪变成非贪婪。

Python中字符串前面加上 r 表示原生字符串，

与大多数编程语言相同，正则表达式里使用"\"作为转义字符，这就可能造成反斜杠困扰。
假如你需要匹配文本中的字符"\"，那么使用编程语言表示的正则表达式里将需要4个反斜杠"\\"：
前两个和后两个分别用于在编程语言里转义成反斜杠，
转换成两个反斜杠后再在正则表达式里转义成一个反斜杠。

Python里的原生字符串很好地解决了这个问题，有了原生字符串，你再也不用担心是不是漏写了反斜杠，
写出来的表达式也更直观。

Python 3 正则匹配

Python 3 正则匹配

正则匹配单个字符

匹配多个字符

匹配开头结尾

匹配分组

re模块用法

re模块的高级用法

search 找出一个匹配的项

findall 找出所有匹配的项

sub 将匹配到的数据进行替换

python贪婪和非贪婪

Python中字符串前面加上 r 表示原生字符串，

断点调试十分重要

推荐阅读更多精彩内容