re.sub说明
re.sub的参数:有五个参数re.sub(pattern, repl, string, count=0, flags=0)
其中三个必选参数:pattern, repl, string
两个可选参数:count, flags
第一个:patternpattern
表示正则中的模式字符串。反斜杠加数字(\N),则对应着匹配的组(matched group) 比如\6
,表示匹配前面pattern中的第6个group
第二个参数:replrepl
就是replacement,被替换,的字符串的意思。repl可以是字符串,也可以是函数
。repl是字符串如果repl是字符串的话,其中的任何反斜杠转义字符,都会被处理的。即:\n
:会被处理为对应的换行符;\r
:会被处理为回车符; 其他不能识别的转移字符,则只是被识别为普通的字符: 比如\j
,会被处理为j这个字母本身; 反斜杠加g以及中括号内一个名字,即:\g
,对应着命了名的组,named group
第三个参数:stringstring
即表示要被处理,要被替换的那个string字符串。没什么特殊要说明。
第四个参数:count
举例说明:继续之前的例子,假如对于匹配到的内容,只处理其中一部分。比如对于:hello 123 world 456 nihao 7891只是像要处理前面两个数字:123,456,分别给他们加111,而不处理789,那么就可以写成:
replacedStr = re.sub("(?P\d+)", _add111, inputStr, 2);
第五个参数:flags
类似于管道,可以进行忽略大小写,全局匹配,ASCII,UNICODE匹配等
可选值:
"ASCII", "IGNORECASE", "LOCALE", "MULTILINE", "DOTALL", "VERBOSE", "UNICODE",
python实现忽略大小写替换高亮并显示之前的大小写
核心代码:
def show_highlight(key: str, origin: str) -> str:
"""字符串替换,忽略大小写,并返回以前的大小写"""
re_data = re.findall(key, origin, flags=re.IGNORECASE)
def tmp(obj):
for i in re_data:
if obj.group(0) == i: return '<span class="keyWord">' + i + '</span>'
return re.sub(key, tmp, origin, flags=re.IGNORECASE)
print(show_highlight('AND', 'AND and And AnD'))
测试结果:
<span class="keyWord">AND</span> <span class="keyWord">and</span> <span class="keyWord">And</span> <span class="keyWord">AnD</span>