python实现忽略大小写替换高亮并显示之前的大小写

re.sub说明

re.sub的参数:有五个参数re.sub(pattern, repl, string, count=0, flags=0)
其中三个必选参数:pattern, repl, string
两个可选参数:count, flags

第一个:patternpattern

表示正则中的模式字符串。反斜杠加数字(\N),则对应着匹配的组(matched group) 比如\6,表示匹配前面pattern中的第6个group

第二个参数:replrepl

就是replacement,被替换,的字符串的意思。repl可以是字符串,也可以是函数。repl是字符串如果repl是字符串的话,其中的任何反斜杠转义字符,都会被处理的。即:\n:会被处理为对应的换行符;\r:会被处理为回车符; 其他不能识别的转移字符,则只是被识别为普通的字符: 比如\j,会被处理为j这个字母本身; 反斜杠加g以及中括号内一个名字,即:\g,对应着命了名的组,named group

第三个参数:stringstring

即表示要被处理,要被替换的那个string字符串。没什么特殊要说明。

第四个参数:count

举例说明:继续之前的例子,假如对于匹配到的内容,只处理其中一部分。比如对于:hello 123 world 456 nihao 7891只是像要处理前面两个数字:123,456,分别给他们加111,而不处理789,那么就可以写成:

replacedStr = re.sub("(?P\d+)", _add111, inputStr, 2);

第五个参数:flags

类似于管道,可以进行忽略大小写,全局匹配,ASCII,UNICODE匹配等
可选值:

"ASCII", "IGNORECASE", "LOCALE", "MULTILINE", "DOTALL", "VERBOSE", "UNICODE",

python实现忽略大小写替换高亮并显示之前的大小写

核心代码:

def show_highlight(key: str, origin: str) -> str:
    """字符串替换,忽略大小写,并返回以前的大小写"""
    re_data = re.findall(key, origin, flags=re.IGNORECASE)

    def tmp(obj):
        for i in re_data:
            if obj.group(0) == i: return '<span class="keyWord">' + i + '</span>'

    return re.sub(key, tmp, origin, flags=re.IGNORECASE)
print(show_highlight('AND', 'AND and And AnD'))
测试结果:
<span class="keyWord">AND</span> <span class="keyWord">and</span> <span class="keyWord">And</span> <span class="keyWord">AnD</span>
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • re模块手册 本模块提供了和Perl里的正则表达式类似的功能,不关是正则表达式本身还是被搜索的字符串,都可以...
    喜欢吃栗子阅读 4,050评论 0 13
  • 搞懂Python 正则表达式用法 Python 正则表达式 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一...
    厦热阅读 1,622评论 0 2
  • 类 !/usr/bin/python -- coding: UTF-8 -- class Employee:'所有...
    SkTj阅读 992评论 0 0
  • Python中的正则表达式(re) import rere.match #从开始位置开始匹配,如果开头没有则无re...
    BigJeffWang阅读 7,181评论 0 99
  • 《红楼梦》有一段中如下,宝玉道:“这些破荷叶可恨,怎么还不叫人来拔了去。”宝钗笑道:“今年这几日,何曾饶了这园子闲...
    虫鸣吹晚风阅读 587评论 0 1