正则表达式(二)

例1

import re

a= 'pytho0python1pythonn2'

r= re.findall('python*',a)

r1= re.findall('python{1,2}?',a)

r2= re.findall('python?',a)

r3= re.findall('python{1,2}',a)

print(r)

print(r1)

print(r2)

print(r3)


给定一个字符串,然后按要求从里面检索出Python。

其中,「*」表示匹配*前面的字符零次或无限次;

      「+」表示匹配+前面的字符1次或无限多次;

      「?」表示匹配?前面的字符0次或1次,这里需要注意的是,在代码中打印r2结果出现了2个Python,这是由于?具有去重的功能。


例2:边界匹配

import re

# qq = '100001'

qq= '100000001'

#验证qq号是否符合4-8位

r= re.findall('^\d{4,8}$',qq)

r1= re.findall('000',qq)

# 如果在开头加入^,不能匹配,字符串开头是1;在末尾加上$,不能匹配,最后的字母必须是000

print(r)

print(r1)


应用场景,验证QQ号是否符合4-8位。

如果符合就打印出结果,否则就打印出[]。但是,通过这行代码,会出现一个问题,当QQ号有九位时,也会打印出前八位的结果,为了防止出现这种错误的结果,我们将上述代码修正为

r= re.findall('^\d{4,8}$',qq)

正则表达式中,「^」和「$」就是边界匹配,前者表示从字符串开头开始匹配,后者则从字符串末尾开始匹配,这样当给出的QQ号超出需要验证的范围时,就会打印出[]。

继续看上面代码,打印r1时会出现

['000','000']

这是因为Python的分组机制,字符串中间有7个0,Python会自动分成2组,如果我们在正则表达式前面加「^」,则会打印出[],这是因为「^」从开头开始匹配,但是开头第一个字符是1,当检索出是1时,就自动停止了匹配,从而打印出[]。同样的,如果在正则表达式末尾加「$」,也会出现[]。

例3:组

import re

a= 'pythonpythonpythonpythonpython'

r= re.findall('(python){3}',a)#Python在正则表达式重复的表示出来

print(r)


检索出字符串中所有的Python,当考虑检索Python的次数上升到很大的数量级时,我们需要这样定义正则表达式。

一个括号表示1组,后面{}的数量词表示重复的次数。

最后,Python的[]和()表示的含义是不一样的,通过前面的学习我们也知道,[]表示或关系,()表示且关系。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • Python中的正则表达式(re) import rere.match #从开始位置开始匹配,如果开头没有则无re...
    BigJeffWang阅读 7,520评论 0 99
  • 正则表达式(二) re模块(regex) python中没有正则表达式的函数,需要引入内置的re模块 re模块方法...
    AndroidCat阅读 403评论 0 0
  • `>本文是 Jan Goyvaerts 为 RegexBuddy 写的教程的译文,版权归原作者所有 在本文中讲述了...
    极客圈阅读 2,201评论 0 5
  • 搞懂Python 正则表达式用法 Python 正则表达式 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一...
    厦热阅读 1,735评论 0 2
  • 正则表达式、re模块、匹配单个字符、匹配多个字符、匹配开头结尾、匹配分组、re模块的高级用法、python贪婪和非...
    Cestine阅读 1,737评论 0 1

友情链接更多精彩内容