Python正则表达式匹配分组

字符 功能
| 匹配左右任意一个表达式
(ab) 将括号中字符作为一个分组
\num 引用分组num匹配到的字符串
(?P<name>) 分组起别名
(?P=name) 引用别名为name分组匹配到的字符串

匹配1-100之间数字

# -*- coding: utf-8 -*-
# @Time    : 2019/10/4 17:48
# @Author  : 币行者
# @Email   : xypip@qq.com
# @File    : tetst6.py

import re

ret = re.match("[1-9]?\d$","08")
if ret:
    print(ret.group())
else:
    print("不在0-100之间")
ret = re.match("[1-9]?\d$|100","100")
print(ret.group())

()使用方法

# -*- coding: utf-8 -*-
# @Time    : 2019/10/6 22:38
# @Author  : 币行者
# @Email   : xypip@qq.com
# @File    : 正则表达()分组.py

import re

ret = re.match("\w{4,20}@163\.com", "xingzhe@163.com")
print(ret.group())

ret = re.match("\w{4,20}@(163|126|qq)\.com", "xingzhe@126.com")
print(ret.group())

ret = re.match("\w{4,20}@(163|126|qq)\.com", "xingzhe@qq.com")
print(ret.group())

不以4或7结尾的手机号

首位以1开头,中间10位数字任意,末位不是4或7

# -*- coding: utf-8 -*-
# @Time    : 2019/10/6 22:53
# @Author  : 币行者
# @Email   : xypip@qq.com
# @File    : 手机号码匹配.py

import re

tels = [
    "13062617783",
    "123456",
    "13844456784"
]

for tel in tels:
    ret = re.match("1\d{9}[0-35-68-9]", tel)
    if ret:
        print(ret.group())
    else:
        print("%s不是符合条件的手机号" % tel)

正则表达式是一种通用的字符串处理方法,Python引入re模块,可以快速处理匹配我们需要的信息,正则表达式语法众多,高手玩到炉火纯青可以随心所欲且使用高级的匹配方式,对于我们大多数人以及行者本人并非在编程一线行业,因此,写代码纯粹是满足个人需要,简化我们流程提高我们的效率,本来开始使用Python爬虫获取简书专题的所有文章和对应链接,但是,经过爬取实践时发现,lxml只能解析到前10篇文章,将专题的网页下载下来分析发现,只有我们将专题拉到尾部全部加载出来下载才可以获得全部网页源代码,也是出于安全性,防止被简书后台发现,所以使用正则表达进行匹配,服务器就不会获取爬虫信息,几乎任何领域,20%的知识可以解决掉80%的问题,我的平时工作就是教计算机编程,教算法竞赛,所以也利用编程基础完成一些自动化脚本的创建。至于爬虫问题,当我有时间会深入了解一下,破解这个只能够爬取前10篇文章信息的问题。编程的价值,我一直认为,能够应用于我们的生活就是价值。

系列文章

Python正则表达式基础
Python正则表达式匹配开头结尾

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 在使用爬虫爬取数据,或者做数据挖掘和分析的时候我们经常会使用到正则表达式, 在Python中使用正则需要导入re包...
    MasterXiao阅读 1,961评论 0 3
  • 正则表达式、re模块、匹配单个字符、匹配多个字符、匹配开头结尾、匹配分组、re模块的高级用法、python贪婪和非...
    Cestine阅读 1,553评论 0 1
  • 北方交通大学信息科学研究所 北京科技大学矿业研究所 北京林业大学林业研究所 北京师范大学北京市辐射中心 北京市计量...
    十年一井阅读 1,128评论 0 0
  • 从6.7版本开始,Kibana支持中文,无需再像之前那样下载汉化包,甚至自己进行翻译。 设置方法很简单,下面用7....
    右丶羽阅读 7,813评论 0 1
  • 《十月围城》这部剧一如著名剧作家刘和平所说,是一部具有中国内在文化形态的作品,是区别于某些以韩国、美国文化形态为内...
    Samuel1995阅读 528评论 0 0