正则表达式概述

正则表达式，又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法（英语：Regular Expression，在代码中常简写为regex、regexp或RE），是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。在很多文本编辑器里，正则表达式通常被用来检索、替换那些匹配某个模式的文本。

Regular Expression的“Regular”一般被译为“正则”、“正规”、“常规”。此处的“Regular”即是“规则”、“规律”的意思，Regular Expression即“描述某种规则的表达式”之意。

re模块操作

在Python中需要通过正则表达式对字符串进行匹配的时候，可以使用一个模块，名字为re

re模块的使用过程

# 导入re模块
import re

# 使用match方法进行匹配操作  re.match() 能够匹配出以xxx开头的字符串
result = re.match(正则表达式,要匹配的字符串)

# 如果上一步匹配到数据的话，可以使用group方法来提取数据
result.group()

re.match是用来进行正则匹配检查的方法，若字符串匹配正则表达式，则match方法返回匹配对象（Match Object），否则返回None（注意不是空字符串""）。匹配对象Macth Object具有group方法，用来返回字符串的匹配部分。

re模块示例

import re
result = re.match('neusoft','neusoft.com')
result.group()

输出 : 'neusoft'

表示字符

元字符	功能
.	匹配任意1个字符（除了\n）
[ ]	匹配[ ]中列举的字符
\d	匹配数字，即0-9
\D	匹配非数字，即不是数字
\s	匹配空白，即空格，tab键
\S	匹配非空白
\w	匹配单词字符，即a-z、A-Z、0-9、_
\W	匹配非单词字符

示例1:

import re

ret1 = re.match('.','a')
ret1.group()
# 返回 'a'

ret2 = re.match(".","b")
ret2.group()
# 返回 'b'

ret3 = re.match(".","M")
ret3.group()
# 返回'M'

示例2:

import re

# 如果hello的首字符小写，那么正则表达式需要小写的h
ret = re.match("h","hello Python")
ret.group()
#  返回'h'

# 如果hello的首字符大写，那么正则表达式需要大写的H
ret = re.match("H","Hello Python")
ret.group()
# 返回'H'

# 大小写h都可以的情况
ret = re.match("[hH]","hello Python")
ret.group()
#  返回'h'

ret = re.match("[hH]","Hello Python")
ret.group()
# 返回'H'

# 匹配0到9第一种写法
ret = re.match("[0123456789]","7Hello Python")
ret.group()
# 返回'7'

# 匹配0到9第二种写法
ret = re.match("[0-9]","7Hello Python")
ret.group()
# 返回'7'

示例3:

import re

# 普通的匹配方式
ret = re.match("嫦娥1号","嫦娥1号发射成功")
print ret.group()
# 返回'嫦娥1号'

# 使用\d进行匹配
ret = re.match("嫦娥\d号","嫦娥1号发射成功")
print ret.group()
# 返回'嫦娥1号'

ret = re.match("嫦娥\d号","嫦娥2号发射成功")
print ret.group()
# 返回'嫦娥2号'

ret = re.match("嫦娥\d号","嫦娥3号发射成功")
print ret.group()
# 返回'嫦娥3号'

最后编辑于：2018.10.08 13:46:37

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

正则表达式01