非教程——仅供参考
以下内容只说明在Python
中如何使用正则表达式,对正则表达式本身不再说明,如果想了解正则表达式的话,可以参考这里。
模块的函数 | 功能 |
---|---|
compile(pattern[, flags]) | 对正则表达式模式pattern进行编译,flags是可选标识符,并返回一个regex对象 |
search(pattern, string[, flags]) | 在字符串string中搜索正则表达式模式pattern第一次出现,如果匹配成功,则返回一个匹配对象;否则返回None |
match(pattern, string[, flags]) | 用正则表达式模式pattern匹配字符串string,如果匹配成功,则返回一个匹配对象,否则返回None |
findall(pattern, string[, flags]) | 在字符串string中搜索正则表达式模式pattern的所有(非重复)出现;返回一个匹配对象的列表 |
finditer(pattern, string[, flags]) | 和findall()相同,但返回的不是列表而是迭代器;对于每个匹配,该迭代器返回一个匹配对象 |
split(pattern, string[, maxsplit=0, flags=0]) | 根据正则表达式pattern中的分隔符把字符string分割为一个列表,返回成功匹配的列表,最多分割max次(默认分割所有匹配的地方) |
sub(pattern, repl, string[, count, flags]) | 把字符串string中所有匹配正则表达式pattern的地方替换成字符串repl,如果max的值没有给出,则对所有匹配的地方进行替换 |
subn(pattern, repl, string[, count, flags]) | 跟sub相同,但返回一个包含替换次数的元组tuple (new_string, number_of_subs_made). |
匹配对象的函数 | 功能 |
group([group1, ...]) | 返回全部或部分匹配对象 |
groups([default]) | 返回包含所有匹配对象的元组 |
以下是一个简单的示例文件:
import re
#compile()用法示例
pattern='bat|bet|bit'
prog = re.compile(pattern)
result = prog.match('bat')
result = re.match(pattern, 'bat')
if result is not None:
print(result.group())
#macth()用法示例
m=re.match('foo','foo')#模式匹配字符串
if m is not None: #如果成功,显示匹配
print ('匹配成功')
print (m.group())
else:
print ('匹配失败')
m=re.match('foo','sfoo')#模式匹配字符串
if m is not None: #如果成功,显示匹配
print ('匹配成功')
print (m.group())
else:
print ('匹配失败')
#search()用法示例
m=re.search('foo','sfoo')#模式匹配字符串
if m is not None: #如果成功,显示匹配
print ('搜索成功')
print (m.group())
else:
print ('搜索失败')
#split()用法示例
m=re.split('\W+', 'Words, words, words.')
print(m)#['Words', 'words', 'words', '']
m=re.split('(\W+)', 'Words, words, words.')
print(m)#['Words', ', ', 'words', ', ', 'words', '.', '']
m=re.split('\W+', 'Words, words, words.', 1)
print(m)#['Words', 'words, words.']
m=re.split('[a-f]+', '0a3B9', flags=re.IGNORECASE)
print(m)#['0', '3', '9']
#findall()用法示例
m=re.findall('car', 'carry the barcardi to the car')
print(m)#['car', 'car', 'car']
#sub()用法示例
m=re.sub('car','plane', 'carry the barcardi to the car')
print(m)#planery the barplanedi to the plane
鉴于正则表达式本身是块非常庞大的知识块,所以本文只是简单介绍了python中使用正则表达式去匹配字符串的方法,要想熟练使用这些方法,主要还是得先对正则表达式有一定的了解。