实际案例
某软件的log文件,其中的日期格式为'yyyy-mm-dd':
......
2016-05-23 10:59:26 ......
2016-05-23 10:59:26 ......
2016-05-23 10:59:26 ......
2016-05-23 10:59:26 ......
......
我们想把其中的日期改为国外日期的格式'mm/dd/yyyy',即'2016-05-23'=>'05/23/2016',应如何处理?
解决方案:使用正则表达式re.sub()方法做字符串替换,利用正则表达式的捕获组,捕获每个部分内容,在替换字符串中调整各个捕获组的顺序。该方法代码如下:
# -*- coding: utf-8 -*-
import re
f = open('log.txt').read()
print re.sub('(\d{4})-(\d{2})-(\d{2})', r'\2/\3/\1', f)
其运行结果如下:
05/23/2016 10:59:26 ......
05/23/2016 10:59:26 ......
05/23/2016 10:59:26 ......
05/23/2016 10:59:26 ......
05/23/2016 10:59:26 ......
05/23/2016 10:59:26 ......
05/23/2016 10:59:26 ......
其中log.txt文件的内容如下:
2016-05-23 10:59:26 ......
2016-05-23 10:59:26 ......
2016-05-23 10:59:26 ......
2016-05-23 10:59:26 ......
2016-05-23 10:59:26 ......
2016-05-23 10:59:26 ......
2016-05-23 10:59:26 ......
在代码中,我们根据每个捕获组进行编号,然后按照编号调整捕获组内字符串的格式。除此之外,我们还能对每个捕获组进行命名,然后按照名字调整捕获组内的字符串的格式,其代码如下:
print re.sub('(?P<year>\d{4})-(?P<month>\d{2})-(?P<day>\d{2})', r'\g<month>/\g<day>/\g<year>', f)
其输出结果为:
05/23/2016 10:59:26 ......
05/23/2016 10:59:26 ......
05/23/2016 10:59:26 ......
05/23/2016 10:59:26 ......
05/23/2016 10:59:26 ......
05/23/2016 10:59:26 ......
05/23/2016 10:59:26 ......