调整字符串中文格式

实际案例

某软件的log文件,其中的日期格式为'yyyy-mm-dd':
  ......
  2016-05-23 10:59:26 ......
  2016-05-23 10:59:26 ......
  2016-05-23 10:59:26 ......
  2016-05-23 10:59:26 ......
  ......
我们想把其中的日期改为国外日期的格式'mm/dd/yyyy',即'2016-05-23'=>'05/23/2016',应如何处理?

解决方案:使用正则表达式re.sub()方法做字符串替换,利用正则表达式的捕获组,捕获每个部分内容,在替换字符串中调整各个捕获组的顺序。该方法代码如下:

# -*- coding: utf-8 -*-

import re

f = open('log.txt').read()

print re.sub('(\d{4})-(\d{2})-(\d{2})', r'\2/\3/\1', f)

其运行结果如下:

05/23/2016 10:59:26 ......                   
05/23/2016 10:59:26 ......            
05/23/2016 10:59:26 ......                   
05/23/2016 10:59:26 ......       
05/23/2016 10:59:26 ......                   
05/23/2016 10:59:26 ......              
05/23/2016 10:59:26 ......

其中log.txt文件的内容如下:

2016-05-23 10:59:26 ......                   
2016-05-23 10:59:26 ......            
2016-05-23 10:59:26 ......                   
2016-05-23 10:59:26 ......       
2016-05-23 10:59:26 ......                   
2016-05-23 10:59:26 ......              
2016-05-23 10:59:26 ......                       

在代码中,我们根据每个捕获组进行编号,然后按照编号调整捕获组内字符串的格式。除此之外,我们还能对每个捕获组进行命名,然后按照名字调整捕获组内的字符串的格式,其代码如下:

print re.sub('(?P<year>\d{4})-(?P<month>\d{2})-(?P<day>\d{2})', r'\g<month>/\g<day>/\g<year>', f)

其输出结果为:

05/23/2016 10:59:26 ......                   
05/23/2016 10:59:26 ......            
05/23/2016 10:59:26 ......                   
05/23/2016 10:59:26 ......       
05/23/2016 10:59:26 ......                   
05/23/2016 10:59:26 ......              
05/23/2016 10:59:26 ......
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容