python通过正则分割字符串

import re

p = re.compile(r'\d+')
print p.split('one1two2three3four4')
import re
re_han = re.compile(ur"([\u4E00-\u9FA5]+)")
sentence="工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的安装工作"
blocks = re_han.split(sentence)

这里有一个特点:
如果r的""内加()的话,它会把所有的内容都分出来,如['one', '1', 'two', '2', 'three', '3', 'four', '4', '']

如果r的""内不加()的话,它会以指定的类型作为分割,并不包含指定的类型。如['one', 'two', 'three', 'four', '']

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容