常用正则表达式

  • 身份证号码: [1-9]\d{14}(\d{2}[0-9x])?

  • 网页中的超链接: <a\s[\s\S]+?</a>

  • 正则表达式匹配表格:

for table in re.findall(r'<table[\s>][\s\S]+?</table>', htmlsource):
    for tr in re.findall(r'<tr[\s>][\s\S]+?</tr>', table):
        for td in re.findall(r'<td[\s>][\s\S]+?</td>', tr):
            print td,
        print ''

  • E-mail地址匹配: ^[-\w.]{0,64}@([-\w]{1,63}\.)*[-\w]{1,63}$
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容