基本的正则表达式

常用符号

Paste_Image.png

常用方法

findall:匹配所有符合规律的内容,返回列表
search:匹配第一个符合规律的内容,返回正则表达式对象
sub:替换内容,返回替换后的值(替换页码)

picdownloader.py

#-*-coding:utf8-*-
import re
import requests

#读取源代码文件
f = open('source.txt','r')
html = f.read()
f.close()

#匹配图片网址
pic_url = re.findall('img src="(.*?)" class="lessonimg"',html,re.S)
i = 0
for each in pic_url:
    print 'now downloading:' + each
    pic = requests.get(each)
    fp = open('pic\\' + str(i) + '.jpg','wb')
    fp.write(pic.content)
    fp.close()
    i += 1

20161204补充:

匹配 以@为中心,返回能够找到左右两边有相同字符的字符串

(?=pattern) 正向预查,在任何匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如,'Windows (?=95|98|NT|2000)' 能匹配 "Windows 2000" 中的 "Windows" ,但不能匹配 "Windows 3.1" 中的 "Windows"

http://www.blogjava.net/mstar/archive/2008/03/14/186377.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 本章概要:PyCharm的安装与配置正则表达式符号与方法正则表达式的应用举例实例--制作文本爬虫 1、PyChar...
    LuCh1Monster阅读 612评论 0 2
  • re模块手册 本模块提供了和Perl里的正则表达式类似的功能,不关是正则表达式本身还是被搜索的字符串,都可以...
    喜欢吃栗子阅读 4,213评论 0 13
  • 本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例...
    Python程序媛阅读 1,472评论 0 22
  • 旧历三月艳阳天。十九年前,你来到这世间,引来一阵喧哗。 你安静地躺着,睫毛遮盖恬静的小脸,想为你拈点脂粉,捧于手掌...
    逗逗逗酱阅读 1,170评论 0 51
  • 大家都说现在的生意不好做,大量的工厂、实体店倒闭,但有没有可能只是我们自己的生意不好做,有些人的生意还是挺好做的。...
    百分百努力阅读 249评论 0 0

友情链接更多精彩内容