每天一个小Demo-Python爬虫图片简单抓取

    本人主要是做Android开发,业余时间学习Python语言,喜欢以项目开发作为学习过程,所以把自己所学习的和自己理解的知识分享出来,希望能给同样学习Python语言的朋友一些帮助,有错误的地方也请及时提出,我会做出修改。

    今天给大家分享的是一个简单的图片爬去Demo,涉及到一些简单的知识,如果有不明白的地方可以给我留言,或者自行百度,Python版本3.6。

import urllib.request

import urllib.error

#正则表达式库

import re

#定义爬取单个页面函数

def carw(url, page):

# 打开网页并读取

html_info = urllib.request.urlopen(url).read()

# 转换成字符串

html_info = str(html_info)

# 含有图片信息筛选的正则表达式

pat_one = '.+?'

# 进行匹配过滤,得到信息列表

result = re.compile(pat_one).findall(html_info)

#取出信息字符串,只有一个元素

result = result[0]

#含有图片地址筛选的正则,

pat_two = '

#得到图片地址列表

image_list = re.compile(pat_two).findall(result)

# 循环下载存储

x = 1

for image_url in image_list:

# 设置文件名称和格式

image_name = "E:/image/" + str(page) + str(x) + ".jpg"

try:

# 存储文件

urllib.request.urlretrieve(image_url, image_name)

# 处理异常

except urllib.error.URLError as e:

if hasattr(e, "code"):

x += 1

if hasattr(e, "reason"):

x += 1

x += 1

# 主循环程序

for i in range(1, 5):

url = "http://m.ivsky.com/tupian/ziranfengguang/index_" + str(i) + ".html"

carw(url, i)

代码很简单,就是一些基本库的应用,可以多练习几个网站图片的抓取,有利用我们理解爬虫的基本原理,谢谢大家!

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 前言 最先接触编程的知识是在大学里面,大学里面学了一些基础的知识,c语言,java语言,单片机的汇编语言等;大学毕...
    oceanfive阅读 3,329评论 0 7
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 136,331评论 19 139
  • 大家好,上次我们实验了爬取了糗事百科的段子,那么这次我们来尝试一下爬取百度贴吧的帖子。与上一篇不同的是,这次我们需...
    追不到的那缕风阅读 662评论 0 0
  • 宁风已经吹响,战争前夕中的交响曲于树林中回荡。建筑间呼啸的风带过,大有风雨欲来之势。 本是白天可现在竟好似笼了一层...
    李珏J阅读 283评论 0 0
  • 今天我看了一部很好看的动画片名字叫《礼物》,这个男孩是个残疾人,每天沉浸在游戏里,也不出去玩。有一天妈妈送给小男孩...
    Louise75阅读 451评论 0 1

友情链接更多精彩内容