登录注册写文章

xpath的练习与模仿1

名字就起八个字吧

xpath的练习与模仿1

# -*- coding: utf-8 -*-

"""

Created on Sat Apr 14 10:28:35 2018

@author: Administrator

"""

global pic_link

#pic_link=[]

import requests

#import random

from lxml import etree

def load_image(url):

headers={"User-Agent":"Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:45.0) Gecko/20100101 Firefox/45.0"}

html=requests.get(url,headers=headers)

content=etree.HTML(html.text)

link=content.xpath('//*[@id="bigpicpic"]/@src',stream=True)

return str(link[0])

def save_image(pic_link,i):

with open('D:/python/python_work/CSDN/pic_{}.gif'.format(i),'wb') as f:

picture=requests.get(pic_link).content

f.write(picture)

if __name__=='__main__':

for i in range (1, 21):

url='http://photo.hupu.com/p10087-{}.html'.format(i)

tail=load_image(url)

pic_link='http:'+tail

save_image(pic_link,i)

最近在学XPATH，随便模仿写了段爬虎扑搞笑图片的代码。

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Spring Cloud
Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具（例如配置管理，服务发现，断路器，智...
卡卡罗2017阅读 135,242评论 19赞 139
python爬虫里信息提取的核心方法: Beautifulsoup Xpath 正则表达式
20170531 这几天重新拾起了爬虫，算起来有将近5个月不碰python爬虫了。对照着网上的程序和自己以前写的...
八神苍月阅读 14,288评论 3赞 44
一小时入门 Python 3 网络爬虫
声明：本文讲解的实战内容，均仅用于学习交流，请勿用于任何商业用途！一、前言强烈建议：请在电脑的陪同下，阅读本文...
Bruce_Szh阅读 12,841评论 6赞 28
Python--Flask Django等常用库总结
# Python 资源大全中文版我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列...
aimaile阅读 26,634评论 6赞 427
无题
本周太忙，实在无暇写出太多的文字，只能用本周的生活刷一下存在感～周一早晨，经历了混世魔王一晚上的吵闹，无法安然睡...
安可的多多洛阅读 128评论 1赞 1

赞1赞

赞赏

手机看全文