登录注册写文章

【Python爬虫实战】为何如此痴迷Python？还不是因为爱看小姐姐图

悦悦学Python

【Python爬虫实战】为何如此痴迷Python？还不是因为爱看小姐姐图

爬取目标

网址:绝对领域

工具使用

开发环境：win10、python3.7

开发工具：pycharm、Chrome

工具包：requests，lxml

项目思路解析

选取你对应的图片分类

根据分类信息提取到没有图片的超链接，提取出A标签的跳转地址以及图片的标题名字

def get_url(start_url):

response = requests.get(start_url, headers=headers).text

data = etree.HTML(response)

new_url = data.xpath('//div[@class="post-module-thumb"]/a/@href')

for url in new_url:

yield url

进入详情页面，xpath提取详情页面所有的图片地址：

发送图片数据请求，保存对应图片数据信息

简易源码分享：

import requests

from lxml import etree

headers = {

"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64)

AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88

Safari/537.36"

}

def get_url(start_url):

response = requests.get(start_url, headers=headers).text

data = etree.HTML(response)

new_url = data.xpath('//div[@class="post-module-thumb"]/a/@href')

for url in new_url:

yield url

def get_img(url):

response = requests.get(url, headers=headers).text

img_data = etree.HTML(response)

img_url = img_data.xpath('//div[@class="entry-content"]/img/@src')

for img_url in img_url:

name = img_url.split("/")[-2] + img_url.split("/")[-1]

result = requests.get(img_url).content

with open("图片/" + name, "wb")as f:

f.write(result)

print("正在下载", name)

if __name__ == '__main__':

for i in range(1, 3):

start_url = "https://www.jdlingyu.com/tuji/hentai/gctt/page/{}".format(i)

html_url = get_url(start_url)

for url in html_url:

get_img(url)

总结

我是悦悦，一名喜欢分享知识的程序媛，感兴趣的就赶紧来点击关注我叭~哪里有不明白或有不同观点的地方欢迎留言！

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

Python-爬虫实战练习
爬虫前期准备 01 爬虫就是模拟浏览器抓取东西，爬虫三部曲：数据爬取、数据解析、数据存储数据爬取：手机端、pc端...
芝麻小叮当阅读 533评论 0赞 0
抓取网站音频
要求：抓取喜马拉雅音频存储到本地D:\temp_ximalaya_audio，并按节目和章节分类存储。特殊说明：...
流星一剑阅读 858评论 0赞 1

Python让斗图飞起来
最近跟着视频公开课的老师学习了简单的爬虫，学习过程中除了学到一些比较有趣的技术，还接触到一些以前不知道的但是很有意...
叹稀奇strange阅读 1,298评论 0赞 0
张艺谋要在电影院开“画展”，预告片孙俪都是戏，关晓彤可期待！
今天青石的票圈出镜率最高的，莫过于张艺谋的新片终于定档了。一张满溢着水墨风的海报一次次的出现在票圈里，也就是老谋...
青石电影阅读 10,655评论 1赞 2
初识jQuery之jQuery设计思想（一）
一、jQuery简介 JQ是JS的一个优秀的库，大型开发必备。在此，我想说的是，JQ里面很多函数使用和JS类似，所...
Welkin_qing阅读 12,658评论 1赞 6

友情链接更多精彩内容

赞1赞

赞赏

手机看全文