登录注册写文章

Python爬虫糗事百科热图源码

沉默寡言de靓仔

Python爬虫糗事百科热图源码

前言

生活索然无味，我们要留住快乐！

一、打开糗事百科热图

二、查看网页源码

代码

import requests
import re
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Safari/537.36'}
url="https://www.qiushibaike.com/imgrank/page/%d/"
for pagenum in range(1,5):
 new_url = format(url%pagenum)
 response = requests.get(url=new_url,headers=headers).text
 ex= '<div class="thumb">.*?<img src="(.*?)" alt.*?</div>'
 img_list = re.findall(ex,response,re.S)
 for pages in img_list:
  pages = "https:"+pages
  url1=pages
  response1=requests.get(url=url1,headers=headers).content
  filename =  pages.split('/')[-1]
  img_path="./图片/"+filename
  with open(img_path,"wb") as fp:
   fp.write(response1)
   print("爬取成功")

运行结果

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

python爬虫入门实战（一）---爬糗事百科初窥XPath
注：（此篇为切换Markdown编辑器调整了格式重发的……强迫症，原来用富文本编辑器写的太丑了）今天第一次尝试用...
王雨城阅读 5,906评论 4赞 13
Python爬虫—糗事百科
1.我们要抓取内容的加载方式 2.分页问题 3.选择解析库（通过框架scrapy/requests+Beautif...
TinyPiXOS阅读 4,396评论 3赞 7

【Python爬虫】正则爬取糗事百科
实验目的：获取糗事百科网页上的段子思路 1）分析各个页面间的网址规律，构造网址变量对应的网址：https://...
倔强的潇洒小姐阅读 4,079评论 2赞 0
表情管理
表情是什么，我认为表情就是表现出来的情绪。表情可以传达很多信息。高兴了当然就笑了，难过就哭了。两者是相互影响密不可...
Persistenc_6aea阅读 127,174评论 2赞 7
2019-11-28 173
16宿命：用概率思维提高你的胜算以前的我是风险厌恶者，不喜欢去冒险，但是人生放弃了冒险，也就放弃了无数的可能。 ...
yichen大刀阅读 11,292评论 0赞 4

1赞2赞

赞赏

手机看全文