爬虫模板

#所需要的环境
#控制台输入
#pip install requests
#pip install beautifulsoup4
#!/usr/bin/env python 
# -*- coding:utf-8 -*-
from bs4 import BeautifulSoup
import requests

link = "https://maoyan.com/"
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36'
}

resp = requests.get(link,headers=headers)
resp.encoding = "utf-8"
resp = resp.text
soup = BeautifulSoup(resp,"lxml")
#======link里面填网址======上面代码不要动!===========
getdata = soup.select("")#填想要获取元素结点的路径，class是.  id是# 标 签不处理

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

爬虫模板1
TheoKm阅读 3,579评论 0赞 1
Scrapy中的crawl爬虫模板笔记
首先分析官网上给出的示例代码：疑问：1.Rule.LinkExtractor能不能直接使用xpath进行过滤Li...
ultimateYu阅读 5,632评论 0赞 0

python爬虫学习之路，为老婆爬下整站模板-第一章
老婆是影楼做后期的，经常要下载模板，看老婆点开86ps.com网站，一个一个点，然后找下载地址，这过程真是麻烦，既...
closefrien_d1c2阅读 3,909评论 0赞 0
8.CrawlSpider（增量模板爬虫）
创建爬虫时，需要用scrapy genspider -t crawl 爬虫名域名例如：本例子 scrapy ge...
学飞的小鸡阅读 2,286评论 0赞 0
面朝大海，春暖花开
从明天起，做一个幸福的人喂马，劈柴，周游世界从明天起，关心粮食和蔬菜我有一所房子，面朝大海，春暖花开从明天...
LoveDying阅读 3,392评论 0赞 0

赞1赞

赞赏

手机看全文