爬虫入门

参考博客:爬虫入门系列


简要介绍:

1.用到的Python库:

requests: 主要用于获取网页结果

BeautifulSoup: 主要用于解析网页内容

2.简单例子:

import requests

url = "https://movie.douban.com/cinema/later/chengdu/"

response = requests.get(url)

print(response.content.decode('utf-8'))

from bs4 import BeautifulSoup

soup = BeautifulSoup(response.content.decode('utf-8'),'lxml')

all_movie = soup.find('div',id="showing-soon")

3.数据存储:

对于爬出到的数据可以选择保持到csv, txt等文件中

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容