爬虫入门

简要介绍：

1.用到的Python库：

requests: 主要用于获取网页结果

BeautifulSoup: 主要用于解析网页内容

2.简单例子：

import requests

url = "https://movie.douban.com/cinema/later/chengdu/"

response = requests.get(url)

print(response.content.decode('utf-8'))

from bs4 import BeautifulSoup

soup = BeautifulSoup(response.content.decode('utf-8'),'lxml')

all_movie = soup.find('div',id="showing-soon")

3.数据存储：

对于爬出到的数据可以选择保持到csv, txt等文件中

最后编辑于：2019.01.09 16:29:51

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

爬虫入门教程⑧— BeautifulSoup解析豆瓣即将上映的电影信息
Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器...
终可见丶阅读 24,315评论 94赞 109
Python爬虫入门（urllib+Beautifulsoup）
Python爬虫入门（urllib+Beautifulsoup）本文包括：1、爬虫简单介绍2、爬虫架构三大模块3...
廖少少阅读 13,347评论 0赞 6

Python爬虫入门 | 2 爬取豆瓣电影信息
这是一个适用于小白的Python爬虫免费教学课程，只有7节，让零基础的你初步了解爬虫，跟着课程内容能自己爬取资源。...
Python编程社区阅读 13,425评论 3赞 10
爬虫入门教程⑥—安装爬虫常用工具包
这是承前启后的一节，也是很有可能出错的一节，所以要认真跟着看哦。我们要安装的有 jupyter(简单方便的写代码...
终可见丶阅读 18,124评论 18赞 34
亲子日记第6篇晴3月10日
今天是星期六，儿子像上学一样很早就起床了，他说要先把作业完成，我们先阅读了一会课文，然后就开始写作业了！...
赵致远妈妈阅读 1,436评论 0赞 0

赞1赞

赞赏

手机看全文