登录注册写文章

爬虫学习_BeautifulSoup安装使用

爬虫学习_BeautifulSoup安装使用

BeautifulSoup是python爬虫中常用的库，它通过定位HTML标签来格式化和组织复杂的网络信息，用简单易用的Python对象为我们展现XML结构信息。

这篇文章是我在学习图书《Python 网络数据采集》的笔记。

《Python 网络数据采集》

1、安装BeautifulSoup

现在python3都用的是BeautifulSoup4，由于我使用的是anaconda，所以这些包就不用单独安装了。单独安装的方法为：
pip install BeautifulSoup4

2、爬取一个简单网页的标题

from urllib.request import urlopen
from bs4 import BeautifulSoup
html = urlopen("http://www.pythonscraping.com/pages/page1.html")
bsObj = BeautifulSoup(html.read())
print(bsObj.h1)

输出以下结果：
<h1>An Interesting Title</h1>

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Python爬虫学习手册
爬虫文章 in 简书程序员专题： like:128-Python 爬取落网音乐 like:127-【图文详解】py...
喜欢吃栗子阅读 22,018评论 4赞 411
Python学习笔记1：BeautifulSoup在网页爬虫上的简单运用
本篇文章是对Python爬虫入门学习视频： Python网络爬虫实战第5，6，7节内容的归纳。在这里，你会看到...
小暖冰2333阅读 745评论 1赞 3
Python 爬虫相关环境
一时兴起，想用 python 玩儿一下爬虫，顺便体验 python 这门语言。前言 Python 学习，推荐使用...
Deemons阅读 1,904评论 0赞 1
Python爬虫小白入门（三）BeautifulSoup库
一、前言上一篇演示了如何使用requests模块向网站发送http请求，获取到网页的HTML数据。这篇来演示如何...
阿里波特阅读 3,032评论 8赞 23
新手向爬虫（三）别人的爬虫在干啥
爬虫文章 in 简书程序员专题： like:128 - Python 爬取落网音乐 like:127 - 【图文详...
treelake阅读 29,588评论 33赞 638

赞1赞

赞赏

手机看全文