python爬虫常用库介绍

python自带urllib、re

requests 用于发送request并接受response

selenium 用于驱动浏览器，一些JS渲染的网页用requests不能正常获取，要用这个来模拟浏览器，获得渲染后的网页内容。

selenium需要配合chrome driver或phantomjs使用。前面的会驱动一个chrome浏览器，后面的是一个无界面浏览器。

lxml 提供了xpath解析方式

beautifulsoup4 依赖于lxml，也用于网页解析

pymysql 用于操作mysql数据库

pymongo 用于操作mongoDB数据库

redis 用于操作redis数据库

flask 是一个web框架，用于代理信息的获取和存储

django 一个web框架，用于做一个管理系统，管理分布式爬虫和主机信息

Python--Flask Django等常用库总结
# Python 资源大全中文版我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列...
aimaile阅读 26,616评论 6赞 427
Python常用库总结
Python 资源大全中文版我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列的资...
叶同学阅读 11,234评论 0赞 73
走进心里，继而走出世界
微信“朋友圈是”可以关闭的，于是我把它关闭了。圈里有很多“诱惑”，以至于不能自已，忘却自己，过去与未来。内功不够，...
蓝羿阅读 119评论 0赞 0
不规则动词过去式and过去分词
一、A—A—A型,即原形、过去式和过去分词三者都相同.（共9个） cost—cost—cost cut—cut—c...
白发佛阅读 4,759评论 0赞 1
湖风轻柔地安抚
湖风轻柔地安抚唐星河湖面像巨大且会翻涌的翡翠头顶有被涂抹上水墨色的云层感觉就要袭来一场急雨好...
唐星河阅读 191评论 0赞 2

1赞2赞

赞赏

手机看全文