通用Python网络爬虫框架

#!/usr/bin/env python
# encoding:utf-8

import requests

def getContent(url):
    try:
        response = requests.get(url)
        response.raise_for_status()
        response.encoding = response.apparent_encoding
        return response.text
    except Exception, e:
        return str(e)

def main():
    url = "http://www.jianshu.com/"
    print getContent(url)

if __name__ == "__main__":
    main()

最后编辑于：2017.12.06 01:41:37

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

python网络爬虫—爬取网页的通用代码框架及HTTP协议【2】
-Modest_Proud- 一、爬取网页的通用代码框架首先，我们使用Requests库进行网页访问的时候，经...
Modest_Proud阅读 5,713评论 1赞 4
Python网络爬虫（六）- Scrapy框架
目录： Python网络爬虫（一）- 入门基础[https://www.jianshu.com/p/9dfbe35...
一只写程序的猿阅读 10,991评论 0赞 20

Python爬虫（概念通用爬虫和聚焦爬虫）
Python基础语法学习（基础知识）HTML页面的内容抓取（数据抓取）HTML页面的数据提取（数据清洗）Scrap...
彡廿阅读 8,763评论 0赞 1
《Python网络爬虫》1.1 第一个Python网络爬虫
By 一页编程今天我们来学习开发第一个Python网络爬虫。获得一个网页最简单的一行代码就是：这里边，我们通...
一页编程阅读 5,359评论 0赞 4
极简生活从当下开始🔟
今早亲爱的生活群里，简又带领大家开始整理家，太喜欢这个群了，就是用没时间跟上，整理需要断舍离，看了她们发的照片文章...
小满xm阅读 1,288评论 0赞 0

友情链接更多精彩内容

赞1赞

赞赏

手机看全文