#!/usr/bin/env python
# encoding:utf-8
import requests
def getContent(url):
try:
response = requests.get(url)
response.raise_for_status()
response.encoding = response.apparent_encoding
return response.text
except Exception, e:
return str(e)
def main():
url = "http://www.jianshu.com/"
print getContent(url)
if __name__ == "__main__":
main()
通用Python网络爬虫框架
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
推荐阅读更多精彩内容
- -Modest_Proud- 一、爬取网页的通用代码框架 首先,我们使用Requests库进行网页访问的时候,经...
- 目录: Python网络爬虫(一)- 入门基础[https://www.jianshu.com/p/9dfbe35...
- By 一页编程 今天我们来学习开发第一个Python网络爬虫。获得一个网页最简单的一行代码就是: 这里边,我们通...