1.爬虫入门_爬取html网页

1.开发环境python2.7

2.爬取贴吧页面代码实现

# -*- coding:utf-8 -*-
"""
    爬取python贴吧网页
"""

# 引入需要的模块
import urllib2

# python吧第一页的url地址
url = "http://tieba.baidu.com/f?kw=download_file&ie=utf-8&pn=0 "

# 获取
response = urllib2.urlopen(url)

# 将获取到的内容赋值给content变量
content = response.read()
print content

with open("python_1.html", "w") as f:
    f.write(content)

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Android - 收藏集
Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
passiontim阅读 175,327评论 25赞 709
来自静坐以后的改变
去年九月份的时候遇到了杨老师，在跟了几次课程以后开始坚持静坐，后来逐渐的爱上静坐。每当身体疲惫，心情波澜的时候都用...
果子ll扶阳养生ll阅读 3,290评论 0赞 0

带着太多的压力在学习
大宝的数学老师打来电话说：“煜涵妈妈，我一直以为煜涵没人管所以才学习总是退步，今天问了成老师说妈妈在管她，哪为什么...
我们皆好阅读 2,224评论 0赞 0
2016-2017年终总结——who are you
认清自己
Doremifasou阅读 1,716评论 0赞 0
为TextView添加一个边框的几种办法
方法一：比较土，加背景图片，透明的带边框的背景图片设置到android:background就可以方法二：...
sun_wenming阅读 11,295评论 0赞 0

赞1赞

赞赏

手机看全文