登录注册写文章

【Python爬虫】糗百-文字版块

【Python爬虫】糗百-文字版块

**糗百-文字版块
https://www.qiushibaike.com/text/
爬取作者信息(头像/昵称/性别/年龄)
帖子内容,好笑数,评论数

自己爬取的源码

#__author:'cuiwnehao'__
#coding:utf-8
from bs4 import BeautifulSoup
import requests
url='https://www.qiushibaike.com/text/'
req=requests.get(url)
req.encoding='utf-8'
html=req.text
soup=BeautifulSoup(html,'lxml')
infos=soup.find_all('div',class_="article")
#print(len(article))
for info in infos:
    zuozhe=info.h2.text
    #print(zuozhe)
    neirong=info.span.text
    #print(neirong)
    haoxiaoshu=info.find('i').text
    #print(haoxiaoshu)
    pinglunshu = info.find('span',class_='stats-comments').find('i').text
    #print(pinglunshu)

    print(zuozhe)
    print(neirong)
    print(haoxiaoshu)
    print(pinglunshu)
    print("------------------------------------------------------")

最后编辑于：2017.12.10 09:13:20

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

使用python爬取糗百段子
博主CSDN昵称：守护者ly，欢迎大家前去指点最近在自学Python爬虫，写了一个小demo，前来现学现卖!感谢大...
龙腾九天ly阅读 4,189评论 0赞 1
Android - 收藏集
Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
passiontim阅读 175,633评论 25赞 709

Python爬虫—糗事百科
1.我们要抓取内容的加载方式 2.分页问题 3.选择解析库（通过框架scrapy/requests+Beautif...
TinyPiXOS阅读 4,396评论 3赞 7
任蓉➕赵玲班➕第一周第5次作业
片段选自高琳的职场实用指南《职得》，高琳是一个有20多年世界500强公司工作经验的一个女士。她致力于跨文化沟通及领...
任一一11阅读 2,507评论 2赞 1
分享就是一切（sharing is everything）－－行动宣言
1. 分享就是一切大二的时候上综英课（综合英语），老师给我们放了一段纪录片－－《home》（家园），里面有句台词...
塔塔塔塔塔塔塔阅读 4,535评论 3赞 1

赞1赞

赞赏

手机看全文