【Python爬虫】糗百-文字版块

**糗百-文字版块
https://www.qiushibaike.com/text/
爬取作者信息(头像/昵称/性别/年龄)
帖子内容,好笑数,评论数

自己爬取的源码

#__author:'cuiwnehao'__
#coding:utf-8
from bs4 import BeautifulSoup
import requests
url='https://www.qiushibaike.com/text/'
req=requests.get(url)
req.encoding='utf-8'
html=req.text
soup=BeautifulSoup(html,'lxml')
infos=soup.find_all('div',class_="article")
#print(len(article))
for info in infos:
    zuozhe=info.h2.text
    #print(zuozhe)
    neirong=info.span.text
    #print(neirong)
    haoxiaoshu=info.find('i').text
    #print(haoxiaoshu)
    pinglunshu = info.find('span',class_='stats-comments').find('i').text
    #print(pinglunshu)

    print(zuozhe)
    print(neirong)
    print(haoxiaoshu)
    print(pinglunshu)
    print("------------------------------------------------------")
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容