python3使用xpath爬内涵吧段子

我心有猛虎2018

python3使用xpath爬内涵吧段子

import requests
from lxml import etree
headers = {'user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}

def download(url):
    reponse = requests.get(url,headers = headers)
    reponse.encoding = 'gbk'
    text = reponse.text
    html = etree.HTML(text)
    results = html.xpath('//*[@class=\'piclist longList\']//a[@href!=\'/article/\']//text()')
    for line in results:
        print(line)
    duanzs = html.xpath('//*[@class=\'piclist longList\']//div[@class=\'f18 mb20\']//text()')
    for linedata in duanzs:
        print(linedata.strip())
        print('*'*20)
download("https://www.neihan8.com/article/list_5_2.html")

BaiduShurufa_2019-1-18_22-30-43.png

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

python3[爬虫实战] 使用selenium，xpath爬取京东手机（下）
这次主要是进行京东具体某个店铺手机评论内容的爬取。本来是跟上一起写的，只是没有时间一块做总结，现在写上来是有点生...
简书用户9527阅读 5,155评论 3赞 1
Python爬虫爬取内涵吧段子案例系列之八
不多说，直接上代码
晓可加油阅读 3,892评论 0赞 0

python3中xpath爬51job
最近学python，练练手爬一些简单的网站页面，这里选取了51job页面python的岗位有多少，主要是为了练习x...
我心有猛虎2018阅读 3,885评论 0赞 51
爬虫基础系列xpath实战——爬取糗事百科段子(2)
我们爬取网页，重要的是前期的分析工作，比着教程写出来的爬虫与自己能独立写出来有着不小的距离，所以我们学习爬虫，更重...
猛犸象和剑齿虎阅读 3,138评论 0赞 1
生活对每个人都充满了挑战（关于健康与疾病）
前两天，我看了大学同学贤的朋友圈，每当我无聊的时候我都会以看圈打发时间。却看到了她抱着娃去南京求医的消息。然...
懒懒的阿朱阅读 2,865评论 4赞 2

51赞52赞

赞赏

手机看全文