爬个小说吧

最近看小说总是有一堆不堪入目的广告,于是决定爬下来放阅读器里看吧。
偷偷的爬上你的心头~

一言不合上代码

from bs4 import BeautifulSoup
import requests

url_header = 'https://www.tianxiabachang.cn'
default_mark = '/0_804/1877579.html'

f = open('csjxs.txt', 'a')


def core_met():
    html = requests.get(url_header + default_mark)
    soup = BeautifulSoup(html.content, features='html.parser')
    bookname = soup.findAll('div', attrs={"class": "bookname"})
    f.write("\n===============================新的章节===================================\n")
    f.write(bookname[0].contents[1].text + "\n")
    f.write("===============================现在开始===================================\n")
    content = soup.find('div', id='content')
    content = str(content.text)
    f.write(content.replace('<br>', '').replace('<br/>', '').replace("\\n", ''))
    items = soup.find_all('a')
    for i in items:
        if i.text == '下一章':
            return i.get("href")


if __name__ == '__main__':
    while default_mark is not None:
        default_mark = core_met()

逻辑非常简单,主要就是去掉文章里的换行符
以及捕获下一章链接然后递归就好。
扔到手机阅读器里,一口气看完吧。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 1 我叫黑无常 我叫黑无常,喜爱黑色,一袭青衣,居无定所,生性乖张,脾气暴戾。但我嫉恶如仇,爱打抱不平,心有侠义之...
    逡巡者阅读 4,084评论 0 1
  • 当记忆开始慢慢复苏,昨天逐渐开始变的清晰起来;那些伸手摸不到,抬眼看不清的,都可以称之为美好…… ...
    冷一光阅读 3,490评论 13 0
  • 宝玉曾说:“女孩儿未出嫁,是颗无价的宝珠;出了嫁,不知怎么就变出许多的不好的毛病来,虽是颗珠子,却没有光彩宝色,是...
    走在青草边阅读 3,942评论 4 3
  • 暗色的房间,两张单人床,寒冷的冬夜,两个女孩趴在被窝里,谈文学,聊感想,写生活。那温馨的回忆一直留在我的心里,暖暖...
    糖糖心语阅读 2,828评论 3 10
  • 荣忠,(不知道什么腔)你在睡觉了吗?1130 这个特殊的日子,虽然不是你真实的生日,不过我就给你过这一个,这个日子...
    蚊蚊蚊蚊蚊_阅读 1,796评论 0 0

友情链接更多精彩内容