爬个小说看

最近想看本网络小说《大圣归来,我孙悟空誓必屠尽神佛!》,这个番茄读书,挺麻烦的,手机本来空间就不够,不想装太多软件。

能不能把这本小说给下载下来,慢慢看,经过几次尝试,用代码全部给爬了下来。还不错,就是后面有机会把它直接转换成DOCX文件。


代码如下:

library(rvest)

library(stringr)

#下载《大圣归来,我孙悟空誓必屠尽神佛!》

web <- read_html("https://www.nztgp.org/shuwu/10966/",encoding = "GBK")

book_name <- web %>%html_nodes("div.box_con ")%>%html_nodes("div#list a") %>% html_attr("href")

#获得章节链接地址

book_name<-paste0("https://www.nztgp.org",book_name)

for (i in 1:length(book_name)){

target_url<-book_name[i]

book_cont<-read_html(target_url,encoding = "GBK")

book_cont_1<-book_cont%>%html_nodes("div.box_con ")%>%html_text()

cont_title <- book_cont %>%html_nodes("div.box_con") %>%

html_nodes("div.bookname h1")%>% html_text()

cont_title<-str_sub(cont_title,start = 5, str_length(cont_title))

cont_cont <- book_cont %>%html_nodes("div.box_con") %>%

html_nodes("div#content")%>% html_text()

cont_cont<-str_replace_all(cont_cont,"\r\n","")

cont_cont<-paste0(cont_title,"\r", cont_cont)

write(cont_cont,paste0(cont_title,".txt"))

}

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容