最近想看本网络小说《大圣归来,我孙悟空誓必屠尽神佛!》,这个番茄读书,挺麻烦的,手机本来空间就不够,不想装太多软件。
能不能把这本小说给下载下来,慢慢看,经过几次尝试,用代码全部给爬了下来。还不错,就是后面有机会把它直接转换成DOCX文件。
代码如下:
library(rvest)
library(stringr)
#下载《大圣归来,我孙悟空誓必屠尽神佛!》
web <- read_html("https://www.nztgp.org/shuwu/10966/",encoding = "GBK")
book_name <- web %>%html_nodes("div.box_con ")%>%html_nodes("div#list a") %>% html_attr("href")
#获得章节链接地址
book_name<-paste0("https://www.nztgp.org",book_name)
for (i in 1:length(book_name)){
target_url<-book_name[i]
book_cont<-read_html(target_url,encoding = "GBK")
book_cont_1<-book_cont%>%html_nodes("div.box_con ")%>%html_text()
cont_title <- book_cont %>%html_nodes("div.box_con") %>%
html_nodes("div.bookname h1")%>% html_text()
cont_title<-str_sub(cont_title,start = 5, str_length(cont_title))
cont_cont <- book_cont %>%html_nodes("div.box_con") %>%
html_nodes("div#content")%>% html_text()
cont_cont<-str_replace_all(cont_cont,"\r\n","")
cont_cont<-paste0(cont_title,"\r", cont_cont)
write(cont_cont,paste0(cont_title,".txt"))
}