# BiocManager::install("tabulizer")
library(tabulizer)
# I create a dummy list to iterate through all the pages and push a data.frame in
result <- list()
for (i in 1:3){
result[[i]] <- as.data.frame(extract_tables("C:/Users/Dong/Downloads/Documents/Extracted pages from Draper - 1998 - OARDC_special_circular_n157.pdf", page = i, method = 'stream'), stringsAsFactors = FALSE)
}
# df=rbind(result[[1]],result[[2]])
# df=result[[2]]
write.csv(result[[3]], file = "D:/0.csv")
提取PDF文件中的表格
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
推荐阅读更多精彩内容
- 在实际研究中,我们经常需要获取大量数据,而这些数据很大一部分以pdf表格的形式呈现,如公司年报、发行上市公告等。面...
- 今天青石的票圈出镜率最高的,莫过于张艺谋的新片终于定档了。 一张满溢着水墨风的海报一次次的出现在票圈里,也就是老谋...