很多从事财务、金融或者律师等行业的网友,一定经常会遇到审查、调研分析企业年报、招股书、保荐书等工作。而这些材料在公开渠道中一定都是PDF文档,如果要对 PDF 文档中的数据进行处理,比如计算、制作分析图表,那该怎么办呢?难道要一个数据一个数据的手动输入吗?这样的效率也实在太低了,宝贵的时间和精力都用在了copy数据而不是对数据的分析上了。
今天就以下面这个网上下载的130多页的半年报为例,教大家两个非常高效实用的办法,快速的将 PDF 文件中的数据转成 Excel 格式,方便后续进行计算或制作图表。
一、将 PDF 转成 Excel
这个方法在网上也有很多的教程,将 PDF 文件转成 .xlsx 文件,然后用 Excel 打开文档后进行数据计算或制作图片。具体方法如下:
·用 UPDF 编辑器打开 PDF 文档
·在右边栏中点击“导出PDF”,选择“Excel工作簿(.xlsx)”
·在“页面范围”中选择“自定义”,设置需要转换页面范围,点击“导出”即可
这种方法可以直接将 PDF 文件转成 Excel 文件,优点是能保持文本和表格格式,但缺点就是把非表格的文本内容也转出来了,需要花时间去清理这些内容。
二、将 PDF 转成 CSV 格式
这个方法应该很少人使用,CSV-逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。这种格式能不受表格格式限制,比较好的将数据提取出来。
转换的操作方法与上述步骤几乎一致(格式选项选 CSV即可),这里就不再累述。转成 CSV 格式的优点就是将所选页面中的每个表格都转成一个独立的 CSV 文件,并过滤掉文本内容,更方便对数据进行处理。缺点就是会删除表格的格式,如字体、合并单元格、线框等。
大家还有其它的方法吗?可以写在评论区里。
还想知道其它有关 PDF 的知识或技巧,请告诉我,我会尽可能做一期内容。