背景:前端可视化的时候需要的文件是.png格式的图片文件,但是在R包暂时只能输出.pdf文件,因此使用python将.pdf文件转换为.png。
- pip装包
首先安装python包:
pip install PyMuPDF==1.19.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
- python脚本
import datetime
import os
import fitz
import re
def pyMuPDF_fitz(pdfPath, imagePath):
startTime_pdf2img = datetime.datetime.now() #' 开始时间
pdfFile=pdfPath.split("/")[len(pdfPath.split("/"))-1]
pdfFile=re.sub(".pdf","",pdfFile)
print("imagePath=" + imagePath)
pdfDoc = fitz.open(pdfPath)
for pg in range(pdfDoc.pageCount):
page = pdfDoc[pg]
rotate = int(0)
#' 每个尺寸的缩放系数为1.3,这将为我们生成分辨率提高2.6的图像。
#' 此处若是不做设置,默认图片大小为:792X612, dpi=96
zoom_x = 1.33333333 #' (1.33333333-->1056x816) (2-->1584x1224)
zoom_y = 1.33333333
mat = fitz.Matrix(zoom_x, zoom_y).preRotate(rotate)
pix = page.getPixmap(matrix=mat, alpha=False)
if not os.path.exists(imagePath): #' 判断存放图片的文件夹是否存在
os.makedirs(imagePath) #' 若图片文件夹不存在就创建
pix.writePNG(imagePath + '/' + '%s.png' % pdfFile) #' 将图片写入指定的文件夹内
endTime_pdf2img = datetime.datetime.now() # 结束时间
print('pdf2img时间=', (endTime_pdf2img - startTime_pdf2img).seconds)
if __name__ == "__main__":
#' 1、PDF地址
pdfPath = '06.WGCNA/ModuleNetworks/'
#' 2、需要储存图片的目录
imagePath = '06.WGCNA/ModuleNetworks/'
for i in os.listdir(pdfPath):
if i.endswith("pdf"):
pyMuPDF_fitz(pdfPath+i, imagePath)