从网上找到一本电子书PDF文件,发现正文内容是简体汉字,但是书签的目录却是繁体,看着别扭,尝试着修改了10条,发现这真是体力活,太耗时了。于是想到我们经常看到网上讲,Python可以完成很多的自动化,应用的范围也很广,于是现学现用的去找了点资料,尝试着写几行,顺利完成了几百条目录书签的改写,真的是很方便。能够自动化的操作,或是有空时学学Python,真的可以在工作、学习中帮助自己解决一些体力劳动。
Python入门学起来,不是太难,稍微努力一下,就可以动手实践的。
参考代码如下:
# pip install pymupdf
# pip install zhconv
import fitz #汉字转换
import zhconv
pdf_file = r'D:\zz_ebook\abc.pdf' # pdf文件
doc = fitz.open(pdf_file) # 获取一个pdf对象
toc = doc.get_toc() #获取目录
new_toc = [[xx[0],zhconv.convert(xx[1],'zh-cn'),xx[2]] for xx in toc] # 将繁体转换为简体,目录编码转换
doc.set_toc(new_toc) # 设置新目录
doc.saveIncr() #保存文件
print('-----转换完成,请打开文件检查。-----')