1.如何将url格式的pdf 或 docx文件保存到本地:
使用urllib函数:
import urllib.request # 导入所需函数
urllib.request.urlretrieve(path, 'save_path') # path参数为指定url,save_path为保存的本地地址
2.如何导入docx文件到python内存,以及进行对应表格处理
使用docx函数:
安装python-docx
from docx import Document # 导入所需函数
document = Document(r'read_path') # 参数read_path为docx文件读取地址
tables = document.tables # 对应docx文件的表格进行操作