前面写了很多利用python-docx批量处理word文件的教程,但是python-docx不支持doc格式,因此如何将doc文件转为docx文件就是一个需要解决的问题,如果文件少可以另存为,如何文件多呢,因此需要一个doc批量转docx的方法。
该方法需要用到另外一个python库win32com,安装方法:转换方法如下 :
from win32com import client as wcw = wc.Dispatch('Word.Application')# 或者使用下面的方法,使用启动独立的进程:# w = wc.DispatchEx('Word.Application')doc=w.Documents.Open("E:\\Jupyter\\s.doc")doc.SaveAs("E:\\Jupyter\\sa.docx",16)#必须有参数16,否则会出错.
此外,如果利用python-docx将.docx文件存储为.doc,这个 doc文件是可以利用python-docx打开的,如何是用office创建的则不行。