Python一鍵實現PDF文檔批量轉Word
無論是在工作還是學習當中,大傢都會遇到這樣一個問題,將“PDF當中的內容(文本和圖片)轉換為Word的格式”,也就是說從隻讀轉換成可編輯的格式。網上絕大多數的工具也都是收費的,今天小編就給大傢制作瞭一款批量將PDF
文件轉換為Word
的神器,使用起來也是相當的方便。
實現效果
我們首先來看一下出來的效果,如下圖所示
環境準備
用到的模塊叫做pdf2docx
,我們通過pip
命令進行下載,如下
pip install pdf2docx
後續我們還可以為py
文件打包,用到的庫是pyinstaller
pip install pyinstaller
代碼實現
我們先簡單地實現將單個PDF
文檔轉換成Word
文檔,代碼如下
from pdf2docx import Converter cv = Converter(r"pdf文件的路徑") cv.convert("test.docx", start=0,end=None) cv.close()
那麼上面的是單個PDF
文件,要是涉及到是多個PDF
文件,則需要用到遍歷上傳過來的每一個文件,用到for
循環遍歷
def startAction(self): output_path_1 = Path.joinpath(Path.home(), "Desktop") output_path_2 = str(output_path_1) + "\\output" if not os.path.exists(output_path_2): os.mkdir(output_path_2) for path_list in pdfPath_list: print("路徑: ", path_list) name = path_list.split("/")[-1].split(".")[0] cv = Converter(path_list) cv.convert(output_path_2 + "\\{}.docx".format(name), start=0, end=None) cv.close() msg_box = QMessageBox(QMessageBox.Information, '完成', '提取完成', QMessageBox.Yes) msg_box.exec_()
上述的代碼,我們首先將指定好輸出的Word
文檔的位置,這裡小編設置的是在桌面,然後通過for循環去遍歷處理每一個PDF
文檔,當所有的步驟都完成的時候,提示我們已經完成瞭。
當然整個可視化界面當中還有一個上傳文件的功能,代碼如下
# 選擇本地文件上傳 def uploadFiles(self): global pdfPath_list # 這裡為瞭方便別的地方引用文件路徑,將其設置為全局變量 pdfPath_list, fileType = QFileDialog.getOpenFileNames(self.ui, "上傳文件", r"路徑", "*.pdf;;All Files(*)") # 顯示所選文件的路徑 self.ui.lineEdit.setText(",".join(pdfPath_list))
整體的代碼如下所示
from PySide2.QtWidgets import QApplication, QMessageBox, QFileDialog from PySide2.QtUiTools import QUiLoader from pdf2docx import Converter from pathlib import Path import os class OCRQt: def __init__(self): self.ui = QUiLoader().load('pdf2word.ui') self.ui.pushButton.clicked.connect(self.uploadFiles) self.ui.pushButton_2.clicked.connect(self.startAction) def uploadFiles(self): ........ ........ def startAction(self): ....... ....... if __name__ == '__main__': app = QApplication([]) # 顯示創建的界面 MainWindow = OCRQt() # 創建窗體對象 MainWindow.ui.show() # 顯示窗體 app.exit(app.exec_()) # 程序關閉時退出進程
到此這篇關於Python一鍵實現PDF文檔批量轉Word的文章就介紹到這瞭,更多相關Python PDF轉Word內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- C/C++ Qt Dialog 對話框組件應用技巧
- Python詳細介紹模型封裝部署流程
- 隻用40行Python代碼就能寫出pdf轉word小工具
- Python實現上課點名器系統
- PyQt 如何創建自定義QWidget