Python快速優雅的批量修改Word文檔樣式
需求描述
手上現有若幹份財務分析報告的Word文檔,如下:
每一份Word文檔中的內容如下:
為瞭方便後續審閱,需要將所有文檔中所有含有資金的語句標紅加粗,如圖所示
步驟分析和前置知識
為瞭解決這個需求簡單復習一下相關知識。Word文檔一般而言由文檔(document) – 段落(paragraph) – 文字塊(run) 三級結構組成:
從需求反饋中可以看出,本質上我們需要做的就是對所有含有資金的文字塊Run進行樣式調整
因此,本需求的邏輯如下:
1.創建一個空文件夾(用於存放修改後的財務報告,避免直接對原文件修改)
2.通過glob獲取目標文件夾下的所有Word路徑
3.利用docx模塊對每個Word文檔遍歷,並獲取包含特定詞的文字塊
4.對文字塊進行樣式修改
代碼實現
首先導入需要的庫並設置目標文件夾路徑
from docx import Document from docx.shared import RGBColor, Pt, Cm import os import glob # 此處更換創建文件夾的路徑 mkdir_path = r'C:\Users\xxx\new_dir' # 此處更換所有文件所在的位置 file_path = r'C:\Users\xxx\'
os和glob我們都很熟悉,這裡簡單介紹一下docx模塊 這是一個非標準庫,在命令行中我們需要輸入以下命令安裝:
pip install python-docx
尤其要註意安裝時候輸入的是python-docx,而實際調用時為docx
實例化具體的Word文檔代碼為:
from docx import Document wordfile = Document(path)
如果不指定路徑則為創建新的Word文檔,這點跟操作Excel的openpyxl不太一樣,有機會再做介紹。
現在我們建立文件夾存放新生成的文件,首先判斷文件夾是否存在,不存在時再運行os.mkdir避免報錯
if not os.path.exists(mkdir_path): os.mkdir(mkdir_path)
接著遍歷Word文檔,利用glob模塊的通配符,框架如下:
for file in glob.glob(file_path + '/*.docx'): pass
根據三級結構,一個文檔Document有一個或多個段落Paragragh,一個段落Paragraph有一個或多個文字塊Run,合起來代碼為:
for file in glob.glob(file_path + '/*.docx'): docx = Document(file) for paragraph in docx.paragraphs: for run in paragraph.runs: pass
最後我們針對特定詞修改樣式,遍歷到文字塊後就可以做判斷瞭
... for run in paragraph.runs: if '資金' in run.text: run.font.bold = True # 加粗 run.font.color.rgb = RGBColor(255, 0, 255) # 設置字體顏色 # 最後切記保存 docx.save(mkdir_path + '/' + os.path.basename(file))
當然,除瞭修改字體顏色和加粗之外,還支持其他樣式的設置,以下列出常用的作為參考:
# 加粗 run.font.bold = True # 斜體 run.font.italic = True # 下劃線 run.font.underline = True # 刪除線 run.font.strike = True # 字號 run.font.size = Pt(20) # 陰影 run.font.shadow = True # 字體顏色 run.font.color.rgb = RGBColor(255, 0, 255)
至此,整個需求就順利結束瞭,附上完整代碼:
from docx import Document from docx.shared import RGBColor, Pt, Cm import os import glob mkdir_path = r'C:\xxx\new_dir)' if not os.path.exists(mkdir_path): os.mkdir(mkdir_path) keyword = '資金' file_path = r'C:\Users\xxx' for file in glob.glob(file_path + '\*.docx'): docx = Document(file) for paragraph in docx.paragraphs: for run in paragraph.runs: if keyword in run.text: run.font.bold = True run.font.color.rgb = RGBColor(255, 0, 0) docx.save(mkdir_path + '/' + os.path.basename(file))
寫在最後
通過本文的Python自動化腳本制作過程,我們可以再次體會Python辦公自動化的強大!如果對自動化代碼和數據感興趣可以在後臺回復自動化獲取。
當然除瞭調整Word字體顏色,其他的大多數樣式調整都可以使用Python完成,也可以與Excel和PPT結合,這些就留給讀者自己開發。
最後還是希望大傢能夠理解Python辦公自動化的一個核心就是批量操作-解放雙手,讓復雜的工作自動化!
以上就是Python快速優雅的批量修改Word文檔樣式的詳細內容,更多關於Python 批量修改Word文檔樣式的資料請關註WalkonNet其它相關文章!
推薦閱讀:
- Python操作word文檔的示例詳解
- 教你如何利用Python批量翻譯英文Word文檔並保留格式
- Python辦公自動化解決world文件批量轉換
- 詳解python-docx處理Word必備工具
- Python docx庫代碼演示