使用Python自動化Microsoft Excel和Word的操作方法
將Excel與Word集成,無縫生成自動報告
毫無疑問,微軟的Excel和Word是公司和非公司領域使用最廣泛的兩款軟件。它們實際上是“工作”的同義詞。通常情況下,每一周我們都會將兩者結合起來,並以某種方式發揮它們的優點。雖然一般的日常用途不會要求自動化,但有時自動化可能是必需的。也就是說,當您有大量的圖表、圖形、表格和報告要生成時,如果您選擇手動方式,它可能會成為一項極其繁瑣的工作。其實沒必要這樣。實際上,有一種方法可以在Python中創建一個管道,您可以將兩者無縫集成,在Excel中生成電子表格,然後將結果傳輸到Word中,幾乎即時生成報告。
Openpyxl
Openpyxl它可以說是Python中最通用的包之一,它可以非常容易使用Excel接口。有瞭它,你可以讀和寫所有當前和最早的excel格式,即xlsx和xls。Openpyxl允許您填充行和列、執行公式、創建2D和3D圖表、標記軸和標題,以及其他許多非常有用的功能。然而,最重要的是,這個包允許您在Excel中遍歷無窮多的行和列,從而避免瞭之前必須做的所有煩人的數字處理和繪圖。
Python-docx
然後是Python-docx,這個包之於Word就像Openpyxl之於Excel。如果您還沒有學習他們的文檔,那麼您可能應該看一看。毫不誇張地說,Python-docx是我開始使用Python以來使用過的最簡單、最不言自明的工具包之一。它允許您通過插入文本、填充表格和在報表中自動渲染圖像來自動生成文檔。
言歸正傳,讓我們創建我們自己的自動化流水線。繼續使用Anaconda(或者你選擇的任何其他IDE)並安裝以下軟件包:
pip install openpyxl pip install python-docx
Microsoft Excel自動化
首先,我們將加載一個已經創建好的Excel工作簿(如下所示):
workbook = xl.load_workbook('Book1.xlsx') sheet_1 = workbook['Sheet1']
隨後,我們將遍歷電子表格中的所有行,通過電流乘以電壓來計算和插入功率值:
for row in range(2, sheet_1.max_row + 1): current = sheet_1.cell(row, 2) voltage = sheet_1.cell(row, 3) power = float(current.value) * float(voltage.value) power_cell = sheet_1.cell(row, 1) power_cell.value = power
一旦完成,我們將使用計算的功率值生成折線圖,將插入指定的單元格,如下圖所示:
values = Reference(sheet_1, min_row = 2, max_row = sheet_1.max_row, min_col = 1, max_col = 1) chart = LineChart() chart.y_axis.title = 'Power' chart.x_axis.title = 'Index' chart.add_data(values) sheet_1.add_chart(chart, 'e2') workbook.save('Book1.xlsx')
現在我們已經生成瞭圖表,我們需要將其提取為圖像,以便在Word報告中使用它。首先,我們將確定Excel文件的確切位置,以及輸出的圖表圖像應該保存的位置:
input_file = "C:/Users/.../Book1.xlsx" output_image = "C:/Users/.../chart.png"
然後使用以下方法訪問電子表格:
operation = win32com.client.Dispatch("Excel.Application") operation.Visible = 0 operation.DisplayAlerts = 0 workbook_2 = operation.Workbooks.Open(input_file) sheet_2 = operation.Sheets(1)
你可以迭代電子表格中的所有圖表對象(如果有一個以上),並將它們保存在指定的位置如下:
for x, chart in enumerate(sheet_2.Shapes): chart.Copy() image = ImageGrab.grabclipboard() image.save(output_image, 'png') passworkbook_2.Close(True) operation.Quit()
Microsoft Word自動化
現在我們已經生成瞭圖表圖像,我們必須創建一個模板文檔,它基本上是一個普通的Microsoft Word文檔(.docx),它完全按照我們希望的報告外觀來制定,包括字體、字體大小、格式和頁面結構。然後,我們需要做的就是為我們的自動內容創建占位符,即表值和圖像,並使用變量名聲明它們,如下所示。
任何自動的內容都可以在雙花括號{{variable_name}}中聲明,包括文本和圖像。對於表,你需要創建一個包含所有列的模板行表,然後你需要在上面加上一行,下面加上一行,符號如下:
第一行:
{%tr for item in variable_name %}
最後一行:
{%tr endfor %}
在上圖中,變量名是:
- table_contents用於存儲表格數據的Python字典
- 字典鍵的索引(第一列)
- 字典值的功率、電流和電壓(第二、第三和第四列)
然後我們將模板文檔導入Python,並創建一個字典來存儲表中的值:
template = DocxTemplate('template.docx') table_contents = []for i in range(2, sheet_1.max_row + 1): table_contents.append({ 'Index': i-1, 'Power': sheet_1.cell(i, 1).value, 'Current': sheet_1.cell(i, 2).value, 'Voltage': sheet_1.cell(i, 3).value })
接下來,我們將導入之前由Excel生成的圖表圖像,並創建另一個字典來實例化模板文檔中聲明的所有占位符變量:
image = InlineImage(template,'chart.png',Cm(10))context = { 'title': 'Automated Report', 'day': datetime.datetime.now().strftime('%d'), 'month': datetime.datetime.now().strftime('%b'), 'year': datetime.datetime.now().strftime('%Y'), 'table_contents': table_contents, 'image': image }
最後,我們將用我們的值表和圖表圖像渲染報告:
template.render(context) template.save('Automated_report.docx')
結果
好瞭,這就是一個自動生成的Microsoft Word報告,包含數字和在Microsoft Excel中創建的圖表。這樣你就有瞭一個完全自動化的管道,可以用來創建盡可能多的表格、圖表和文檔。
最後,完整的代碼在這裡:https://github.com/mkhorasani/excel_word_automation 有興趣的可以下載修改和執行
到此這篇關於使用Python自動化Microsoft Excel和Word的文章就介紹到這瞭,更多相關使用Python自動化Microsoft Excel和Word內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- None Found