使用Python自動化Microsoft Excel和Word的操作方法

將Excel與Word集成,無縫生成自動報告

毫無疑問,微軟的Excel和Word是公司和非公司領域使用最廣泛的兩款軟件。它們實際上是“工作”的同義詞。通常情況下,每一周我們都會將兩者結合起來,並以某種方式發揮它們的優點。雖然一般的日常用途不會要求自動化,但有時自動化可能是必需的。也就是說,當您有大量的圖表、圖形、表格和報告要生成時,如果您選擇手動方式,它可能會成為一項極其繁瑣的工作。其實沒必要這樣。實際上,有一種方法可以在Python中創建一個管道,您可以將兩者無縫集成,在Excel中生成電子表格,然後將結果傳輸到Word中,幾乎即時生成報告。

Openpyxl

Openpyxl它可以說是Python中最通用的包之一,它可以非常容易使用Excel接口。有瞭它,你可以讀和寫所有當前和最早的excel格式,即xlsx和xls。Openpyxl允許您填充行和列、執行公式、創建2D和3D圖表、標記軸和標題,以及其他許多非常有用的功能。然而,最重要的是,這個包允許您在Excel中遍歷無窮多的行和列,從而避免瞭之前必須做的所有煩人的數字處理和繪圖。

Python-docx

然後是Python-docx,這個包之於Word就像Openpyxl之於Excel。如果您還沒有學習他們的文檔,那麼您可能應該看一看。毫不誇張地說,Python-docx是我開始使用Python以來使用過的最簡單、最不言自明的工具包之一。它允許您通過插入文本、填充表格和在報表中自動渲染圖像來自動生成文檔。

言歸正傳,讓我們創建我們自己的自動化流水線。繼續使用Anaconda(或者你選擇的任何其他IDE)並安裝以下軟件包:

pip install openpyxl
pip install python-docx

Microsoft Excel自動化

首先,我們將加載一個已經創建好的Excel工作簿(如下所示):

workbook = xl.load_workbook('Book1.xlsx')
sheet_1 = workbook['Sheet1']

隨後,我們將遍歷電子表格中的所有行,通過電流乘以電壓來計算和插入功率值:

for row in range(2, sheet_1.max_row + 1):
    current = sheet_1.cell(row, 2)
    voltage = sheet_1.cell(row, 3)
    power = float(current.value) * float(voltage.value)
    power_cell = sheet_1.cell(row, 1)
    power_cell.value = power

一旦完成,我們將使用計算的功率值生成折線圖,將插入指定的單元格,如下圖所示:

values = Reference(sheet_1, min_row = 2, max_row = sheet_1.max_row, min_col = 1, max_col = 1)
chart = LineChart()
chart.y_axis.title = 'Power'
chart.x_axis.title = 'Index'
chart.add_data(values)
sheet_1.add_chart(chart, 'e2') 
workbook.save('Book1.xlsx')

現在我們已經生成瞭圖表,我們需要將其提取為圖像,以便在Word報告中使用它。首先,我們將確定Excel文件的確切位置,以及輸出的圖表圖像應該保存的位置:

input_file = "C:/Users/.../Book1.xlsx"
output_image = "C:/Users/.../chart.png"

然後使用以下方法訪問電子表格:

operation = win32com.client.Dispatch("Excel.Application")
operation.Visible = 0
operation.DisplayAlerts = 0
workbook_2 = operation.Workbooks.Open(input_file)
sheet_2 = operation.Sheets(1)

你可以迭代電子表格中的所有圖表對象(如果有一個以上),並將它們保存在指定的位置如下:

for x, chart in enumerate(sheet_2.Shapes):
    chart.Copy()
    image = ImageGrab.grabclipboard()
    image.save(output_image, 'png')
    passworkbook_2.Close(True)
operation.Quit()

Microsoft Word自動化

現在我們已經生成瞭圖表圖像,我們必須創建一個模板文檔,它基本上是一個普通的Microsoft Word文檔(.docx),它完全按照我們希望的報告外觀來制定,包括字體、字體大小、格式和頁面結構。然後,我們需要做的就是為我們的自動內容創建占位符,即表值和圖像,並使用變量名聲明它們,如下所示。

任何自動的內容都可以在雙花括號{{variable_name}}中聲明,包括文本和圖像。對於表,你需要創建一個包含所有列的模板行表,然後你需要在上面加上一行,下面加上一行,符號如下:

第一行:

{%tr for item in variable_name %}

最後一行:

{%tr endfor %}

在上圖中,變量名是:

  • table_contents用於存儲表格數據的Python字典
  • 字典鍵的索引(第一列)
  • 字典值的功率、電流和電壓(第二、第三和第四列)

然後我們將模板文檔導入Python,並創建一個字典來存儲表中的值:

template = DocxTemplate('template.docx')
table_contents = []for i in range(2, sheet_1.max_row + 1):
    table_contents.append({
        'Index': i-1,
        'Power': sheet_1.cell(i, 1).value,
        'Current': sheet_1.cell(i, 2).value,
        'Voltage': sheet_1.cell(i, 3).value
        })

接下來,我們將導入之前由Excel生成的圖表圖像,並創建另一個字典來實例化模板文檔中聲明的所有占位符變量:

image = InlineImage(template,'chart.png',Cm(10))context = {
    'title': 'Automated Report',
    'day': datetime.datetime.now().strftime('%d'),
    'month': datetime.datetime.now().strftime('%b'),
    'year': datetime.datetime.now().strftime('%Y'),
    'table_contents': table_contents,
    'image': image
    }

最後,我們將用我們的值表和圖表圖像渲染報告:

template.render(context)
template.save('Automated_report.docx')

結果

好瞭,這就是一個自動生成的Microsoft Word報告,包含數字和在Microsoft Excel中創建的圖表。這樣你就有瞭一個完全自動化的管道,可以用來創建盡可能多的表格、圖表和文檔。

最後,完整的代碼在這裡:https://github.com/mkhorasani/excel_word_automation 有興趣的可以下載修改和執行

到此這篇關於使用Python自動化Microsoft Excel和Word的文章就介紹到這瞭,更多相關使用Python自動化Microsoft Excel和Word內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀:

    None Found