Python Excel處理庫openpyxl詳解

Posted on 2021-05-06 by WalkonNet

Python中的penpyxl是一個第三方庫，可以處理xlsx格式的Excel文件。pip install openpyxl安裝。

penpyxl讀取Excel文件

需要導入相關函數

from openpyxl import load_workbook
# 默認可讀寫，若有需要可以指定write_only和read_only為True
wb = load_workbook('pythontab.xlsx')

默認打開的文件為可讀寫，若有需要可以指定參數read_only為True。

penpyxl獲取工作表–Sheet

# 獲得所有sheet的名稱
print(wb.get_sheet_names())
# 根據sheet名字獲得sheet
a_sheet = wb.get_sheet_by_name('Sheet1')
# 獲得sheet名
print(a_sheet.title)
# 獲得當前正在顯示的sheet, 也可以用wb.get_active_sheet()
sheet = wb.active

penpyxl獲取單元格

# 獲取某個單元格的值，觀察excel發現也是先字母再數字的順序，即先列再行
b4 = sheet['B4']
# 分別返回
print(f'({b4.column}, {b4.row}) is {b4.value}') # 返回的數字就是int型
# 除瞭用下標的方式獲得，還可以用cell函數, 換成數字，這個表示B2
b4_too = sheet.cell(row=4, column=2)
print(b4_too.value)

b4.column返回B, b4.row返回4, value則是那個單元格的值。另外cell還有一個屬性coordinate, 像b4這個單元格返回的是坐標B4。

penpyxl獲得最大行和最大列

# 獲得最大列和最大行
print(sheet.max_row)
print(sheet.max_column)

penpyxl獲取行和列

sheet.rows為生成器, 裡面是每一行的數據，每一行又由一個tuple包裹。

sheet.columns類似，不過裡面是每個tuple是每一列的單元格。

# 因為按行，所以返回A1, B1, C1這樣的順序
for row in sheet.rows:
  for cell in row:
    print(cell.value)
# A1, A2, A3這樣的順序
for column in sheet.columns:
  for cell in column:
    print(cell.value)

上面的代碼就可以獲得所有單元格的數據。如果要獲得某行的數據呢？給其一個索引就行瞭，因為sheet.rows是生成器類型，不能使用索引，轉換成list之後再使用索引，list(sheet.rows)[2]這樣就獲取到第二行的tuple對象。

for cell in list(sheet.rows)[2]:
  print(cell.value)

penpyxl如何獲得任意區間的單元格？

可以使用range函數，下面的寫法，獲得瞭以A1為左上角，B3為右下角矩形區域的所有單元格。註意range從1開始的，因為在openpyxl中為瞭和Excel中的表達方式一致，並不和編程語言的習慣以0表示第一個值。

for i in range(1, 4):
  for j in range(1, 3):
    print(sheet.cell(row=i, column=j))
     
# out
<Cell pythontab.A1>
<Cell pythontab.B1>
<Cell pythontab.A2>
<Cell pythontab.B2>
<Cell pythontab.A3>
<Cell pythontab.B3>

還可以像使用切片那樣使用。sheet[‘A1′:’B3’]返回一個tuple，該元組內部還是元組，由每行的單元格構成一個元組。

for row_cell in sheet['A1':'B3']:
  for cell in row_cell:
    print(cell)
     
for cell in sheet['A1':'B3']:
  print(cell)
# out
(<Cell pythontab.A1>, <Cell pythontab.B1>)
(<Cell pythontab.A2>, <Cell pythontab.B2>)
(<Cell pythontab.A3>, <Cell pythontab.B3>)

根據字母獲得列號，根據列號返回字母

需要導入，這兩個函數存在於openpyxl.utils

from openpyxl.utils import get_column_letter, column_index_from_string

# 根據列的數字返回字母

print(get_column_letter(2)) # B

# 根據字母返回列的數字

print(column_index_from_string(‘D’)) # 4

將數據寫入Excel

工作表相關

需要導入WorkBook

from openpyxl import Workbook
wb = Workbook()

這樣就新建瞭一個新的工作表（隻是還沒被保存）。

若要指定隻寫模式，可以指定參數write_only=True。一般默認的可寫可讀模式就可以瞭。

print(wb.get_sheet_names()) # 提供一個默認名叫Sheet的表，office2016下新建提供默認Sheet1
# 直接賦值就可以改工作表的名稱
sheet.title = 'Sheet1'
# 新建一個工作表，可以指定索引，適當安排其在工作簿中的位置
wb.create_sheet('Data', index=1) # 被安排到第二個工作表，index=0就是第一個位置
# 刪除某個工作表
wb.remove(sheet)
del wb[sheet]

penpyxl寫入單元格

還可以使用公式

# 直接給單元格賦值就行
sheet['A1'] = 'good'
# B9處寫入平均值
sheet['B9'] = '=AVERAGE(B2:B8)'

但是如果是讀取的時候需要加上data_only=True這樣讀到B9返回的就是數字，如果不加這個參數，返回的將是公式本身’=AVERAGE(B2:B8)’

append函數

可以一次添加多行數據，從第一行空白行開始（下面都是空白行）寫入。

# 添加一行
row = [1 ,2, 3, 4, 5]
sheet.append(row)
# 添加多行
rows = [
  ['Number', 'data1', 'data2'],
  [2, 40, 30],
  [3, 40, 25],
  [4, 50, 30],
  [5, 30, 10],
  [6, 25, 5],
  [7, 50, 10],
]

由於append函數隻能按行寫入。如果我們想按列寫入呢。append能實現需求麼？如果把上面的列表嵌套看作矩陣。隻要將矩陣轉置就可以瞭。使用zip()函數可以實現，不過內部的列表變成瞭元組就是瞭。都是可迭代對象，不影響。

list(zip(*rows))
# out
[('Number', 2, 3, 4, 5, 6, 7),
 ('data1', 40, 40, 50, 30, 25, 50),
 ('data2', 30, 25, 30, 10, 5, 10)]

解釋下上面的list(zip(*rows))首先*rows將列表打散，相當於填入瞭若幹個參數，zip從某個列表中提取第1個值組合成一個tuple，再從每個列表中提取第2個值組合成一個tuple，一直到最短列表的最後一個值提取完畢後結束，更長列表的之後的值被舍棄，換句話，最後的元組個數是由原來每個參數（可迭代對象）的最短長度決定的。比如現在隨便刪掉一個值，最短列表長度為2，data2那一列（豎著看）的值全部被舍棄。

rows = [
  ['Number', 'data1', 'data2'],
  [2, 40],
  [3, 40, 25],
  [4, 50, 30],
  [5, 30, 10],
  [6, 25, 5],
  [7, 50, 10],
]
# out
[('Number', 2, 3, 4, 5, 6, 7), ('data1', 40, 40, 50, 30, 25, 50)]

最後zip返回的是zip對象，看不到數據的。使用list轉換下就好瞭。使用zip可以方便實現將數據按列寫入。

保存文件

所有的操作結束後，一定記得保存文件。指定路徑和文件名，後綴名為xlsx。

wb.save(r'D:\example.xlsx')

設置單元格風格–Style

先導入需要的類

from openpyxl.styles import Font, colors, Alignment

分別可指定字體相關，顏色，和對齊方式。

字體

bold_itatic_24_font = Font(name='等線', size=24, italic=True, color=colors.RED, bold=True)
sheet['A1'].font = bold_itatic_24_font

上面的代碼指定瞭等線24號加粗斜體，字體顏色紅色。直接使用cell的font屬性，將Font對象賦值給它。

對齊方式

也是直接使用cell的屬性aligment，這裡指定垂直居中和水平居中。除瞭center，還可以使用right、left等等參數。

# 設置B1中的數據垂直居中和水平居中
sheet['B1'].alignment = Alignment(horizontal='center', vertical='center')

設置行高和列寬

有時候數據太長顯示不完，就需要拉長拉高單元格。

# 第2行行高
sheet.row_dimensions[2].height = 40
# C列列寬
sheet.column_dimensions['C'].width = 30

合並和拆分單元格

所謂合並單元格，即以合並區域的左上角的那個單元格為基準，覆蓋其他單元格使之稱為一個大的單元格。

相反，拆分單元格後將這個大單元格的值返回到原來的左上角位置。

# 合並單元格， 往左上角寫入數據即可
sheet.merge_cells('B1:G1') # 合並一行中的幾個單元格
sheet.merge_cells('A1:C3') # 合並一個矩形區域中的單元格

合並後隻可以往左上角寫入數據，也就是區間中:左邊的坐標。

如果這些要合並的單元格都有數據，隻會保留左上角的數據，其他則丟棄。換句話說若合並前不是在左上角寫入數據，合並後單元格中不會有數據。

以下是拆分單元格的代碼。拆分後，值回到A1位置。

sheet.unmerge_cells('A1:C3')

Python Excel處理庫openpyxl詳解

penpyxl讀取Excel文件

penpyxl獲取工作表–Sheet

penpyxl獲取單元格

penpyxl獲得最大行和最大列

penpyxl獲取行和列

penpyxl如何獲得任意區間的單元格？

將數據寫入Excel

penpyxl寫入單元格

append函數

保存文件

字體

對齊方式

設置行高和列寬

合並和拆分單元格

推薦閱讀：

發佈留言取消回覆

近期文章

penpyxl讀取Excel文件

penpyxl獲取工作表–Sheet

penpyxl獲取單元格

penpyxl獲得最大行和最大列

penpyxl獲取行和列

penpyxl如何獲得任意區間的單元格？

將數據寫入Excel

penpyxl寫入單元格

append函數

保存文件

字體

對齊方式

設置行高和列寬

合並和拆分單元格

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆