python 使用openpyxl讀取excel數據

openpyxl介紹

​ openpyxl是一個開源項目,它是一個用於讀取/寫入Excel 2010文檔(如xlsx 、xlsm 、xltx 、xltm文件 )的Python庫,如果要處理更早格式的Excel文檔(xls),需要用到其它庫(如:xlrd、xlwt等),這是openpyxl比較其他模塊的不足之處。openpyxl是一款比較綜合的工具,不僅能夠同時讀取和修改Excel文檔,而且可以對Excel文件內單元格進行詳細設置,包括單元格樣式等內容,甚至還支持圖表插入、打印設置等內容。

​ python中與excel操作相關的模塊:

  • 📔 xlrd庫:從excel中讀取數據,支持xls、xlsx格式
  • 📔 xlwt庫:對excel進行修改操作,但不支持對xlsx格式的修改
  • 📔 xlutils庫:在xlwt和xlrd中,對一個已存在文件進行修改
  • 📘 openpyxl庫:主要針對xlsx格式的excel進行讀取和編輯

openpyxl安裝

pip install openpyxl

openpyxl基本概念

  • WorkBook:工作簿對象
  • Sheet:表單對象
  • Cell:表格對象

​ 也就是我們使用excel時可以看到的三個對象,我們操作excel的步驟是打開工作簿,選中表單,對單元格進行操作,而openpyxl的工作原理也是如此。

openpyxl對excel進行操作

新建excel

import openpyxl

# 創建一個工作簿
workbook = openpyxl.Workbook()
# 創建一個表單
sheet = workbook.create_sheet('表單1')
# 寫入一個數據
sheet.cell(row=1, column=1, value="python")
# 保存
workbook.save('test.xlsx')

​ 🎈 註意點:如果保存的文件名已存在,將會覆蓋原來的文件

打開已存在的文件

  • 打開已存在的文件:load_workbook()
  • 獲取表單:workbook[‘表單名’]
  • 讀取指定表格:cell(row, column).value
import openpyxl

# 打開工作簿
workbook = openpyxl.load_workbook('test.xlsx')
# 獲取表單
sheet = workbook['表單1']
# 讀取指定的單元格數據
cell = sheet.cell(row=1, column=1).value
print(cell)

​ 運行結果:

C:\software\python\python.exe D:/learn/python24/python_base/test.py
python

Process finished with exit code 0

讀取單個單元格

# 方式一:讀取A6單元格的值
cell1 = sheet['A6'].value

# 方式二:讀取第3行,第4列單元格的值
cell2 = sheet.cell(row=3, column=4).value

讀取多個單元格

# 方式一:讀取A6單元格的值
cell1 = sheet['A6'].value

# 方式二:讀取第3行,第4列單元格的值
cell2 = sheet.cell(row=3, column=4).value

​ 讀取多個單元格時,都是以元組的形式返回

其他相關操作

關鍵代碼 相關描述
cell(row, column, value) 寫入數據,三個參數分別是行,列,值
cell(row, column).value 獲取指定單元格的值,兩個參數分別是行,列
workbook.remove(‘表單名’) 刪除表單
del workbook[‘表單名’] 刪除表單
workbook.save(‘文件名’) 保存工作簿
sheet.max_row 獲取表單數據的總行數
sheet.max_column 獲取表單數據的總列數
sheet.rows 獲取按行所有的數據
sheet.columns 獲取按列所有的數據

​ 🎈 註意點:

  • openpyxl中列和行的起始標識都是1,不是從0開始
  • 從excel中讀取出來的數據隻有兩種類型,即數值類型和字符串類型
  • 不要隨便在表格中敲空格,會影響判斷最大行數和最大列數
  • 運行操作excel的代碼時,要先關閉在操作系統中打開的相關excel表,否則可能會無法讀取/寫入數據
  • 寫入數據時要執行保存
import openpyxl

# 打開工作簿
wb = openpyxl.load_workbook('test.xlsx')
# 獲取表單
sh = wb['表單1']
# 讀取指定的單元格數據
res1 = sh.cell(row=1, column=1).value
print(res1)

# 獲取最大行數
print(sh.max_row)
# 獲取最大列數
print(sh.max_column)

# 按列讀取所有數據,每一列的單元格放入一個元組中
print(sh.columns) # 直接打印,打印結果是一個可迭代對象,我們可以轉換成列表來查看

# 按行讀取所有數據,每一行的單元格放入一個元組中
rows = sh.rows
# print(list(rows)) # 轉換成列表之後打印結果為具體的單元格,如下
# [(<Cell '表單1'.A1>, <Cell '表單1'.B1>, <Cell '表單1'.C1>, <Cell '表單1'.D1>, <Cell '表單1'.E1>, <Cell '表單1'.F1>, <Cell '表單1'.G1>),
# (<Cell '表單1'.A2>, <Cell '表單1'.B2>, <Cell '表單1'.C2>, <Cell '表單1'.D2>, <Cell '表單1'.E2>, <Cell '表單1'.F2>, <Cell '表單1'.G2>),
# (<Cell '表單1'.A3>, <Cell '表單1'.B3>, <Cell '表單1'.C3>, <Cell '表單1'.D3>, <Cell '表單1'.E3>, <Cell '表單1'.F3>, <Cell '表單1'.G3>)]


# 我們可以通過for循環以及value來查看單元格的值
for row in list(rows): # 遍歷每行數據
 case = [] # 用於存放一行數據
 for c in row: # 把每行的每個單元格的值取出來,存放到case裡
  case.append(c.value)
 print(case)

​ 運行結果:

C:\software\python\python.exe D:/learn/python24/python_base/test.py
case_id
3
7
<generator object Worksheet._cells_by_col at 0x0000012FEF90D8B8>
['case_id', 'interface', 'title', 'method', 'url', 'data', 'expected']
[1, 'login', '登錄成功', 'post', '/member/login', '{"mobile_phone":"15692004245","pwd":"miki12345"}', "{'code': 0, 'msg': 'OK'}"]
[2, 'login', '登錄失敗-手機號為空', 'post', '/member/login', '{"mobile_phone":"","pwd":"miki12345"}', "{'code': 2, 'msg': '手機號碼為空'}"]

​ excel表中的原數據如下圖:

openpyxl封裝

​ 在測試過程中,我們會經常需要訪問excel讀取測試數據,如果毎訪問一次我們就調用一次openpyxl,進行打開excel,選取表單,讀取數據等操作,將會增加我們的工作量和代碼量。凡是需要重復使用的,我們都可以對它進行二次封裝,寫成我們自己的版本,還可以在封裝過程中加入我們想要的內容,使用的時候直接調用即可。

​ 在封裝openpyxl時,讀取excel時我寫瞭兩種實現方法,第一種是讀取數據後,把每條測試數據的鍵值保存到一個字典中,再把字典存到一個列表,這種方式比較容易理解,但是調用的時候需要多敲幾個括號或者引號;第二種是把每條測試數據的鍵值存到一個實例對象的屬性中,再把每個實例存到一個列表。實際上他們的作用是一樣,隻是第二種方式調用時更簡單。

# read_excel.py
import openpyxl


class CasesData:
 """用於保存測試用例數據"""
 pass


class ReadExcel:

 def __init__(self, file_name, sheet_name):
  self.file_name = file_name
  self.sheet_name = sheet_name

 def open(self):
  self.wb = openpyxl.load_workbook(self.file_name)
  self.sh = self.wb[self.sheet_name]

 def close(self):
  self.wb.close()

 def read_data(self):
  """按行讀取數據,最後返回一個存儲字典的列表"""
  self.open()
  rows = list(self.sh.rows)
  titles = []
  for t in rows[0]:
   title = t.value
   titles.append(title)
  cases = []
  for row in rows[1:]:
   case = []
   for r in row:
    case.append(r.value)
   cases.append(dict(zip(titles, case))) # 通過zip聚合打包用例的標題和數據
  self.close()
  return cases

 def read_data_obj(self):
  """按行讀取數據,最後返回的是一個存儲實例對象的列表"""
  self.open()
  rows = list(self.sh.rows)
  titles = []
  for t in rows[0]:
   title = t.value
   titles.append(title)
  cases = []
  for row in rows[1:]:
   case_obj = CasesData() # 創建一個對象用來保存該行用例數據
   case = []
   for r in row:
    case.append(r.value)
   case_info = dict(zip(titles, case))
   for k, v in case_info.items():
    setattr(case_obj, k, v)
   cases.append(case_obj)
  self.close()
  return cases

 def write_data(self, row, column, msg):
  self.open()
  self.sh.cell(row=row, column=column, value=msg)
  self.wb.save(self.file_name)
  self.close()


if __name__ == '__main__':
 # 直接運行本文件時執行,下面是一個應用實例
 # 需要讀取excel時直接調用ReadExcel類
 test = ReadExcel('cases.xlsx', 'login')
 res = test.read_data_obj()	# 最後返回的是一個存儲實例對象的列表
 print(res[0].case_id)	# 打印第1個用例的case_id
 print(res[3].title)		# 打印第4個用例的title
 
 test2 = ReadExcel('cases.xlsx', 'login')
 res2 = test2.read_data()	# 最後返回一個存儲字典的列表
 print(res2[0]['case_id'])	# 打印第1個用例的case_id
 print(res2[3]['title'])		# 打印第4個用例的title

​ 上面封裝的openpyxl中,應用實例的excel表結構如下:

以上就是python 使用openpyxl讀取excel數據的詳細內容,更多關於python openpyxl讀取excel數據的資料請關註WalkonNet其它相關文章!

推薦閱讀: