Python對130w+張圖片檢索的實現方法
任務說明:
130w+張圖片,8張excel表裡記錄瞭需要檢索圖片的文件名,現在需要找出對應的圖片,將找出的圖片按不同的excel分別保存,並且在excel裡能夠直接打開圖片。
任務分析:
如果數據量不大的話,可以直接讀取excel表裡的文件名進行搜索保存,但這次的任務顯然不合適,因為圖片實在太多,所以考慮後按照以下步驟:
1、遍歷圖片文件夾,讀取文件名和文件路徑,寫入到csv文件中;
2、使用pandas的merge函數,實現8張原始excel表與csv文件根據圖片文件名的對碰;
3、使用shutil的copy函數,讀取文件路徑進行保存。
代碼分析:
1、文件遍歷
import os import pandas as pd file_list = [] path_list = [] path = r"此處添加圖片路徑" print("任務開始") for root,dirs,files in os.walk(path): for file in files: file_list.append(file.split('.')[0]) path_list.append(os.path.join(root,file)) print("文件遍歷結束") file_dic = dict(zip(file_list,path_list)) df = pd.DataFrame.from_dict(file_dic,orient='index', columns=['圖片1路徑']).reset_index().rename(columns={'index':'圖片1'}) df.to_csv("圖片1.csv") df = pd.DataFrame.from_dict(file_dic,orient='index', columns=['圖片2路徑']).reset_index().rename(columns={'index':'圖片2'}) df.to_csv("圖片2.csv") df = pd.DataFrame.from_dict(file_dic,orient='index', columns=['圖片3路徑']).reset_index().rename(columns={'index':'圖片3'}) df.to_csv("圖片3.csv") print("文件目錄導出成功")
2、表格對碰
import pandas as pd frame1 = pd.read_excel(r'excel表1.xlsx', 'sheet名') frame2 = pd.read_csv(r'圖片1.csv', sep=',') frame3 = pd.read_csv(r'圖片2.csv', sep=',') frame4 = pd.read_csv(r'圖片3.csv', sep=',') frame5 = pd.merge(frame1, frame2, on = ['圖片1'], how = 'left') frame6 = pd.merge(frame5, frame3, on = ['圖片2'], how = 'left') frame7 = pd.merge(frame6, frame4, on = ['圖片3'], how = 'left') col = ['圖片1','圖片2','圖片3'] frame7[col] = frame7[col].fillna('未找到') frame7.to_excel('excel表1合並後.xlsx')
3、圖片復制
import shutil target = '此處為excel表1導出圖片路徑' copylist1 = frame7['圖片1'] for src in copylist1: if src != '未找到': shutil.copy(src, target) copylist2 = frame7['圖片2'] for src in copylist2: if src != '未找到': shutil.copy(src, target) copylist3 = frame7['圖片3'] for src in copylist3: if src != '未找到': shutil.copy(src, target) print('復制完畢')
4、excel裡打開圖片,可以使用excel自帶的hyperlink函數。
總結
到此這篇關於Python對130w+張圖片檢索實現的文章就介紹到這瞭,更多相關Python圖片檢索內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- pandas針對excel處理的實現
- Python Pandas基礎操作詳解
- python數學建模之三大模型與十大常用算法詳情
- pandas調整列的順序以及添加列的實現
- Python Pandas常用函數方法總結