Python對130w+張圖片檢索的實現方法

任務說明:

130w+張圖片,8張excel表裡記錄瞭需要檢索圖片的文件名,現在需要找出對應的圖片,將找出的圖片按不同的excel分別保存,並且在excel裡能夠直接打開圖片。

任務分析:

如果數據量不大的話,可以直接讀取excel表裡的文件名進行搜索保存,但這次的任務顯然不合適,因為圖片實在太多,所以考慮後按照以下步驟:

1、遍歷圖片文件夾,讀取文件名和文件路徑,寫入到csv文件中;

2、使用pandas的merge函數,實現8張原始excel表與csv文件根據圖片文件名的對碰;

3、使用shutil的copy函數,讀取文件路徑進行保存。

代碼分析:

1、文件遍歷

import os
import pandas as pd
 
file_list = []
path_list = []
path = r"此處添加圖片路徑"
print("任務開始")
for root,dirs,files in os.walk(path):
 for file in files:
  file_list.append(file.split('.')[0])
  path_list.append(os.path.join(root,file))
print("文件遍歷結束")
file_dic = dict(zip(file_list,path_list))
df = pd.DataFrame.from_dict(file_dic,orient='index', columns=['圖片1路徑']).reset_index().rename(columns={'index':'圖片1'})
df.to_csv("圖片1.csv")
df = pd.DataFrame.from_dict(file_dic,orient='index', columns=['圖片2路徑']).reset_index().rename(columns={'index':'圖片2'})
df.to_csv("圖片2.csv")
df = pd.DataFrame.from_dict(file_dic,orient='index', columns=['圖片3路徑']).reset_index().rename(columns={'index':'圖片3'})
df.to_csv("圖片3.csv")
print("文件目錄導出成功")

2、表格對碰

import pandas as pd
frame1 = pd.read_excel(r'excel表1.xlsx', 'sheet名')
frame2 = pd.read_csv(r'圖片1.csv', sep=',')
frame3 = pd.read_csv(r'圖片2.csv', sep=',')
frame4 = pd.read_csv(r'圖片3.csv', sep=',')
frame5 = pd.merge(frame1, frame2, on = ['圖片1'], how = 'left')
frame6 = pd.merge(frame5, frame3, on = ['圖片2'], how = 'left')
frame7 = pd.merge(frame6, frame4, on = ['圖片3'], how = 'left')
col = ['圖片1','圖片2','圖片3']
frame7[col] = frame7[col].fillna('未找到')
frame7.to_excel('excel表1合並後.xlsx')

3、圖片復制

import shutil
target = '此處為excel表1導出圖片路徑'
copylist1 = frame7['圖片1']
for src in copylist1:
  if src != '未找到':
    shutil.copy(src, target)
copylist2 = frame7['圖片2']
for src in copylist2:
  if src != '未找到':
    shutil.copy(src, target)
copylist3 = frame7['圖片3']
for src in copylist3:
  if src != '未找到':
    shutil.copy(src, target)
print('復制完畢')

4、excel裡打開圖片,可以使用excel自帶的hyperlink函數。

總結

到此這篇關於Python對130w+張圖片檢索實現的文章就介紹到這瞭,更多相關Python圖片檢索內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: