python使用技巧-查找文件 

標準庫的fnmatch庫專門用來進行文件名匹配,支持使用通配符進行字符串匹配。

  • 1、fnmatch:判斷文件名是否符合特定的模式;
  • 2、fnmatchcase:判斷文件名是否符合特定的模式,不區分大小寫;
  • 3、filter:返回輸入列表中,符合特定模式的文件名列表;
  • 4、translate:將通配符模式轉換成正則表達式。  

fnmatchcase函數與fnmatch函數幾乎一樣,隻是在匹配文件名時會忽略文件名中字母的大小寫。  

filter函數與fnmatch函數比較類似,區別在於fnmatch每次對一個文件名進行匹配判斷,filter函數每次對一組文件名進行匹配判斷。filter 函數接受文件名列表為第一個參數,文件名模式為第二個參數,然後以列表的形式返回輸入列表中所有符合模式的文件名。  

import os,fnmatch

names = os.listdir('.')
for name in names:
    if fnmatch.fnmatch(name,'*.xlsx'):
        print(name)
    if fnmatch.fnmatch(name,'[a-z]*'):
        print(name)
print(fnmatch.filter(names,"[a-z]*.xlsx"))

目前,我們要獲取特定類型的文件列表,都是先通過os.listdir獲取文件列表,然後通過使用fnmatch進行文件名模式匹配進行過濾。而在Python中還有更加簡單的方式,即使用標準庫的glob庫。glob的作用相當於os.listdir加上fnmatch。使用glob以後,不需要調用os.listdir獲取文件列表,直接通過模式匹配即可。

import glob

print(glob.glob('*.xlsx'))
print(glob.glob('[a-z]*'))

前面的例子都是查找某一個目錄下的文件並通過模式匹配去選擇自己需要的文件類型。在實際工作過程中,更有可能遇到的是查找某個目錄及其子目錄下的所有文件。例如查找某個目錄及其子目錄下的圖片。可以使用os模塊的walk函數。walk函數遍歷某個目錄及其子目錄,對於每一個目錄,walk返回一個三元組(dirpath, dirnames,filenames)。其中dirpath保存的是當前目錄,dirnames是當前目錄下的子目錄列表,filenames是當前目錄下的文件列表。  

import os,fnmatch

images = ['*.jpg','*.jpeg','*.png','*.tif','*.tiff']
matches = []
for dirpath,dirnames,filenames in os.walk(os.path.expanduser(r"D:/test")):
    for image in images:
        for filename in fnmatch.filter(filenames,image):
            matches.append(os.path.join(dirpath,filename))
print(matches)

在遍歷目錄及其子目錄時,如果想要忽略掉某一個子目錄,可以直接修改三元組中的dirnames,即從dirnames列表中移除需要忽略掉的目錄。

if 'extest' in dirnames:  
    dirnames.remove('extest')

到此這篇關於python使用技巧-查找文件 的文章就介紹到這瞭,更多相關python查找文件 內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: