python通配符之glob模塊的使用詳解

通配符是一些特殊符號,主要有星號(*)和問號(?),用來模糊搜索文件,“*”可以匹配任意個數個符號, “?”可以匹配單個字符。

當查找文件夾時,可以使用它來代替一個或多個真正字符;當不知道真正字符或者需要匹配符合一定條件的多個目標文件時,可以使用通配符代替一個或多個真正的字符。

英文 “globbing”意為統配,python在模塊glob中定義瞭glob()函數,實現瞭對目錄內容進行匹配的功能,glob.glob()函數接受通配模式作為輸入,並返回所有匹配的文件名和路徑名列表,與os.listdir類似。

glob模塊中的常用函數:

glob(pathname, recursive=False) 

第一個參數pathname為需要匹配的字符串。(該參數應盡量加上r前綴,以免發生不必要的錯誤)

第二個參數代表遞歸調用,與特殊通配符“**”一同使用,默認為False。

該函數返回一個符合條件的路徑的字符串列表,如果使用的是Windows系統,路徑上的“\”符號會自動加上轉義符號變為“\\”。

iglob(pathname, recursive=False) 

參數與glob()一致。

返回一個迭代器,該迭代器不會同時保存所有匹配到的路徑,而是逐個獲取匹配的文件路徑名,遍歷該迭代器的結果與使用相同參數調用glob()的返回結果一致。

glob模塊支持的通配符:

通配符 功能
* 匹配0或多個字符
** 匹配所有文件、目錄、子目錄和子目錄裡的文件(3.5版本新增)
? 匹配1個字符,與正則表達式裡的?不同
[exp] 匹配指定范圍內的字符,如:[1-9]匹配1至9范圍內的字符
[!exp] 匹配不在指定范圍內的字符

glob.glob函數使用示例

import glob
 
listglob = []
listglob = glob.glob(r"/home/xxx/picture/*.png")
listglob.sort()
print listglob
 
print '--------------------'
listglob = glob.glob(r"/home/xxx/picture/0?.png")
listglob.sort()
print listglob
 
print '--------------------'
listglob = glob.glob(r"/home/xxx/picture/0[0,1,2].png")
listglob.sort()
print listglob
 
print '--------------------'
listglob = glob.glob(r"/home/xxx/picture/0[0-3].png")
listglob.sort()
print listglob
 
print '--------------------'
listglob = glob.iglob(r"/home/xxx/picture/0[a-z].png")
print listglob
for item in listglob:
    print item

補充:Python glob() 函數 秒懂

Python glob()

glob模塊是最簡單的模塊之一,內容非常少。用它可以查找符合特定規則的文件路徑名。

跟使用windows下的文件搜索差不多。查找文件隻用到三個匹配符:’*’, “?”, “[ ]”。”*”匹配任意0個或多個字符;”?”匹配任意單個字符;”[ ]”匹配指定范圍內的字符,如:[0-9]匹配數字。

不區分大小寫

‘.’開頭的不匹配

print(glob.glob(r’ . ./*’) )

上一級所有目錄

>>> print(glob.glob("../*"))
['..\\Python37-32', '..\\Python38-32']

print(glob.glob(r’ ./*’) )

本級所有目錄

>>> print(glob.glob("./*"))
['.\\DLLs', '.\\Doc', '.\\include', '.\\Lib', '.\\libs', '.\\LICENSE.txt', '.\\NEWS.txt', '.\\python.exe', '.\\python3.dll', '.\\python38.dll', '.\\pythonw.exe', '.\\Scripts', '.\\tcl', '.\\Tools', '.\\vcruntime140.dll']

print(glob.glob(r’ ./ * . *’) )

本級所有文件

print(glob.glob("./*.*"))
['.\\LICENSE.txt', '.\\NEWS.txt', '.\\python.exe', '.\\python3.dll', '.\\python38.dll', '.\\pythonw.exe', '.\\vcruntime140.dll']

print(glob.glob(r’ ./ * . *’) )

本級所有dll

>>> print(glob.glob("./*.dll"))
['.\\python3.dll', '.\\python38.dll', '.\\vcruntime140.dll']

print(glob.glob(r’ C:/ * ‘) )

C盤所有目錄

>>> print(glob.glob("C:/*"))
['C:/$360Section', 'C:/$Recycle.Bin', 'C:/360SANDBOX', 'C:/Boot', 'C:/bootmgr'.......]

print(glob.glob(“C:/[PB][RO]”) )

C盤所有包含pr/po/br/bo的目錄

print(glob.glob("C:/*[PB][RO]*"))
['C:/360SANDBOX', 'C:/Boot', 'C:/bootmgr', 'C:/BOOTNXT', 'C:/BOOTSECT.BAK', 'C:/PO', 'C:/Program Files', 'C:/Program Files (x86)', 'C:/ProgramData']

print(glob.glob(“C:/p?O”) )

C盤所有包含P_o的目錄

>>> print(glob.glob("C:/*P?O*"))
['C:/Program Files', 'C:/Program Files (x86)', 'C:/ProgramData']

print(glob.glob(“C://.txt”) )

C盤兩級目錄所有的txt

>>> print(glob.glob("C:/*/*.txt"))
['C:/xiaoyi\\檢索式.txt']

以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方,望不吝賜教。

推薦閱讀: