Python文件系統模塊pathlib庫

一、pathlib庫官方定義

pathlib 是Python內置庫,Python 文檔給它的定義是 Object-oriented filesystem paths(面向對象的文件系統路徑)。pathlib 提供表示文件系統路徑的類,其語義適用於不同的操作系統。

路徑類在純路徑之間劃分,純路徑提供純粹的計算操作而沒有 I / O,以及具體路徑,它繼承純路徑但也提供 I / O 操作。

二、pathlib秘籍

1、 基本用法

  • Path.iterdir() # 遍歷目錄的子目錄或者文件
  • Path.is_dir() # 判斷是否是目錄
  • Path.glob() # 過濾目錄(返回生成器)
  • Path.resolve() # 返回絕對路徑
  • Path.exists() # 判斷路徑是否存在
  • Path.open() # 打開文件(支持with)
  • Path.unlink() # 刪除文件或目錄(目錄非空觸發異常) 

2、 基本屬性

  • Path.parts # 分割路徑 類似os.path.split(), 不過返回元組
  • Path.drive # 返回驅動器名稱
  • Path.root # 返回路徑的根目錄
  • Path.anchor # 自動判斷返回drive或root
  • Path.parents # 返回所有上級目錄的列表

3、 改變路徑

  • Path.with_name() # 更改路徑名稱, 更改最後一級路徑名
  • Path.with_suffix() # 更改路徑後綴

4、 拼接路徑

  • Path.joinpath() # 拼接路徑
  • Path.relative_to() # 計算相對路徑

5、 測試路徑

  • Path.match() # 測試路徑是否符合pattern
  • Path.is_dir() # 是否是文件
  • Path.is_absolute() # 是否是絕對路徑
  • Path.is_reserved() # 是否是預留路徑
  • Path.exists() # 判斷路徑是否真實存在

6、 其他方法

  • Path.cwd() # 返回當前目錄的路徑對象
  • Path.home() # 返回當前用戶的home路徑對象
  • Path.stat() # 返回路徑信息, 同os.stat()
  • Path.chmod() # 更改路徑權限, 類似os.chmod()
  • Path.expanduser() # 展開~返回完整路徑對象
  • Path.mkdir() # 創建目錄
  • Path.rename() # 重命名路徑
  • Path.rglob() # 遞歸遍歷所有子目錄的文件

三、os和pathlib.Path的區別

相對於 os 模塊的 path 方法,Python3 標準庫 pathlib 模塊的 Path 對路徑的操作會更簡單。

1、 獲取當前文件路徑

使用 os 模塊時,通過 getcwd() 方法可以直接獲取當前文件路徑

在 Pycharm 中,可以使用 os.path.dirname(__file__) 獲取當前文件路徑,因為 Python 並沒有提供 __file__ 這個概念,他是 Pycharm 提供的:

import os

print(os.getcwd())  # C:\Users\bobin.yang\PycharmProjects\untitled
print(os.path.dirname(__file__))  # C:/Users/bobin.yang/PycharmProjects/untitled

在 pathlib 模塊中,通過 Path.cwd() 方法可以直接獲取當前文件路徑,我們可以動手試一試:

import pathlib

print(pathlib.Path.cwd())  # C:\Users\bobin.yang\PycharmProjects\untitled

通過 Pycharm 我們可以使用快捷鍵 ctrl+鼠標左鍵 點擊查看該方法的詳細介紹。

從上圖中可以看出 cwd() 方法不過是對 os 庫中 getcwd() 方法進行瞭封裝,看起來好像更差勁瞭,但是官方的推出一定不是子虛烏有的,現在讓我們一起來揭秘。

2、 獲取上層/上層目錄

上面那個案例仿佛讓 pashlib 庫的使用變得更加復雜瞭,為瞭揭秘,我們隻能一同感受下 pathlib 庫的構成,瞭解 pathlib 庫如何帶給我們便捷。

在 os 模塊中,如果我們要獲取某一個文件的父目錄,os 模塊的寫法為:

import os

print(os.path.dirname(os.path.dirname(os.getcwd())))  # C:\PycharmProjects

在 pathlib 庫中,可以通過這樣簡潔方法實現:

import pathlib

print(pathlib.Path.cwd().parent)   # C:\PycharmProjects

並且,如果你需要找他爺爺,是不是再來一個 .parent 就行瞭。相比較 os 模塊的 os.path.dirname() 是不是方便太多太多瞭?

3、 路徑拼接

如果你要在他父目錄中拼接路徑,通過 os 模塊你可能需要寫這麼一長串代碼:

import os

print(os.path.join(os.path.dirname(os.getcwd()), '路徑拼接', '真麻煩'))  # C:\PycharmProjects\路徑拼接\真麻煩

當你使用 pathlib 的時候,我們一起來感受他的便捷之處吧!

# /Users/mac/test.py
import os

paths = ('路徑拼接', '真麻煩')
print(pathlib.Path.cwd().parent.joinpath(*paths))  # C:\PycharmProjects\路徑拼接\真麻煩

通過 pathlib 庫拼接路徑,你可以很方便的調節他在他祖輩的位置,妙哉。

4、 其他封裝

pathlib 封裝瞭很多的 os.path 中的方法,如下所示:

  • os.path.expanduser() –> pathlib.Path.home()
  • os.path.expanduser() –> pathlib.Path.expanduser()
  • os.stat() –> pathlib.Path.stat()
  • os.chmod() –> pathlib.Path.chmod()

四、pathlib.PurePath的使用

上一節的操作大部分都是通過 pathlib 庫中的 Path 實現,其實他還有一個更加高大上的模塊,也就是我們這一節的主角:pathlib.PurePath

PurePath 是一個純路徑對象,純路徑對象提供瞭實際上不訪問文件系統的路徑處理操作。

有三種方法可以訪問這些類,我們也稱之為 flavor 。

1、 PurePath.match

下面讓我們來實現一個神奇的功能,判斷當前的路徑下是否有符合'*.py'規則的文件。

import pathlib

print(pathlib.PurePath(__file__).match('*.py'))  # True

輸出為什麼會是 True 呢?因為當前文件夾下不就有一個 test.py 嗎?

2、 PurePath的子類:PurePosixPath(非Windows系統)、PureWindowsPath

看見 pathlib.PurePath 後面跟著 match,那是不是能說明他是個對象,而不是一個單純的路徑字符串,因此我們可以試著打印 pathlib.PurePath 看一看。

import pathlib

os_path = os.path.dirname(__file__)
print(os_path)  # C:/PycharmProjects/untitled

pure_path = pathlib.PurePath(__file__)
print(pure_path)  # C:\PycharmProjects\untitled\run.py
print(type(pure_path))  # <class 'pathlib.PureWindowsPath'>


print(pathlib.PurePath(__file__).match('*.py'))  # True

通過打印 os.path 獲取當前路徑的結果,得到一個路徑字符串;而通過 pathlib.PurePath 則獲得瞭一個 PurePosixPath 對象,並且由此得到的路徑包括瞭當前文件 run.py。

到此這篇關於Python文件系統模塊pathlib庫的文章就介紹到這瞭。希望對大傢的學習有所幫助,也希望大傢多多支持WalkonNet。

推薦閱讀: