Linux的文件描述符、文件指針、索引節點詳情

Linux–文件描述符、文件指針、索引節點

一、Linux —— 文件描述符

1、文件描述符 Fd

當進程打開文件或創建新文件時,內核會返回一個文件描述符(非負整數),用來指向被打開的文件,所有執行I/O操作的系統調用(read、write)都會通過文件描述符。

文件描述符可以理解為進程文件描述表這個表的索引,或者把文件描述表看做一個數組的話,文件描述符可以看做是數組的下標。當需要進行I/O操作的時候,會傳入fd作為參數,先從進程文件描述符表查找該fd對應的那個條目,取出對應的那個已經打開的文件的句柄,根據文件句柄指向,去系統fd表中查找到該文件指向的inode,從而定位到該文件的真正位置,從而進行I/O操作。

特點:

  • 每個文件描述符會與一個打開的文件相對應
  • 不同的文件描述符也可能指向同一個文件
  • 相同的文件可以被不同的進程打開,也可以在同一個進程被多次打開

相關的三張表:

進程級的文件描述符表

struct task_struct {
  //...
  
    struct files_struct *files // 進程級別的文件描述符表
    
  //...
    
};

2、系統級的文件描述符表

內核對系統所有打開的文件維護瞭一個打開文件表,表中每一項稱為打開文件句柄,一個打開文件句柄描述瞭一個打開文件的全部信息

  • 當前文件偏移量(調用read()和write()時更新,或使用lseek()直接修改)
  • 打開文件時所使用的狀態標識(即,open()的flags參數)
  • 文件訪問模式(如調用open()時所設置的隻讀模式、隻寫模式或讀寫模式)
  • 與信號驅動相關的設置
  • 對該文件i-node對象的引用
  • 文件類型(例如:常規文件、套接字或FIFO)和訪問權限
  • 一個指針,指向該文件所持有的鎖列表
  • 文件的各種屬性,包括文件大小以及與不同類型操作相關的時間戳

3、文件系統的inode表

每個文件系統會為存儲於其上的所有文件維護一個inode表

文件描述符表、打開文件表、inode表之間的關系:

進程A文件描述符1和20指向同一個打開文件句柄,是因為多次調用open()等函數打開同一個文件導致。

進程A的文件描述符2和進程B的文件描述符2指向同一個打開文件句柄可能是因為調用fork()後出現的,子進程會繼承父進程的打開文件描述符表,也就是子進程繼承父進程打開文件。;或者某進程通過unix域套接字將一個打開的文件描述符傳遞給另一個進程;或者不通進程獨自調用open函數打開同一個文件是正好分配到與其他進程打開該文件描述符一樣。

進程A的描述符0和進程B的描述符3分別指向不同的打開文件句柄,但這些句柄均指向i-node表的相同條目,即同一個文件,發生這種情況是因為每個進程各自對同一個文件發起瞭open()調用。同一個進程兩次打開同一個文件,也會發生類似情況。

二、文件指針 *FILE

C語言中使用的是文件指針而不是文件描述符作為I/O的句柄,“文件指針(file pointer)”指向進程用戶區中的一個被稱為FILE結構的數據結構。當通過文件指針操作文件時,需要調用C語言stdio.h中提供的文件API(fopen()、fread()等)。

文件描述符在POSIX系統調用中直接可見,文件指針是C語言在其基礎上的包裝。

int open(const char *path, int access,int mode)  
FILE *fopen(char *filename, char *mode)

文件路徑 到 文件指針:filepath –fopen()–>FILE*;
文件路徑 到 文件描述符:filepath–open()–fd;
文件描述符 到 文件指針:fd–fdopen()–>FILE*;
文件指針 到 文件描述符:FILE*–fileno()—>fd;

三、索引節點 Inode

index node是類unix系統中保存文件系統中對象元數據的數據結構。

inode主要存儲以下數據:

  • inode編號
  • 文件大小
  • 占用的塊數目與塊大小
  • 文件類型(普通文件、目錄、管道,etc.)
  • 存儲該文件的設備號
  • 鏈接數目
  • 讀、寫、執行權限
  • 擁有者的用戶ID和組ID
  • 文件的最近訪問、數據最近修改時間
  • inode最近修改時間

stat命令可以查看元數據,`df -i查看每個硬盤分區的inode總數和已經使用的數量。除瞭文件名以外的所有信息,都存在inode中。

inode也會消耗硬盤空間,所以硬盤格式化的時候,操作系統自動將硬盤分成兩個區域。一個是數據區,存放文件數據;另一個是inode區(inode table),存放inode所包含的信息。

每個inode節點的大小,一般是128字節256字節。inode節點的總數,在格式化時就給定,一般是每1KB或每2KB就設置一個inode。假定在一塊1GB的硬盤中,每個inode節點的大小為128字節,每1KB就設置一個inode,那麼inode table的大小就會達到128MB,占整塊硬盤的12.8%。

每個文件都有一個inode,因此有可能inode已經用完但是硬盤還未存滿的情況。linux系統不使用文件名而使用inode來識別文件。

表面上,用戶通過文件名,打開文件。實際上,系統內部這個過程分成三步:首先,系統找到這個文件名對應的inode號碼;其次,通過inode號碼,獲取inode信息;最後,根據inode信息,找到文件數據所在的block,讀出數據。

目錄文件就是由一系列目錄項組成的數據結構,每個目錄項包含文件名和inode號碼兩部分。

1、Inode特殊作用

  • 有時,文件名包含特殊字符,無法正常刪除。這時,直接刪除inode節點,就能起到刪除文件的作用。
  • 移動文件或重命名文件,隻是改變文件名,不影響inode號碼。
  • 打開一個文件以後,系統就以inode號碼來識別這個文件,不再考慮文件名。因此,通常來說,系統無法從inode號碼得知文件名。

第3點使得軟件更新變得簡單,可以在不關閉軟件的情況下進行更新,不需要重啟。因為系統通過inode號碼,識別運行中的文件,不通過文件名。更新的時候,新版文件以同樣的文件名,生成一個新的inode,不會影響到運行中的文件。等到下一次運行這個軟件的時候,文件名就自動指向新版文件,舊版文件的inode則被回收。

四、拓展

1、磁盤結構

文件儲存在硬盤上,硬盤的最小存儲單位叫做”扇區”(Sector)。每個扇區儲存512字節(相當於0.5KB)。

操作系統讀取硬盤的時候,不會一個個扇區地讀取,這樣效率太低,而是一次性連續讀取多個扇區,即一次性讀取一個”塊”(block)。這種由多個扇區組成的”塊”,是文件存取的最小單位。”塊”的大小,最常見的是4KB,即連續八個 sector組成一個 block。

由上,可用(柱面號,盤面號,扇區號)來定位任意一個“磁盤塊”,我們經常提到文件數據存放在外存中的幾號塊(邏輯地址),這個塊號就可以轉換成(柱面號,盤面號,扇區號)的地址形式。

可根據該地址讀取一個“塊”,操作如下:

① 根據“柱面號”移動磁臂,讓磁頭指向指定柱面(也稱磁道)

② 激活指定盤面對應的磁頭;

③ 磁盤旋轉的過程中,指定的扇區會從磁頭下面劃過,這樣就完成瞭對指定扇區的讀/寫

到此這篇關於Linux的文件描述符、文件指針、索引節點詳情的文章就介紹到這瞭,更多相關Linux文件描述符、文件指針、索引節點內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: