PHP垃圾回收機制的一些理解

相信隻要入門學習過一點開發的同學都知道,不管任何編程語言,一個變量都會保存在內存中。其實,我們這些開發者就是在來回不停地操縱內存,相應地,我們如果一直增加新的變量,內存就會一直增加,如果沒有一個好的機制,那麼內存就會無限制地增加最終撐滿所有的內存。這就造成瞭內存泄露。但在日常開發中,除非一次加載一個很大的文件,我們幾乎見不到內存超限的錯誤,這就是垃圾回收機制的作用。

垃圾回收是什麼東西?

在使用 C 語言的時候,我們都要手動使用 free 來釋放內存,在 C 之後的大部分編程語言都會自帶一個垃圾回收之類的處理能力,也就是我們今天要說的垃圾回收機制,也稱為 GC 。在有 GC 能力的開發語言中,我們不需要去關心什麼時候釋放內存,甚至我們完全不需要去瞭解這一塊的內容,因為這些語言在底層已經幫我們處理好瞭關於內存釋放的問題。

當然這方面的內容最出名的就是 Java 中的垃圾回收機制,其實 PHP 也有相應的處理機制,當然,很多 PHPer 可能從來沒接觸過,今天我們就來探討一下這方面的內容。

PHP 的垃圾回收算法

在之前的文章中,我們有介紹過引用計數的概念。在 PHP5.3 之前,PHP 的垃圾回收機制非常簡單,就是把 refcount 為0的全部清理回收掉,在底層也就是 free 掉瞭。但是這種方式會帶來一個問題,也就是我們在引用計數這篇文章中說過的循環引用,這種引用問題通過普通的判斷 refcount 的方式是無法回收的。所以在 PHP5.3 之前,循環引用是會造成內存泄露的。

之所以強調版本,那是因為在 5.3 之後,PHP 改進瞭垃圾回收的算法,使這種循環引用得到瞭解決。(當然,我們在日常開發中盡量要避免這種循環引用的問題)。具體算法我們引用官方的圖片:

在官方文檔中有詳盡的解釋,不過還是會看得很懵逼。我們就用簡單的語言(說人話)來描述這個過程。

首先,我們有個根緩沖區的概念,就是圖中的 root 。在底層通過一系列看不懂搞不明白的算法我們能找到每個變量的一個可能根。PHP 會將變量的可能根放入根緩沖區。

當根緩沖區滿瞭的時候,一般這個默認值是10000,需要修改源碼重新編譯才能修改這個值。PHP 就會啟動垃圾回收機制,從根緩沖區中按照深度遍歷的算法來查找所有的和這個可能根相關的變量,並將某一個可能根找到的變量的 refcount 減1,並做一個標記當前這個“已減”。

然後再次深度遍歷,如果 refcount 不是0的,就加1,如果是0的就保持不變。

接著清除根緩沖區中的所有可能根,清除而不是刪除。然後清理釋放所有的 refcount 為0的變量內容。

是不是已經懵逼瞭?其實我也很懵逼,都不知道這段是怎麼寫下來的….

記住幾個要點就可以對付面試並秒殺大部分人瞭。

  • PHP5.3 後並不是直接看每個變量的 refcount 是否為0瞭
  • 使用的算法是深度遍歷,有個根緩沖區,根據它來清理,具體算法需要比較紮實的 C 和算法基礎,學源碼的時候再好好研究吧
  • 5.3 之後和算法解決瞭循環引用的問題
  • 內存泄露值會保持在某一個范圍,不會出現立即大范圍崩潰的情況

垃圾回收對性能的影響

前文說過,垃圾回收在根緩沖區滿瞭之後會馬上執行。其中也會進行兩次的深度遍歷,這就不可避免的帶來瞭性能的消耗。畢竟算法的執行都是需要耗時的。不過相對於內存溢出這種毀滅性的錯誤來說,垃圾回收帶來的性能損耗基本上是可以忽略不計的。

總結

垃圾回收的內容其實我們隻需要記住幾個關鍵點就可以瞭,具體的核心算法和內容是需要在更深入的研究源碼後才能完全瞭解的,當然,這也是我們學習的目標,之後也一定會涉獵源碼底層的相關內容,就讓我們拭目以待吧!

以上就是PHP垃圾回收機制的一些理解的詳細內容,更多關於PHP垃圾回收機制的資料請關註WalkonNet其它相關文章!