深入瞭解PHP的垃圾回收機制

一、引用計數基礎知識

每個php變量存在一個叫 zval 的變量容器中。

一個 zval 變量容器,除瞭包含變量的類型和值,還包括兩個字節的額外信息。

第一個是 is_ref,是個bool值,用來標識這個變量是否是屬於引用集合。通過這個字節,php引擎才能把普通變量和引用變量區分開來,由於php允許用戶通過使用&來使用自定義引用,zval變量容器中還有一個內部引用計數機制,來優化內存使用。

第二個額外字節是 refcount,用以表示指向這個zval變量容器的變量個數。

所有的符號存在一個符號表中,其中每個符號都有作用域(scope),那些主腳本(比如:通過瀏覽器請求的的腳本)和每個函數或者方法也都有作用域。

二、生成zval容器

當一個變量被賦常量值時,就會生成一個zval變量容器

如果安裝瞭Xdebug,則可以通過 xdebug_debug_zval() 查看這兩個

<?php
$a = "new string";
xdebug_debug_zval('a');
 
//結果
a: (refcount=1, is_ref=0)='new string'

三、增加zval的引用計數

把一個變量賦值給另一變量將增加引用次數

<?php
$a = "new string";
$b = $a;
xdebug_debug_zval( 'a' );
 
//結果
a: (refcount=2, is_ref=0)='new string'

四、減少zval引用計數

使用 unset() 可以減少引用次數 

包含類型和值的這個變量容器就會從內存中刪除

<?php
$a = "new string";
$c = $b = $a;
xdebug_debug_zval( 'a' );
unset( $b, $c );
xdebug_debug_zval( 'a' );
 
//結果
a: (refcount=3, is_ref=0)='new string'
a: (refcount=1, is_ref=0)='new string'

五、復合類型的zval容器

  • 與 標量(scalar)類型的值不同
  • array和 object類型的變量把它們的成員或屬性存在自己的符號表中
  • 這意味著下面的例子將生成三個zval變量容器
  • 這三個zval變量容器是: a,meaning和 number

<?php
$a = array( 'meaning' => 'life', 'number' => 42 );
xdebug_debug_zval( 'a' );
 
//結果
a: (refcount=1, is_ref=0)=array (
   'meaning' => (refcount=1, is_ref=0)='life',
   'number' => (refcount=1, is_ref=0)=42
)

六、增加復合類型的引用計數

添加一個已經存在的元素到數組中

<?php
$a = array( 'meaning' => 'life', 'number' => 42 );
$a['life'] = $a['meaning'];
xdebug_debug_zval( 'a' );
 
//結果
a: (refcount=1, is_ref=0)=array (
   'meaning' => (refcount=2, is_ref=0)='life',
   'number' => (refcount=1, is_ref=0)=42,
   'life' => (refcount=2, is_ref=0)='life'
)

七、減少復合類型的引用計數

刪除數組中的一個元素

就是類似於從作用域中刪除一個變量.

刪除後,數組中的這個元素所在的容器的“refcount”值減少

<?php
$a = array( 'meaning' => 'life', 'number' => 42 );
$a['life'] = $a['meaning'];
unset( $a['meaning'], $a['number'] );
xdebug_debug_zval( 'a' );
 
//結果
a: (refcount=1, is_ref=0)=array (
   'life' => (refcount=1, is_ref=0)='life'
)

八、特殊情況

當我們添加一個數組本身作為這個數組的元素時,事情就變得有趣 

同上,對一個變量調用unset,將刪除這個符號,且它指向的變量容器中的引用次數也減1

<?php
$a = array( 'one' );
$a[] = &$a;
xdebug_debug_zval( 'a' );
 
//結果
a: (refcount=2, is_ref=1)=array (
   0 => (refcount=1, is_ref=0)='one',
   1 => (refcount=2, is_ref=1)=...
)

九、清理變量容器的問題

盡管不再有某個作用域中的任何符號指向這個結構(就是變量容器),由於數組元素“1”仍然指向數組本身,所以這個容器不能被清除 。

因為沒有另外的符號指向它,用戶沒有辦法清除這個結構,結果就會導致內存泄漏。

慶幸的是,php將在腳本執行結束時清除這個數據結構,但是在php清除之前,將耗費不少內存。

如果上面的情況發生僅僅一兩次倒沒什麼,但是如果出現幾千次,甚至幾十萬次的內存泄漏,這顯然是個大問題

十、回收周期

像以前的 php 用到的引用計數內存機制,無法處理循環的引用內存泄漏

而在php 5.3.0 中使用同步算法,來處理這個內存泄漏問題

如果一個引用計數增加,它將繼續被使用,當然就不再在垃圾中。

如果引用計數減少到零,所在變量容器將被清除(free)

就是說,僅僅在引用計數減少到非零值時,才會產生垃圾周期

在一個垃圾周期中,通過檢查引用計數是否減1,並且檢查哪些變量容器的引用次數是零,來發現哪部分是垃圾

十一、回收算法分析

為避免不得不檢查所有引用計數可能減少的垃圾周期

這個算法把所有可能根(possible roots 都是zval變量容器),放在根緩沖區(root buffer)中(用紫色來標記,稱為疑似垃圾),這樣可以同時確保每個可能的垃圾根(possible garbage root)在緩沖區中隻出現一次。僅僅在根緩沖區滿瞭時,才對緩沖區內部所有不同的變量容器執行垃圾回收操作。看上圖的步驟 A。

在步驟 B 中,模擬刪除每個紫色變量。模擬刪除時可能將不是紫色的普通變量引用數減"1",如果某個普通變量引用計數變成0瞭,就對這個普通變量再做一次模擬刪除。每個變量隻能被模擬刪除一次,模擬刪除後標記為灰

在步驟 C 中,模擬恢復每個紫色變量。恢復是有條件的,當變量的引用計數大於0時才對其做模擬恢復。同樣每個變量隻能恢復一次,恢復後標記為黑,基本就是步驟 B 的逆運算。這樣剩下的一堆沒能恢復的就是該刪除的藍色節點瞭,在步驟 D 中遍歷出來真的刪除掉

十二、性能考慮

主要有兩個領域對性能有影響

第一個是內存占用空間的節省

另一個是垃圾回收機制釋放已泄漏的內存耗費的時間增加

十三、垃圾回收機制的結論

PHP中的垃圾回收機制,僅僅在循環回收算法確實運行時會有時間消耗上的增加。但是在平常的(更小的)腳本中應根本就沒有性能影響。

然而,在平常腳本中有循環回收機制運行的情況下,內存的節省將允許更多這種腳本同時運行在你的服務器上。因為總共使用的內存沒達到上限。

這種好處在長時間運行腳本中尤其明顯,諸如長時間的測試套件或者daemon腳本此類。

到此這篇關於深入瞭解PHP的垃圾回收機制的文章就介紹到這瞭,更多相關PHP垃圾回收機制內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: