JavaScript垃圾回收機制(引用計數,標記清除,性能優化)

一、前言

垃圾回收是JavaScript的隱藏機制,我們通常無需為垃圾回收勞心費力,隻需要專註功能的開發就好瞭。但是這並不意味著我們在編寫JavaScript的時候就可以高枕無憂瞭,伴隨著我們實現的功能越來越復雜,代碼量越積越大,性能問題就變的越來越突出。如何寫出執行速度更快,而且占用內存更小的代碼是程序員永無止歇的追求。一個優秀的程序員總是能在極其有限的資源下,實現驚人的效果,這也正式蕓蕓眾生和高高在上的神祗之間的區別。

二、何為垃圾

代碼執行在計算機的內存中,我們在代碼中定義的所有變量、對象、函數都會在內存中占用一定的內存空間。在計算機中,內存空間是非常緊張的資源,我們必須時時刻刻註意內存的占用量,畢竟內存條非常貴!如果一個變量、函數或者對象在創建之後不再被後繼的代碼執行所需要,那麼它就可以被稱作垃圾。

雖然從直觀上理解垃圾的定義非常容易,但是對於一個計算機程序來說,我們很難在某一時刻斷定當前存在的變量、函數或者對象在未來不再使用。為瞭降低計算機內存的開銷,同時又保證計算機程序正常執行,我們通常規定滿足以下任一條件的對象或者變量為垃圾:

  • 沒有被引用的對象或者變量;
  • 無法訪問到的對象(多個對象之間循環引用);

沒有被引用的變量或者對象相當於一座沒有門的房子,我們永遠都無法進入其中,因此不可能在用到它們。無法訪問到的對象之間雖然具備連通性,但是仍然無法從外部進入其中,因此也無法再次被利用。滿足以上條件的對象或者變量,在程序未來執行過程中絕對不會再次被采用,因此可以放心的當作垃圾回收。

當我們通過以上定義明確瞭需要丟棄的對象,是否就意味著剩餘的變量、對象中就沒有垃圾瞭呢?

不是的!我們當前分辨出的垃圾隻是所有垃圾的一部分,仍然會有其他垃圾不滿足以上條件,但是也不會再次被使用瞭。

這是否可以說滿足以上定義的垃圾是“絕對垃圾”,其他隱藏在程序中的為“相對垃圾”呢?

三、垃圾回收

垃圾回收機制(GC,Garbage Collection)負責在程序執行過程中回收無用的變量和內存占用的空間。一個對象雖然沒有再次使用的可能,但是仍然存在於內存中的現象被稱為內存泄漏。內存泄漏是非常危險的現象,尤其在長時間運行的程序中。如果一個程序出現瞭內存泄漏,它占用的內存空間就會越來越多,直至耗盡內存。

字符串、對象和數組沒有固定的大小,所以隻有當它們大小已知時才能對它們進行動態的存儲分配。JavaScript程序每次創建字符串、數組或對象時,解釋器都要分配內存才存儲這個實體。隻要像這樣動態地分配瞭內存,最終都要釋放這些內存以便它們能夠被再次利用;否則,JavaScript的解釋器將會消耗完系統中所有可用的內存,造成系統崩潰。

JavaScript的垃圾回收機制會間歇性的檢查沒有用途的變量、對象(垃圾),並釋放條它們占用的空間。

四、可達性(Reachability)

不同的編程語言采用不同的垃圾回收策略,例如C++就沒有垃圾回收機制,所有的內存管理靠程序員本身的技能,這也就造成瞭C++比較難以掌握的現狀。JavaScript采用可達性管理內存,從字面意思上看,可達的意思是可以到達,也就是指程序可以通過某種方式訪問、使用的變量和對象,這些變量所占用的內存是不可以被釋放的。

JavaScript規定瞭一個固有的可達值集合,集合中的值天生就是可達的:

當前正在執行的函數上下文(包括函數內的局部變量、函數的參數等);當前嵌套調用鏈上的其他函數、它們的局部變量和參數;全局變量;其他內部的變量;

以上變量稱為,是可達性樹的頂層節點。

如果一個變量或則對象,直接或者間接的被根變量應用,則認為這個變量是可達的。

換一個說法,如果一個值能夠通過根訪問到(例如,A.b.c.d.e),那麼這個值就是可達的。

五、可達性舉例

層次關聯

let people = {
    boys:{
        boys1:{name:'xiaoming'},
        boys2:{name:'xiaojun'},
    },
    girls:{
        girls1:{name:'xiaohong'},
        girls2:{name:'huahua'},
    }
};

以上代碼創建瞭一個對象,並賦值給瞭變量people,變量people中包含瞭兩個對象boysgirlsboysgirls中又分別包含瞭兩個子對象。這也就創建瞭一個包含瞭3層引用關系的數據結構(不考慮基礎類型數據的情況下),

如下圖:

其中,people節點由於是全局變量,所以天然可達。boysgirls節點由於被全局變量直接引用,構成間接可達。boys1boys2girls1girls2由於被全局變量間接應用,可以通過people.boys.boys訪問,因此也屬於可達變量。

如果我們在以上代碼的後面加上以下代碼:

people.girls.girls2 = null;
people.girls.girls1 = people.boys.boys2;

那麼,以上引用層次圖將會變成如下形式:

其中,girls1girls2由於和grils節點斷開連接,從而變成瞭不可達節點,意味著將被垃圾回收機制回收。

而如果此時,我們再執行以下代碼:

people.boys.boys2 = null;

那麼引用層次圖將變成如下形式:

此時,雖然boys節點和boys2節點斷開瞭連接,但是由於boys2節點和girls節點之間存在引用關系,所以boys2仍然屬於可達的,不會被垃圾回收機制回收。

以上關聯關系圖證明瞭為何稱全局變量等值為,因為在關聯關系圖中,這一類值通常作為關系樹的根節點出現。

相互關聯

let people = {
    boys:{
        boys1:{name:'xiaoming'},
        boys2:{name:'xiaojun'},
    },
    girls:{
        girls1:{name:'xiaohong'},
        girls2:{name:'huahua'},
    }
};
people.boys.boys2.girlfriend = people.girls.girls1;	//boys2引用girls1
people.girls.girls1.boyfriend = people.boys.boys2;	//girls1引用boys2

以上代碼在boys2girls1之間創建瞭一個相互關聯的關系,關系結構圖如下:

此時,如果我們切斷boysboys2之間的關聯:

delete people.boys.boys2;

對象之間的關聯關系圖如下:

顯然,並沒有不可達的節點出現。

此時,如果我們切斷boyfriend關系連接:

delete people.girls.girls1;

關系圖變為:

此時,雖然boys2girls1之間還存在girlfriend關系,但是,boys2以及變為不可達節點,將被垃圾回收機制收回。

可達孤島

let people = {
    boys:{
        boys1:{name:'xiaoming'},
        boys2:{name:'xiaojun'},
    },
    girls:{
        girls1:{name:'xiaohong'},
        girls2:{name:'huahua'},
    }
};
delete people.boys;
delete people.girls;

以上代碼形成的引用層次圖如下:

此時,雖然虛線框內部的對象之間仍然存在相互引用的關系,但是這些對象同樣是不可達的,並會被垃圾回收機制刪除。這些節點已經和脫離瞭關系,變的不可達。

六、垃圾回收算法

引用計數

所謂引用計-數,顧名思義,就是每次對象被引用時都進行計數,增加引用就加一,刪除引用就減一,如果引用數變為0,那麼就被認定為垃圾,從而刪除對象回收內存。

舉個例子:

let user = {username:'xiaoming'};//對象被user變量引用,計數+1
let user2 = user;//對象被新的變量引用,計數+1
user = null;//變量不再引用對象,計數-1
user2 = null;//變量不再引用對象,奇數-1
//此時,對象引用數為0,會被刪除

雖然看起來引用計數方法非常合理,實際上,采用引用計數方法的內存回收機制存在明顯的漏洞。

例如:

let boy = {};
let girl = {};
boy.girlfriend = girl;
girl.boyfriend = boy;
boy = null;
girl = null;

以上代碼在boygirl之間存在相互引用,計數刪掉boygirl內的引用,二者對象並不會被回收。由於循環引用的存在,兩個匿名對象的引用計數永遠不會歸零,也就產生瞭內存泄漏。

C++中存在一個智能指針shared_ptr)的概念,程序員可以通過智能指針,利用對象析構函數釋放引用計數。但是對於循環引用的狀況就會產生內存泄漏。

好在JavaScript已經采用瞭另外一種更為安全的策略,更大程度上避免瞭內存泄漏的風險。

標記清除

標記清除mark and sweep)是JavaScript引擎采取的垃圾回收算法,其基本原理是從出發,廣度優先遍歷變量之間的引用關系,對於遍歷過的變量打上一個標記(優秀員工徽章),最後刪除沒有標記的對象。

算法基本過程如下:

  • 垃圾收集器找到所有的,並頒發優秀員工徽章(標記);
  • 然後它遍歷優秀員工,並將優秀員工引用的對象同樣打上優秀員工標記;
  • 反復執行第2步,直至無新的優秀員工加入;
  • 沒有被標記的對象都會被刪除。

舉個栗子:

如果我們程序中存在如下圖所示的對象引用關系:

我們可以清晰的看到,在整個圖片的右側存在一個“可達孤島”,從出發,永遠無法到達孤島。但是垃圾回收器並沒有我們這種上帝視角,它們隻會根據算法會首先把根節點打上優秀員工標記。

然後從優秀員工出發,找到所有被優秀員工引用的節點,如上圖中虛線框中的三個節點。然後把新找到的節點同樣打上優秀員工標記。

反復執行查找和標記的過程,直至所有能找到的節點都被成功標記。

最終達到下圖所示的效果:

由於在算法執行周期結束之後,右側的孤島仍然沒有標記,因此會被垃圾回收器任務無法到達這些節點,最終被清除。

如果學過數據結構和算法的童鞋可能會驚奇的發現,這不就是圖的遍歷嗎,類似於連通圖算法。

七、性能優化

垃圾回收是一個規模龐大的工作,尤其在代碼量非常大的時候,頻繁執行垃圾回收算法會明顯拖累程序的執行。JavaScript算法在垃圾回收上做瞭很多優化,從而在保證回收工作正常執行的前提下,保證程序能夠高效的執行。

性能優化采取的策略通常包括以下幾點:

分代回收

JavaScript程序在執行過程中會維持相當量級的變量數目,頻繁掃描這些變量會造成明顯的開銷。但是這些變量在生命周期上各有特點,例如局部變量會頻繁的創建,迅速的使用,然後丟棄,而全局變量則會長久的占據內存。JavaScript把兩類對象分開管理,對於快速創建、使用並丟棄的局部變量,垃圾回收器會頻繁的掃描,保證這些變量在失去作用後迅速被清理。而對於哪些長久把持內存的變量,降低檢查它們的頻率,從而節約一定的開銷。

增量收集

增量式的思想在性能優化上非常常見,同樣可以用於垃圾回收。在變量數目非常大時,一次性遍歷所有變量並頒發優秀員工標記顯然非常耗時,導致程序在執行過程中存在卡頓。所以,引擎會把垃圾回收工作分成多個子任務,並在程序執行的過程中逐步執行每個小任務,這樣就會造成一定的回收延遲,但通常不會造成明顯的程序卡頓。

空閑收集

CPU即使是在復雜的程序中也不是一直都有工作的,這主要是因為CPU工作的速度非常快,外圍IO往往慢上幾個數量級,所以在CPU空閑的時候安排垃圾回收策略是一種非常有效的性能優化手段,而且基本不會對程序本身造成不良影響。這種策略就類似於系統的空閑時間升級一樣,用戶根本察覺不到後臺的執行。

八、總結

本文的主要任務是簡單的結束垃圾回收的機制、常用的策略和優化的手段,並不是為瞭讓大傢深入瞭解引擎的後臺執行原理。

通過本文,你應該瞭解:

垃圾回收是JavaScript的特性之一,執行在後臺,無需我們操心;垃圾回收的策略是標記清除,按照可達性理論篩選並清除垃圾;標記清楚策略可以避免可達孤島帶來的內存泄漏

到此這篇關於JavaScript垃圾回收機制(引用計數,標記清除,性能優化)的文章就介紹到這瞭,更多相關JS垃圾回收機制 內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: