JVM的垃圾回收算法一起來看看

垃圾回收算法

概念

垃圾回收(Garbage Collection,GC)。程序的運行需要資源,無效的對象如果不及時清理就會一直占用資源,所以對內存資源管理就變得十分重要。而Java為瞭讓我們更多的關註代碼本身,而不用過多的考慮內存的釋放問題,就有瞭我們十分熟悉的GC。然而當垃圾回收成為系統達到更高並發量的瓶頸時,我們就需要對這些自動化的技術進行一系列的監控和調節。 

GC主要需要完成三件事情 :

哪些內存需要回收?
什麼時候回收?
如何回收?

哪些垃圾需要回收呢?這個時候我們如何判斷哪些對象“活著”,哪些對象“死去”?於是就有瞭標記算法。

1.標記算法

垃圾收集器中標記算法有兩種,引用計數法和根可達算法

1.1 引用計數法(Reference Counting)

引用計數算法很簡單,它實際上是通過在對象頭中分配一個空間來保存該對象被引用的次數。如果該對象被其它對象引用,則它的引用計數加1,如果刪除對該對象的引用,那麼它的引用計數就減1,當該對象的引用計數為0時,那麼該對象就會被回收。

如:

A objA = new A();
B objB = new B();
objA.ref = objB;

如圖:

在這裡插入圖片描述

對象 A 的實例在Java堆中就是一塊內存而已,而objA 做為一個局部變量引用瞭它,所以它的引用計數就是1,對象B的實例在堆中也是一塊內存,objB這個局部變量引用瞭它,然後objA又引用瞭它一次,所以它的引用計數就是2。

客觀來說,引用計數算法 效率高,實現簡單,然而,Java虛擬機沒有選取引用計數算法來管理內存,主要是因為無法解決 循環引用的問題

如:

objA.ref= objB;
objB.ref= objA

如圖:

在這裡插入圖片描述

實際上這兩個對象已經不可能再被訪問,但是它們因為互相引用著對方,導致它們的引用計數都不為0,於是這兩個對象都無法被GC回收。

1.2 可達性分析算法(Reachable Analysis)

在Java中是通過可達性分析算法來判斷對象是否存活的。選定一系列稱為"GC ROOTS"的對象作為起始點,從這些對象向下搜索,搜索所走過的道路稱為引用鏈(Reference Chain).當一個對象到GC ROOTS沒有任何引用鏈時,則不可達,這些對象會被判定可以回收。

如圖:

在這裡插入圖片描述

在Java中,能作為GC Roots的對象包含以下幾種

虛擬機棧(棧幀中的本地變量表)中引用的對象
方法區中類靜態屬性引用的對象
方法區中常量引用的對象
本地方法棧JNI(即一般說的Native方法)當中引用的對象

2.回收算法

當成功區分出哪些是存活對象哪些是死亡對象之後,GC接下來的任務就是執行垃圾回收,釋放掉無用對象所占用的內存空間,以便有足夠的可用內存空間為新對象分配內存。常用的垃圾回收算法有 標記清除算法、復制算法、標記壓縮算法。

2.1 標記清除算法 (Mark Sweep)

標記清除算法是最基礎的垃圾回收算法,同它的名字一樣,該算法有兩個過程,首先標記哪些是可回收的對象,然後進行內存回收

標記: Collector從引用根結點開始遍歷,標記所有被引用的對象。一般是在對象的Header中記錄為可達對象。

清除: Collector對堆內存從頭到尾進行線性的遍歷,如果發現某個對象在其Header中沒有標記為可達對象,則將其回收。從網上找張圖給大傢解釋一下,

如圖:

在這裡插入圖片描述

缺點:

1.效率不高,標記過程和清除過程效率都一般

2.會產生很多空間碎片,可能會導致以後為大對象分配空間時因為找不到可用的連續內存空間不得不再次進行GC。

2.2 復制算法(Copying)

GC復制算法(Copying GC)是由Marvin L. Minsky在1963年研究出來的算法。原理是把內存分為兩個空間一個是From空間,一個是To空間,對象一開始隻在From空間分配,To空間是空閑的。GC時把存活的對象從From空間復制粘貼到To空間,之後把To空間變成新的From空間,原來的From空間變成To空間。回收前後對比下圖所示:

如圖:

在這裡插入圖片描述

優缺點:

1.復制算法實現簡單運行高效,不會產生內存碎片

2.但是將內存縮小為原本的一半,代價略高。

現在虛擬機基本都采用這種垃圾回收算法回收新生代

2.3 標記壓縮算法(Mark-Compact)

標記壓縮算法(Mark-Compact),標記過程和標記清除算法的標記過程一樣,但是清理過程不同,會將存活對象移動到一端,然後清理掉端邊界之外的內存,

如圖:

在這裡插入圖片描述

優缺點:

標記整理算法效率低,但不用浪費內存,也不會造成內存碎片。

2.4 分代回收算法

在這裡插入圖片描述

因為新生代對象大量死去,少量存活,一般采用復制算法。老年代存活率高,回收的少,一般采用MC/MS(標記清除/標記壓縮)

在這裡插入圖片描述

如圖是我用arthas的dashboard命令輸出的本地的Memory信息。jdk1.8默認的垃圾回收器是ps+po(這個之後講)。可以看到新生代大小(伊甸區和s區),老年代大小。

2.4.1 新生代(Eden區/伊甸區)

年輕代的對象處於一種“朝生夕死”的狀態,在年輕代的GC叫做YGC(Minor GC)。Eden區對象活過第一次垃圾回收之後會進入survivor區(S0S1/S1S2)。在S1,S2之間經過多次垃圾回收進入老年代。

-XX:MaxTenuringThreshold 可以配置多少次從年輕代進入老年代

在這裡插入圖片描述

在多線程那我們整過這張圖,再看一下,分代年齡隻有4bit,意味著對象的最大年齡隻有15—–可以通過上面的參數設置大小,最大15,之後要是沒有被gc就會進入老年代。

2.4.2 老年代(tenured/old)

進入老年代的對象大多數活過瞭年輕代的多次gc,因此不會頻繁死亡,老年代的GC叫做(Major GC)FULL GC。FGC的效率比YGC低的多,在老年代無法繼續分配空間的時候觸發,觸發是新生代老年代一起進行回收。

2.4.3 新生代何時進入老年代

1. 超過 XX:MaxTenuringThreshold 指定次數
2. 動態年齡,S0->S1超過50%,把年齡最大的放到Old
3. 分配擔保:YGC期間,survivor區空間不夠瞭,空間擔保直接進入老年代

總結

本篇文章就到這裡瞭,希望能夠給你帶來幫助,也希望您能夠多多關註WalkonNet的更多內容!  

推薦閱讀: