Java ArrayList使用總結

提起ArrayList,相信很多小夥伴都用過,而且還不少用。但在幾年之前,我在一場面試中,面試官要求說出ArrayList的擴容機制。很顯然,那個時候的我並沒有關註這些,從而錯過瞭一次機會。不過好在我還算比較喜歡搞事情的,所以今天這篇文章也算是填坑吧。
看完這邊文章你將瞭解到:

  • ArrayList底層實現
  • ArrayList為什麼允許null值
  • ArrayList為什麼可重復
  • ArrayList查詢效率和插入效率對比

類圖

下圖是ArrayList的類圖結構

ArrayList繼承於 AbstractList,實現瞭 List, RandomAccess, Cloneable, java.io.Serializable 這些接口。
這裡逐個分析一下這裡接口的意義:

  • RandomAccess是一個標志接口,表明實現這個這個接口的 List集合是支持快速隨機訪問的。有興趣可以看看Collections類中哪個方法用到瞭這個標志性接口。
  • 實現 Cloneable接口並覆蓋瞭方法clone(),能被克隆。
  • 實現瞭java.io.Serializable 接口,這意味著ArrayList支持序列化,能通過序列化去傳輸(請註意,ArrayList的序列化是有點小特殊的,後面會講解)。

源碼解析

成員變量
在正式進入源碼分析之前,我們有必要先看看它的成員變量都有哪些,這裡列舉比較重要的成員變量:

private int size; // 實際元素個數
transient Object[] elementData; //真正保存元素的數組
private static final int DEFAULT_CAPACITY = 10;//默認的初始容量大小

構造方法
我們有三種初始化辦法:無參數直接初始化、指定大小初始化、指定初始數據初始化,源碼如下:

//1、無參數直接初始化,數組大小為空
public ArrayList() {
 this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
//2、指定初始數據初始化
public ArrayList(Collection<? extends E> c){
 //elementData是保存數組的容器,默認為null
 elementData=c.toArray();
 //如果給定的集合(c)數據有值
 if((size=elementData.length)!=0){
  	//c.toArray might(incorrectly)not return Object[](see 6260652)
  	//如果集合元素類型不是Object類型,我們會轉成Object
	 if(elementData.getClass()!=Object[].class){
	  elementData=Arrays.copyOf(elementData,size,Object].class);
	 }
 	}else{
 	//給定集合(c)無值,則默認空數組
 	this.elementData=EMPTY_ELEMENTDATA
 	}
}
//3、指定初始容量
public ArrayList(int initialCapacity) {
	//指定的初始容量大於0,將elementData初始化為指定大小的數組
 if (initialCapacity > 0) {
  this.elementData = new Object[initialCapacity];
 } else if (initialCapacity == 0) {
 	//否則初始化成一個空數組
  this.elementData = EMPTY_ELEMENTDATA;
 }
}

除過源碼中註釋外,補充幾點:

  1. ArrayList無參構造器初始化時,默認大小是空數組,並不是大傢常說的10,10是在第一次add的時候擴容的數組值。
  2. 使用方式二進行創建對象時,如果入參容器保存的對象不是Object,則轉換為Object。

DEFAULTCAPACITY_EMPTY_ELEMENTDATA和EMPTY_ELEMENTDATA又是什麼鬼?它其實是定義在成員變量的兩個空數組,

private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
private static final Object[] EMPTY_ELEMENTDATA = {};

很明顯問題來瞭,既然都是空數組,為什麼要聲明兩個?一個不行嗎?讀者請先思考一下,帶著疑問往下看。

新增和擴容實現

通過構造方法可以很清楚的看到,ArrayList的確是基於數組的,但動態又從何說起?
新增時就是給數組中添加元素,主要分為兩步走:

  1. 判斷是否需要擴容,如果需要擴容執行擴容操作;
  2. 直接賦值。

對應源碼如下:

public boolean add(E e) {
	//確保數組大小是否足夠,不夠執行擴容,size為當前數組元素個數,判斷size+1是因為後面還要size++
 ensureCapacityInternal(size + 1); //1
 elementData[size++] = e;//2
 return true;
}

我們先來看一下擴容部分的源碼:

private void ensureCapacityInternal(int minCapacity) {
	//先調用calculateCapacity計算容量
 	ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}
private static int calculateCapacity(Object[] elementData, int minCapacity) {
 //如果當前數組還是個空數組,也就是他用過無參構造去初始化的
 //那麼直接返回DEFAULT_CAPACITY,即10
 if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
  return Math.max(DEFAULT_CAPACITY, minCapacity);
 }
 return minCapacity;
}

private void ensureExplicitCapacity(int minCapacity) {
 modCount++;

 // 如果當前容量已經大於當前數組的長度瞭,說明需要去擴容瞭
 if (minCapacity - elementData.length > 0)
  //擴容
  grow(minCapacity);
}

private void grow(int minCapacity){
 int oldCapacity = elementData.length;
 //oldCapacity>>1是把oldCapacity除以2的意思
 int newCapacity=oldCapacity+(oldCapacity>>1);
 //如果擴容後的值<我們的期望值,擴容後的值就等於我們的期望值
 if(newCapacity-minCapacity<0)
 newCapacity = minCapacity;
 //如果擴容後的值>jvm所能分配的數組的最大值,那麼就用Integer的最大值
 if(newCapacity-MAX_ARRAY_SIZE>0)
 elementData=Arrays.copyOf(elementData,newCapacity);
}

註釋相對來說已經比較詳細瞭,這裡需要註意以下幾點:

  1. 上面有個問題是為什麼需要聲明兩個空數組。我們在看到上面源碼的時候有一個方法為calculateCapacity,這個方法內部邏輯隻有在通過無參構造初始化ArrayList的時候才會改變將要返回的minCapacity。而返回的這個值將會決定下面的數組是否需要擴容。如果我們通過指定大小的方式初始化ArrayList並指定大小為0,這說明我們需要的就是一個空的ArrayList,不需要去擴容,你細品;
  2. 新增時,沒有對值進行校驗,所以新增值可以為null,且沒有做重復值判斷,所以元素可以重復;
  3. ArrayList中的數組的最大值是Integer.MAX_VALUE,超過這個值,JVM就不會給數組分配內存空間瞭;
  4. 擴容是原來容量大小+容量大小的一半,簡單說就是擴容後的大小是原來容量的1.5倍。

擴容完成之後,就是簡單的賦值瞭,賦值時並沒有加鎖,所以是線程不安全的。

擴容的本質

在grow方法的最後,擴容是通過Arrays.copyOf(elementData,newCapacity);這行代碼實現的。這個方法實際上調用的方法是我們經常使用的System.arraycopy:

/**
*@param src 被拷貝的數組
*@param srcPos 從數組那裡開始
*@param dest 目標數組
*@param destPos從目標數組那個索引位置開始拷貝
*@param length 拷貝的長度
*此方法是沒有返回值的,通過dest的引用進行傳值
*/
public static native void arraycopy(Object src, int srcPos,Object dest, int destPos,int length);

這個方法是一個native方法,雖然不能看到方法內部的具體實現,但通過參數也可以管中窺豹。這個方法會移動元素。所以說數組如果要擴容,需要重新分配一塊更大的空間,再把數據全部復制過去,時間復雜度 O(N);而且你如果想在數組中間進行插入和刪除,每次必須搬移後面的所有數據以保持連續,時間復雜度 O(N)。由於數組又是一塊連續的內存空間,能夠根據索引快速訪問元素。
上面也就解釋瞭一開始那個問題:ArrayList為什麼插入慢,查詢快。

刪除

ArrayList有多種刪除方法,這裡以根據值刪除的方式進行說明(其他原理類似):

public boolean remove(Object o) {
 //如果要刪除的值是null,刪除第一個是null的值
 if(o==null){
 for(int index=0;index<size;index++)
  if(elementData[index]==null){
  fastRemove(index)
  return true;
  }
 }else{
 //如果要刪除的值不為null,找到第一個和要刪除的值相等的刪除
 for(int index=0;index<size;index++)
  //這裡是根據 equals來判斷值相等的,相等後再根據索引位置進行刪除
  //所以根據對象刪除時,一般來說,如果你確定要刪除的是某一類的業務對象,則需要重寫equals
  if(o.equals(elementData[index]){
  fastRemove(index)
  return true;
  }
 }
 return false
}

核心其實是fastRemove方法:

private void fastRemove(int index){
 //記錄數組的結構要發生變動瞭
 nodCount++;
 //numMoved表示刪除index位置的元素後,需要從index後移動多少個元素到前面去
 //減1的原因,是因為size從1開始算起,index從0開始算起
 int numMoved=size-index-1;
 if(numMoved>0)
 //從index+1位置開始被拷貝,拷貝的起始位置是index,長度是numMoved
 System.arraycopy(elementData, index+1, elementData, index, numMoved);
 //數組最後一個位置賦值null,幫助GC(沒有引用則自動回收瞭)
 elementData[--size] = null;
}

從源碼中,我們可以看出,某一個元素被刪除後,為瞭維護數組結構,我們都會把數組後面的元素往前移動,同時釋放最後一個引用,便於回收。

總結

本文主要從ArrayList的源碼入手,分別從初始化、新增、擴容、刪除四個方面展開學習。我們發現ArrayList內部其實就是圍繞瞭一個數組,在數組容量不足時將數組擴容至更大,所以也就自然被稱作基於動態數組。
微信搜索Java成神之路或掃描下方二維碼,發現更多Java有趣知識,讓我們一起成長!

以上就是Java ArrayList使用總結的詳細內容,更多關於Java ArrayList使用的資料請關註WalkonNet其它相關文章!

推薦閱讀:

    None Found