Java集合之同步容器詳解

為瞭方便編寫出線程安全的程序,Java裡面提供瞭一些線程安全類和並發工具,比如:同步容器、並發容器、阻塞隊列等。

最常見的同步容器就是Vector和Hashtable瞭,那麼,同步容器的所有操作都是線程安全的嗎?下面我們來一一分析這個問題。

同步容器

在Java中,同步容器主要包括2類:

  • Vector、Stack、HashTable
  • Collections類中提供的靜態工廠方法創建的類

我們以相對簡單的Vecotr來舉例,我們先來看下Vector中幾個重要方法的源碼:

public synchronized boolean add(E e) {
    modCount++;
    ensureCapacityHelper(elementCount + 1);
    elementData[elementCount++] = e;
    return true;
}

public synchronized E remove(int index) {
    modCount++;
    if (index >= elementCount)
        throw new ArrayIndexOutOfBoundsException(index);
    E oldValue = elementData(index);

    int numMoved = elementCount - index - 1;
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index,
                         numMoved);
    elementData[--elementCount] = null; // Let gc do its work

    return oldValue;
}

public synchronized E get(int index) {
    if (index >= elementCount)
        throw new ArrayIndexOutOfBoundsException(index);

    return elementData(index);
}

可以看到,Vector這樣的同步容器的所有公有方法全都是synchronized的,也就是說,我們可以在多線程場景中放心的使用單獨這些方法,因為這些方法本身的確是線程安全的。

但是,請註意上面這句話中,有一個比較關鍵的詞:單獨

因為,雖然同步容器的所有方法都加瞭鎖,但是對這些容器的復合操作無法保證其線程安全性。需要客戶端通過主動加鎖來保證。

簡單舉一個例子,我們定義如下刪除Vector中最後一個元素方法:

public Object deleteLast(Vector v){
    int lastIndex  = v.size()-1;
    v.remove(lastIndex);
}

上面這個方法是一個復合方法,包括 size()和 remove(),看上去好像並沒有什麼問題,無論是size()方法還是remove()方法都是線程安全的,那麼整個deleteLast方法應該也是線程安全的。

但是,如果多線程調用該方法的過程中,remove方法有可能拋出ArrayIndexOutOfBoundsException:

Exception in thread "Thread-1" java.lang.ArrayIndexOutOfBoundsException: Array index out of range: 879
    at java.util.Vector.remove(Vector.java:834)
    at com.hollis.Test.deleteLast(EncodeTest.java:40)
    at com.hollis.Test$2.run(EncodeTest.java:28)
    at java.lang.Thread.run(Thread.java:748)

我們上面貼瞭remove的源碼,我們可以分析得出:當index >= elementCount時,會拋出ArrayIndexOutOfBoundsException ,也就是說,當當前索引值不再有效的時候,將會拋出這個異常。

因為removeLast方法,有可能被多個線程同時執行,當線程2通過index()獲得索引值為10,在嘗試通過remove()刪除該索引位置的元素之前,線程1把該索引位置的值刪除掉瞭,這時線程一在執行時便會拋出異常。

為瞭避免出現類似問題,可以嘗試加鎖:

public void deleteLast() {
    synchronized (v) {
        int index = v.size() - 1;
        v.remove(index);
    }
}

如上,我們在deleteLast中,對v進行加鎖,即可保證同一時刻,不會有其他線程刪除掉v中的元素。

另外,如果以下代碼會被多線程執行時,也要特別註意:

for (int i = 0; i < v.size(); i++) {
    v.remove(i);
}

由於,不同線程在同一時間操作同一個Vector,其中包括刪除操作,那麼就同樣有可能發生線程安全問題。所以,在使用同步容器的時候,如果涉及到多個線程同時執行刪除操作,就要考慮下是否需要加鎖。

同步容器的問題

前面說過瞭,同步容器直接保證單個操作的線程安全性,但是無法保證復合操作的線程安全,遇到這種情況時,必須要通過主動加鎖的方式來實現。

而且,除此之外,由於所有方法都加瞭鎖,這就導致多個線程訪問同一個容器的時候,隻能進行順序訪問,即使是不同的操作,也要排隊,如get和add要排隊執行。這就大大的降低瞭容器的並發能力。

並發容器

針對前文提到的同步容器存在的並發度低問題,從Java5開始,java.util.concurent包下,提供瞭大量支持高效並發的訪問的集合類,我們稱之為並發容器。

針對前面提到的同步容器的復合操作的問題,一般在 Map 中發生的比較多,所以在ConcurrentHashMap中增加瞭對常用復合操作的支持,比如putIfAbsent()、replace(),這2個操作都是原子操作,可以保證線程安全。

另外,並發包中的CopyOnWriteArrayList和CopyOnWriteArraySet是Copy-On-Write的兩種實現。

Copy-On-Write容器即寫時復制的容器。通俗的理解是當我們往一個容器添加元素的時候,不直接往當前容器添加,而是先將當前容器進行Copy,復制出一個新的容器,然後新的容器裡添加元素,添加完元素之後,再將原容器的引用指向新的容器。

CopyOnWriteArrayList中add/remove等寫方法是需要加鎖的,而讀方法是沒有加鎖的。

這樣做的好處是我們可以對CopyOnWrite容器進行並發的讀,當然,這裡讀到的數據可能不是最新的。因為寫時復制的思想是通過延時更新的策略來實現數據的最終一致性的,並非強一致性。

但是,作為代替Vector的CopyOnWriteArrayList並沒有解決同步容器的復合操作的線程安全性問題。

以上就是本文的全部內容,希望對大傢的學習有所幫助,也希望大傢多多支持WalkonNet。

推薦閱讀: