C#多線程之線程綁定ThreadLocal類

在.Net 4.0的Thread裡,新增瞭線程局部變量(ThreadLocal)類,可以很方便的實現線程專有存儲。

應用場景

線程專有存儲應被用於這樣的多線程應用:它們經常訪問那些邏輯上是全局的、而物理上是專有於每個線程的對象。首先我們看如下這樣一個例子

    string errorMessage;

    void Process()
    {
        bool ret = Run();
        if (!ret && needDebug)
        {
            Console.WriteLine(errorMessage);
        }
    }

    bool Run()
    {
        try
        {
            //…-- do something
            return true;
        }
        catch (Exception e)
        {
            errorMessage = e.Message;
            return false;
        }
    }

這個函數中,Process為主體函數,當它調用Run函數失敗後,為調式方便,打出Run函數的錯誤信息。錯誤信息采用成員變量errorMessage存放,為瞭減少Run函數的參數。

這種通過成員變量errorMessage在函數間傳遞信息的方式在單線程程序中可以很好的工作,但是在多線程應用時卻往往會發生一些微妙的問題:當兩個線程同時執行Run函數時,先執行的會被後執行的線程覆蓋,導致輸出瞭錯誤的後執行的線程的調試信息。發生類似數據庫的臟讀錯誤。

解決方案:

最直接的解決方案有兩種:

加鎖:在Process中加鎖,保證沒有兩個線程同時訪問errorMessage

修改Run函數為bool Run(out string errorMessage)的形式,不通過errorMessage共享數據,使其支持並發操作。

這兩種方式都是有效的,但都有一些不足:加鎖時獲取和釋放互斥體有一個不小的開銷,當共享的數據較多時修改Run函數會導致Run函數變得很難看,並且可能會由於改動較大而導致大規模重構。

針對上述兩種方式的不足,人們提出瞭線程專有存儲的解決方案,使用ThreadLocal類的解決方案如下:

    ThreadLocal<string> errorMessage = new ThreadLocal<string> ();

    void Process()
    {
        bool ret = Run();
        if (!ret && needDebug)
        {
            Console.WriteLine(errorMessage);
        }
    }

    bool Run()
    {
        try
        {
            …- do something
            return true;
        }
        catch (Exception e)
        {
            errorMessage.Value=e.Message;
            return false;
        }
    }

ThreadLocal類在每個線程下都分配一個獨立實例副本,每個線程都隻訪問到自己的實例,不會影響其它線程,從而解決讀臟數據的問題。

ThreadLocal類也不是什麼新概念,在C++、Java等語言的線程庫中都有相關實現,一些語言編譯器實現(如IBM XL FORTRAN)中甚至在語言的層次提供瞭直接的支持。其實實現的思路很簡單:在ThreadLocal類中有一個哈希表,根據線程ID為key用於存儲每一個線程的變量的副本。由於現在沒啥相關資料,並且也是beta版的,我也懶得對.Net中的具體實現和性能進一步分析。

和上面的兩種方式相比,線程專有存儲有如下好處:

  • 效率:線程專有存儲可實現成無需對線程專有數據進行鎖定。例如,通過將errno放入線程專有存儲中,每個線程都可以可靠地設置和測試該線程中的方法的完成狀態,而無需使用復雜的同步協議。這排除瞭線程中共享數據的鎖定開銷,比起獲取和釋放互斥體要更為迅捷。
  • 易於使用:對於應用程序員來說,線程專有存儲使用起來很簡單,因為系統開發者可以通過數據抽象或宏來使線程專有存儲的使用在源碼級完全透明化。

但也存在如下缺點:

  • 它鼓勵瞭(線程安全的)全局變量的使用:許多應用不要求多個線程通過公用訪問點來訪問線程專有的數據。如果是這樣,數據的存儲應使隻有擁有該數據的線程可對它進行訪問。
  • 它隱藏瞭系統的結構:線程專有存儲的使用隱藏瞭應用中的對象之間的關系,可能會導致應用更難被理解。

適用性

應用有以下特性時可使用線程專有存儲:

  • 應用最初的編寫假定瞭單線程控制,並正在被移植到多線程環境,而又不能改變現有API
  • 應用含有多個占先式線程控制,可以任意的調度順序並發執行;
  • 每個線程控制調用一系列方法,這些方法共享隻對該線程來說是公用的數據;
  • 在每個線程中被對象共享的數據必須通過一個全局可見的訪問點來訪問;
  • 訪問點"邏輯地"與其他線程共享,但在"物理上" 對於每個線程卻是唯一的;
  • 數據在方法間隱式地傳遞,而不是經由參數顯式地傳遞。

理解上面描述的特性對於使用(或不使用)線程專有存儲模式來說是至關緊要的。例如,UNIX errno變量是一個數據例子:(1)邏輯上全局,但是物理上線程專有,以及(2)在方法間隱式地傳遞。

當應用有以下特性時,不要使用線程專有存儲模式:

  • 多個線程為單個任務協同工作,該任務需要並發訪問共享數據。
    例如,多線程應用可以對在內存中的數據庫並發地進行讀寫。在這樣的情況下,線程必須共享不是線程專有的記錄和表。如果使用線程專有存儲來存儲此數據庫,線程就不能共享這些數據。因而,對數據庫記錄的訪問必須通過同步原語(例如,互斥體)來控制,以使線程能在共享數據上協作。
  • 維護物理和邏輯上都分離的數據要更為直觀和高效。
    例如,通過將數據作為參數顯式地傳遞給所有方法,有可能使線程訪問僅在每個線程中可見的數據。在這樣的情況下,線程專有存儲模式有可能是不必要的。

到此這篇關於C#線程綁定ThreadLocal類的文章就介紹到這瞭。希望對大傢的學習有所幫助,也希望大傢多多支持WalkonNet。

推薦閱讀: