Java並發編程面試之線程池

什麼是線程池

是一種基於池化思想管理線程的工具。池化技術:池化技術簡單點來說,就是提前保存大量的資源,以備不時之需。比如我們的對象池,數據庫連接池等。

線程池好處

我們為什麼要使用線程池,直接new thread start不好嗎?

  • 降低資源消耗」: 通過重復利用已創建的線程來降低線程創建和銷毀所造成的消耗。
  • 提高響應速度:」 任務到達時,可以立即執行,不需要等到線程創建再來執行任務。
  • 提高線程的可管理性:」 線程是稀缺資源,如果無限制創建,不僅會消耗系統資源,還會因為線程的不合理分佈導致資源調度失衡,降低系統的穩定性。使用線程池可以進行統一的分配、調優和監控。

線程池的執行流程

我們先來看看線程池的一個執行流程圖,此圖來自文末參考1

通過上述圖我們可以得出線程池執行任務可以有以下幾種情況:

  1. 如果當前的運行線程小於coreSize,則創建新線程來執行任務。
  2. 如果當前運行的線程等於coreSize或多餘coreSize(動態修改瞭coreSize才會出現這種情況),把任務放到阻塞隊列中。
  3. 如果隊列已滿無法將新加入的任務放進去的話,則需要創建新的線程來執行任務。
  4. 如果新創建線程已經達到瞭最大線程數,任務將會被拒絕。

怎麼用線程池

在java jdk的Executors有提供創建不同線程池的方法(一般不推薦這種做法)阿裡巴巴的開發手冊也明確強制規定不讓通過Executors來創建的,在一些公司的開發規范裡面應該也會有這麼一條吧。

newFixedThreadPool

newSingleThreadExecutor

newCachedThreadPool

newScheduledThreadPool

newWorkStealingPool (jdk1.8新增的) 我們可以使用ThreadPoolExecutor來創建線程池

  public ThreadPoolExecutor(int corePoolSize,
                              int maximumPoolSize,
                              long keepAliveTime,
                              TimeUnit unit,
                              BlockingQueue<Runnable> workQueue,
                              ThreadFactory threadFactory,
                              RejectedExecutionHandler handler) 
                              

我們可以看出創建線程池有七個參數,而上述我們通過Executors工具類來創建的線程池就一兩個參數,其他參數它都幫我們默認寫死瞭,我們隻有真正理解瞭這幾個參數才能更好的去使用線程池。下面我們來看看這七個參數(線程池參數)。

corePoolSize

核心線程數(線程池的基本大小)當我們提交一個任務到線程池時就會創建一個線程來執行任務.當我們需要執行的任務數大於核心線程數瞭就不再創建, 如果我們調用瞭prestartAllCoreThreads()方法線程池就會為我們提前創建好所有的基本線程。

maximumPoolSize

最大線程數:線程池允許創建的最大線程數。如果隊列已經滿瞭,且已創建的線程數小於最大線程數,則線程池就會創建新的線程來執行任務。這裡有個小知識點,如果我們的隊列是用的無界隊列,這個參數是不會起作用的,因為我們的任務會一直往隊列中加,隊列永遠不會滿(內存允許的情況)。

keepAliveTime

空閑線程最大生存時間。當前線程數大於核心線程數時,結束多餘的空閑線程等待新任務的最長時間。默認情況下,隻有當線程池中的線程數大於corePoolSize時,keepAliveTime才會起作用,直到線程池中的線程數不大於corePoolSize,即當線程池中的線程數大於corePoolSize時,如果一個線程空閑的時間達到keepAliveTime,則會終止,直到線程池中的線程數不超過corePoolSize

但是如果調用瞭allowCoreThreadTimeOut(boolean)方法,在線程池中的線程數不大於corePoolSize時,keepAliveTime參數也會起作用,直到線程池中的線程數為0;比如當前線程池中最大線程數(maximumPoolSize)為50,核心線程數(corePoolSize)為10,當前正在跑任務的線程數為30.然後是不是空出瞭20個線程沒活幹,所以這20個線程就要被消毀,有點卸磨殺驢的感覺。

如果剩下的30個線程幹完活瞭也休息瞭keepAliveTime這麼久,然後這30個線程裡面也要被銷毀20個,就保留個核心線程。如果設置瞭allowCoreThreadTimeOut等於true核心線程也會被銷毀。就跟我們做外包項目一樣,甲方項目完成瞭就得去另外一個甲方,如果短時間內都沒有甲方接納你的話,你就要被辭退瞭,隻會留下幾個核心人員維護下項目,如果甲方項目維護的話用自己的人的話,所有的外包人會都會被辭退。

unit

線程存活時間的的單位。可選的單位有days、hours等。

workQueue

任務隊列。可以選擇以下這些隊列

threadFactory

用戶設置創建線程的工廠,我們可以通過這個工廠來創建有業務意義的線程名字。我們可以對比下自定義的線程工廠和默認的線程工廠創建的名字。

默認產生線程的名字 自定義線程工廠產生名字

pool-5-thread-1 testPool-1-thread-1

阿裡開發手冊也有明確說到,需要指定有意義的線程名字。

在這裡插入圖片描述

ejectedExecutionHandler

線程池拒絕策略。當隊列和線程池都滿瞭說明線程池已經處於飽和狀態。必須要采取一定的策略來處理新提交的任務。jdk默認提供瞭四種拒絕策略:

其實我們也可以自定義任務拒絕策略(實現下RejectedExecutionHandler接口),比如說如果任務拒絕瞭我們可以記錄下日志,或者重試等,根據自己的業務需求來實現。

dubbo 任務拒絕策略

 @Override
   public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
       String msg = String.format("Thread pool is EXHAUSTED!" +
               " Thread Name: %s, Pool Size: %d (active: %d, core: %d, max: %d, largest: %d), Task: %d (completed: "
               + "%d)," +
               " Executor status:(isShutdown:%s, isTerminated:%s, isTerminating:%s), in %s://%s:%d!",
           threadName, e.getPoolSize(), e.getActiveCount(), e.getCorePoolSize(), e.getMaximumPoolSize(),
           e.getLargestPoolSize(),
           e.getTaskCount(), e.getCompletedTaskCount(), e.isShutdown(), e.isTerminated(), e.isTerminating(),
           url.getProtocol(), url.getIp(), url.getPort());
       logger.warn(msg);
       dumpJStack();
       dispatchThreadPoolExhaustedEvent(msg);
       throw new RejectedExecutionException(msg);
   }//加入Java開發交流君樣:756584822一起吹水聊天

我們可以看出dubbo的拒絕策略主要記錄瞭詳細的級別為warm的日志、輸出當前線程堆棧詳情、繼續拋出拒絕任務異常。

線程池參數如何設置?

線程池既然有這麼多參數那麼我們如何去根據自己的業務實際情況來去合理的設置每個參數?

  • 一般我們如果任務為耗時IO型比如讀取數據庫、文件讀寫以及網略通信的的話這些任務不會占據很多cpu的資源但是會比較耗時:線程數設置為2倍CPU數以上,充分的來利用CPU資源。
  • 一般我們如果任務為CPU密集型的話比如大量計算、解壓、壓縮等這些操作都會占據大量的cpu。所以針對於這種情況的話一般設置線程數為:1倍cpu+1。為啥要加1,很多說法是備份線程。

如果既有IO密集型任務,又有CPU密集型任務,這種該怎麼設置線程大小?這種的話最好分開用線程池處理,IO密集的用IO密集型線程池處理,CPU密集型的用cpu密集型處理。以上都隻是理算情況下的估算而已,真正的合理參數還是需要看看實際生產運行的效果來合理的調整的。

監控線程池

線程池工作是否飽和?線程的情況如何?總共執行瞭多少個任務?現在線程池的運行情況如何?隊列裡面是否有堆積任務?面對上面這些問題,線程池也有提供一些方法可以讓我們來查看上面這些指標。

有瞭這些參數我們是不是調整線程池的參數就更加方便瞭。或者根據線程池的活躍程度我們自動來調節(動態調整下篇再來說)線程池的參數。

關於線程池的幾個問題

線程池是否區分核心線程和非核心線程?

如何保證核心線程不被銷毀?

線程池的線程是如何做到復用的?

總結

本篇文章就到這裡瞭,希望能給你帶來幫助,也希望您能夠多多關註WalkonNet的更多內容!

推薦閱讀: