Java線程的異常處理機制詳情
前言
啟動一個Java程序,本質上是運行某個Java類的main方法。我們寫一個死循環程序,跑起來,然後運行jvisualvm
進行觀察
可以看到這個Java進程中,一共有11個線程,其中10個守護線程,1個用戶線程。我們main方法中的代碼,就跑在一個名為main
的線程中。當Java進程中跑著的所有線程都是守護線程時,JVM就會退出。
在單線程的場景下,如果代碼運行到某個位置時拋出瞭異常,會看到控制臺打印出異常的堆棧信息。但在多線程的場景下,子線程中發生的異常,不一定就能及時的將異常信息打印出來。
我曾經在工作中遇到過一次,采用CompletableFuture.runAsync
異步處理耗時任務時,任務處理過程中出現異常,然而日志中沒有任何關於異常的信息。時隔許久,重新溫習瞭線程中的異常處理機制,加深瞭對線程工作原理的理解,特此記錄。
線程的異常處理機制
我們知道,Java程序的運行,是先經由javac
將Java源代碼編譯成class字節碼文件,然後由JVM加載並解析class文件,隨後從主類的main方法開始執行。當一個線程在運行過程中拋出瞭未捕獲異常時,會由JVM調用這個線程對象上的dispatchUncaughtException
方法,進行異常處理。
// Thread類中 private void dispatchUncaughtException(Throwable e) { getUncaughtExceptionHandler().uncaughtException(this, e); }
源碼很好理解,先獲取一個UncaughtExceptionHandler
異常處理器,然後通過調用這個異常處理器的uncaughtException
方法來對異常進行處理。(下文用縮寫ueh
來表示UncaughtExceptionHandler
)
ueh
是個 啥呢?其實就是定義在Thread
內部的一個接口,用作異常處理。
@FunctionalInterface public interface UncaughtExceptionHandler { /** * Method invoked when the given thread terminates due to the * given uncaught exception. * <p>Any exception thrown by this method will be ignored by the * Java Virtual Machine. * @param t the thread * @param e the exception */ void uncaughtException(Thread t, Throwable e); }
再來看下Thread
對象中的getUncaughtExceptionHandler
方法
public UncaughtExceptionHandler getUncaughtExceptionHandler() { return uncaughtExceptionHandler != null ? uncaughtExceptionHandler : group; }
先查看當前這個Thread
對象是否有設置自定義的ueh
對象,若有,則由其對異常進行處理,否則,由當前Thread
對象所屬的線程組(ThreadGroup
)進行異常處理。我們點開源碼,容易發現ThreadGroup
類本身實現瞭Thread.UncaughtExceptionHandler
接口,也就是說ThreadGroup
本身就是個異常處理器。
public class ThreadGroup implements Thread.UncaughtExceptionHandler { private final ThreadGroup parent; .... }
假設我們在main
方法中拋出一個異常,若沒有對main
線程設置自定義的ueh
對象,則交由main
線程所屬的ThreadGroup
來處理異常。我們看下ThreadGroup
是怎麼處理異常的:
public void uncaughtException(Thread t, Throwable e) { if (parent != null) { parent.uncaughtException(t, e); } else { Thread.UncaughtExceptionHandler ueh = Thread.getDefaultUncaughtExceptionHandler(); if (ueh != null) { ueh.uncaughtException(t, e); } else if (!(e instanceof ThreadDeath)) { System.err.print("Exception in thread \"" + t.getName() + "\" "); e.printStackTrace(System.err); } } }
這部分源碼也比較簡短。首先是查看當前ThreadGroup
是否擁有父級的ThreadGroup
,若有,則調用父級ThreadGroup
進行異常處理。否則,調用靜態方法Thread.getDefaultUncaughtExceptionHandler()
獲取一個默認的ueh
對象。
若默認的ueh
對象不為空,則由這個默認的ueh
對象進行異常處理;否則,當異常不是ThreadDeath
時,直接將當前線程的名字,和異常的堆棧信息,通過標準錯誤輸出(System.err
)打印到控制臺。
我們隨便運行一個main
方法,看一下線程的情況
可以看到,main
線程屬於一個同樣名為main
的ThreadGroup
,而這個main
的ThreadGroup
,其父級ThreadGroup
名為system
,而這個system
的ThreadGroup
,沒有父級瞭,它就是根ThreadGroup
。
由此可知,main
線程中拋出的未捕獲異常,最終會交由名為system
的ThreadGroup
進行異常處理,而由於沒有設置默認的ueh
對象,異常信息會通過System.err
輸出到控制臺。
接下來,我們通過最樸素的方式(new
一個Thread
),在main
線程中創建一個子線程,在子線程中編寫能拋出異常的代碼,進行觀察
public static void main(String[] args) { Thread thread = new Thread(() -> { System.out.println(3 / 0); }); thread.start(); }
子線程中的異常信息被打印到瞭控制臺。異常處理的流程就是我們上面描述的那樣。
小結
所以,正常來說,如果沒有對某個線程設置特定的ueh
對象;也沒有調用靜態方法Thread.setDefaultUncaughtExceptionHandler
設置全局默認的ueh
對象。那麼,在任意一個線程的運行過程中拋出未捕獲異常時,異常信息都會被輸出到控制臺(當異常是ThreadDeath
時則不會進行輸出,但通常來說,異常都不是ThreadDeath
,不過這個細節要註意下)。
如何設置自定義的ueh
對象來進行異常處理?根據上面的分析可知,有2種方式
- 對某一個
Thread
對象,調用其setUncaughtExceptionHandler
方法,設置一個ueh
對象。註意這個ueh
對象隻對這個線程起作用 - 調用靜態方法
Thread.setDefaultUncaughtExceptionHandler()
設置一個全局默認的ueh
對象。這樣設置的ueh
對象會對所有線程起作用
當然,由於ThreadGroup
本身可以充當ueh
,所以其實還可以實現一個ThreadGroup
子類,重寫其uncaughtException
方法進行異常處理。
若一個線程沒有進行任何設置,當在這個線程內拋出異常後,默認會將線程名稱和異常堆棧,通過System.err
進行輸出。
線程的異常處理機制,用一個流程圖表示如下:
線程池場景下的異常處理
在實際的開發中,我們經常會使用線程池來進行多線程的管理和控制,而不是通過new
來手動創建Thread
對象。
對於Java中的線程池ThreadPoolExecutor
,我們知道,通常來說有兩種方式,可以向線程池提交任務:
execute
submit
其中execute
方法沒有返回值,我們通過execute
提交的任務,隻需要提交該任務給線程池執行,而不需要獲取任務的執行結果。而submit
方法,會返回一個Future
對象,我們通過submit
提交的任務,可以通過這個Future
對象,拿到任務的執行結果。
我們分別嘗試如下代碼:
public static void main(String[] args) { ExecutorService threadPool = Executors.newSingleThreadExecutor(); threadPool.execute(() -> { System.out.println(3 / 0); }); }
public static void main(String[] args) { ExecutorService threadPool = Executors.newSingleThreadExecutor(); threadPool.submit(() -> { System.out.println(3 / 0); }); }
容易得到如下結果:
通過execute
方法提交的任務,異常信息被打印到控制臺;通過submit
方法提交的任務,沒有出現異常信息。
我們稍微跟一下ThreadPoolExecutor
的源碼,當使用execute
方法提交任務時,在runWorker
方法中,會執行到下圖紅框的部分
在上面的代碼執行完畢後,由於異常被throw
瞭出來,所以會由JVM捕捉到,並調用當前子線程的dispatchUncaughtException
方法進行處理,根據上面的分析,最終異常堆棧會被打印到控制臺。
多扯幾句別的。
上面跟源碼時,註意到Worker
是ThreadPoolExecutor
的一個內部類,也就是說,每個Worker
都會隱式的持有ThreadPoolExecutor
對象的引用(內部類的相關原理請自行補課)。每個Worker
在運行時(在不同的子線程中運行)都能夠對ThreadPoolExecutor
對象(通常來說這個對象是在main
線程中被維護)中的屬性進行訪問和修改。Worker
實現瞭Runnable
接口,並且其run
方法實際是調用的ThreadPoolExecutor
上的runWorker
方法。在新建一個Worker
時,會創建一個新的Thread
對象,並把當前Worker
的引用傳遞給這個Thread
對象,隨後調用這個Thread
對象的start
方法,則開始在這個Thread
中(子線程中)運行這個Worker
。
Worker(Runnable firstTask) { setState(-1); // inhibit interrupts until runWorker this.firstTask = firstTask; this.thread = getThreadFactory().newThread(this); }
ThreadPoolExecutor
中的addWorker
方法
再次跟源碼時,加深瞭對ThreadPoolExecutor
和Worker
體系的理解和認識。
它們之間有一種嵌套依賴的關系。每個Worker
裡持有一個Thread
對象,這個Thread
對象又是以這個Worker
對象作為Runnable
,而Worker
又是ThreadPoolExecutor
的內部類,這意味著每個Worker
對象都會隱式的持有其所屬的ThreadPoolExecutor
對象的引用。每個Worker
的run
方法, 都跑在子線程中,但是這些Worker
跑在子線程中時,能夠對ThreadPoolExecutor
對象的屬性進行訪問和修改(每個Worker
的run
方法都是調用的runWorker
,所以runWorker
方法是跑在子線程中的,這個方法中會對線程池的狀態進行訪問和修改,比如當前子線程運行過程中拋出異常時,會從ThreadPoolExecutor
中移除當前Worker
,並啟一個新的Worker
)。而通常來說,ThreadPoolExecutor
對象的引用,我們通常是在主線程中進行維護的。
反正就是這中間其實有點騷東西,沒那麼簡單。需要多跟幾次源碼,多自己打斷點進行debug,debug過程中可以通過IDEA的Evaluate Expression
功能實時觀察當前方法執行時所處的線程環境(Thread.currentThread
)。
扯得有點遠瞭,現在回到正題。上面說瞭調用ThreadPoolExecutor
中的execute
方法提交任務,子線程中出現異常時,異常會被拋出,打印在控制臺,並且當前Worker
會被線程池回收,並重啟一個新的Worker
作為替代。那麼,調用submit
時,異常為何就沒有被打印到控制臺呢?
我們看一下源碼:
public Future<?> submit(Runnable task) { if (task == null) throw new NullPointerException(); RunnableFuture<Void> ftask = newTaskFor(task, null); execute(ftask); return ftask; }
protected <T> RunnableFuture<T> newTaskFor(Runnable runnable, T value) { return new FutureTask<T>(runnable, value); }
通過調用submit
提交的任務,被包裝瞭成瞭一個FutureTask
對象,隨後會將這個FutureTask
對象,通過execute
方法提交給線程池,並返回FutureTask
對象給主線程的調用者。
也就是說,submit
方法實際做瞭這幾件事
- 將提交的
Runnable
,包裝成FutureTask
- 調用
execute
方法提交這個FutureTask
(實際還是通過execute
提交的任務) - 將
FutureTask
作為返回值,返回給主線程的調用者
關鍵就在於FutureTask
,我們來看一下
public FutureTask(Runnable runnable, V result) { this.callable = Executors.callable(runnable, result); this.state = NEW; // ensure visibility of callable }
// Executors中 public static <T> Callable<T> callable(Runnable task, T result) { if (task == null) throw new NullPointerException(); return new RunnableAdapter<T>(task, result); }
static final class RunnableAdapter<T> implements Callable<T> { final Runnable task; final T result; RunnableAdapter(Runnable task, T result) { this.task = task; this.result = result; } public T call() { task.run(); return result; } }
通過submit
方法傳入的Runnable
,通過一個適配器RunnableAdapter
轉化為瞭Callable
對象,並最終包裝成為一個FutureTask
對象。這個FutureTask
,又實現瞭Runnable
和Future
接口
於是我們看下FutureTask
的run
方法(因為最終是將包裝後的FutureTask
提交給線程池執行,所以最終會執行FutureTask
的run
方法)
protected void setException(Throwable t) { if (UNSAFE.compareAndSwapInt(this, stateOffset, NEW, COMPLETING)) { outcome = t; UNSAFE.putOrderedInt(this, stateOffset, EXCEPTIONAL); // final state finishCompletion(); } }
可以看到,異常信息隻是被簡單的設置到瞭FutureTask
的outcome
字段上。並沒有往外拋,所以這裡其實相當於把異常給生吞瞭,catch
塊中捕捉到異常後,既沒有打印異常的堆棧,也沒有把異常繼續往外throw
。所以我們無法在控制臺看到異常信息,在實際的項目中,此種場景下的異常信息也不會被輸出到日志文件。這一點要特別註意,會加大問題的排查難度。
那麼,為什麼要這樣處理呢?
因為我們通過submit
提交任務時,會拿到一個Future
對象
public Future<?> submit(Runnable task) { if (task == null) throw new NullPointerException(); RunnableFuture<Void> ftask = newTaskFor(task, null); execute(ftask); return ftask; }
我們可以在稍後,通過Future
對象,來獲知任務的執行情況,包括任務是否成功執行完畢,任務執行後返回的結果是什麼,執行過程中是否出現異常。
所以,通過submit
提交的任務,實際會把任務的各種狀態信息,都封裝在FutureTask
對象中。當最後調用FutureTask
對象上的get
方法,嘗試獲取任務執行結果時,才能夠看到異常信息被打印出來。
public V get() throws InterruptedException, ExecutionException { int s = state; if (s <= COMPLETING) s = awaitDone(false, 0L); return report(s); }
private V report(int s) throws ExecutionException { Object x = outcome; if (s == NORMAL) return (V)x; if (s >= CANCELLED) throw new CancellationException(); throw new ExecutionException((Throwable)x); // 異常會通過這一句被拋出來 }
小結
- 通過
ThreadPoolExecutor
的execute
方法提交的任務,出現異常後,異常會在子線程中被拋出,並被JVM捕獲,並調用子線程的dispatchUncaughtException
方法,進行異常處理,若子線程沒有任何特殊設置,則異常堆棧會被輸出到System.err
,即異常會被打印到控制臺上。並且會從線程池中移除當前Worker
,並另啟一個新的Worker
作為替代。 - 通過
ThreadPoolExecutor
的submit
方法提交的任務,任務會先被包裝成FutureTask
對象,出現異常後,異常會被生吞,並暫存到FutureTask
對象中,作為任務執行結果的一部分。異常信息不會被打印,該子線程也不會被線程池移除(因為異常在子線程中被吞瞭,沒有拋出來)。在調用FutureTask
上的get
方法時(此時一般是在主線程中瞭),異常才會被拋出,觸發主線程的異常處理,並輸出到System.err
其他
其他的線程池場景
比如:
- 使用
ScheduledThreadPoolExecutor
實現延遲任務或者定時任務(周期任務),分析過程也是類似。這裡給個簡單結論,當調用scheduleAtFixedRate
方法執行一個周期任務時(任務會被包裝成FutureTask
(實際是ScheduledFutureTask
,是FutureTask
的子類)),若周期任務中出現異常,異常會被生吞,異常信息不會被打印,線程不會被回收,但是周期任務執行這一次後就不會繼續執行瞭。ScheduledThreadPoolExecutor
繼承瞭ThreadPoolExecutor
,所以其也是復用瞭ThreadPoolExecutor
的那一套邏輯。 - 使用
CompletableFuture
的runAsync
提交任務,底層是通過ForkJoinPool
線程池進行執行,任務會被包裝成AsyncRun
,且會返回一個CompletableFuture
給主線程。當任務出現異常時,處理方式和ThreadPoolExecutor
的submit
類似,異常堆棧不會被打印。隻有在CompletableFuture
上調用get
方法嘗試獲取結果時,異常才會被打印。
到此這篇關於Java線程的異常處理機制詳情的文章就介紹到這瞭,更多相關Java線程異常處理內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- 解析Java異步之call future
- Java多線程 Callable、Future 和FutureTask
- java ThreadPoolExecutor線程池拒絕策略避坑
- 徹底搞懂java並發ThreadPoolExecutor使用
- Java使用Runnable和Callable實現多線程的區別詳解