基於Java8並行流(parallelStream)的註意點

Java8並行流(parallelStream)註意點

在最初使用並行流的時候,查詢列表會偶爾性報空指針異常,這令我非常納悶

代碼是這樣的:

List<OrderListVO> orderListVOS = new LinkedList<OrderListVO>();

baseOrderBillList.parallelStream().forEach(baseOrderBill -> {
   OrderListVO orderListVO = new OrderListVO();
   // 設置order中的屬性

   orderListVO.setOrderbillgrowthid(baseOrderBill.getOrderbillgrowthid());
   orderListVO.setOrderbillid(baseOrderBill.getOrderbillid());
   ……
   orderListVOS.add(orderListVO);
}

代碼本身是在做多表拆分然後業務層組裝,使用並行流能夠提升這種純粹的CPU密集型操作,parallelStream 此方法默認是以服務器CPU核數為線程池大小的。

因為是並行流,所以其實是多線程在並發操作這個orderListVOS 容器,但是這個容器是不能保證線程安全的。

修改之後:

List<OrderListVO> orderListVOS = Collections
.synchronizedList(new LinkedList<OrderListVO>());

這樣就能得到理想的結果。

另外,stream自帶最後的聚合方法:

List<OrderListVO> orderListVOS = orderListVOS.parallelStream()
                .sorted(Comparator.comparing(OrderListVO::getCreatetime).reversed())
                .collect(Collectors.toList());

collect(Collectors.toList()) 方法最後回將操作後的數據進行匯總,此方法本身實現瞭線程安全性的操作,最後得到的結果也會是正確的。

JAVA8之parallelStream()並行流的正確用法

1.因為是並行流,所以所涉及到的數據結構

需要使用線程安全的,比如

listByPage.parallelStream().forEach(str-> {
           //使用線程安全的數據結構
           //ConcurrentHashMap
           //CopyOnWriteArrayList
           //等等進行操作
        });

2.默認優先用在CPU密集型計算中

這裡有的人就說瞭,用在IO密集比如HTTP請求啊什麼的這種耗時高的操作並行去請求不是效果顯著嗎

由於默認並行流使用的是全局的線程池,線程數量是根據cpu核數設置的,所以如果某個操作占用瞭線程,將影響全局其他使用並行流的操作

所以折中的方案是自定義線程池來執行某個並行流操作

  ForkJoinPool forkJoinPool = new ForkJoinPool(10);
        forkJoinPool.execute(() -> {
            listByPage.parallelStream().forEach(str -> {
                
            });
        });

以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。

推薦閱讀: