RocketMQ的push消費方式實現示例

引言

最近仍然暢遊在RocketMQ的源碼中,這幾天剛好翻到瞭消費者的源碼,發現RocketMQ的對於push消費方式的實現簡直太聰明瞭,所以趁著我腦子裡還有點印象的時候,趕緊來寫一篇文章,來掰扯一下,防止過兩天就忘得一幹二凈瞭。

MQ消費方式

消費方式就是指消費者如何從MQ中獲取到消息,分為兩種方式,push(推方式)和pull(拉方式)。

1、push(推方式)

push,顧名思義,就是推的意思。就是當MQ收到生產者產生的消息的時候,會主動將消息推送到消費者進行消費,這種模式就叫push,也就是MQ將消息推給到消費者的意思。

push模式

push這種模式的好處就是響應快,消息的實時性比較高,一旦消息MQ收到消息,那麼就能立馬將消息推送給消費者,消費者也就能立馬收到消息進行消費。

但是這種push的模式,有個缺點就是一旦消息量比較大時,對消費者性能要求比較高,因為是消費者無法控制MQ消息的推送速度,一旦消息量大,那麼消費者消費消息的壓力就比較大。

2、pull(拉方式)

push是MQ主動給消費者推消息,那麼pull呢?剛好跟push相反,就是消費者主動去MQ中拉取消息。

pull模式

那麼pull的優缺點自然也就跟push剛好相反。因為是消費者主動去MQ中拉取消息,那麼消費者可根據自身消費的情況,決定何時去拉取消息,主動權在自己手上,這樣消費者的壓力就會相對小點;但是缺點也很明顯,那麼就會實時性相對於push方式會低一些,因為你得決定拉的時間間隔。

其實想想,消費方式就跟拿快遞一樣,快遞就是一個消息,我自己就是消費者,快遞要麼快遞小哥主動送(push)到傢,要麼我自己去快遞站拿(pull)。

RocketMQ對於消費方式的實現

上一節說瞭消費消息的兩種方式push和pull,或者說算一種理念。尚大的周陽老師有一句經常說的話我比較贊同,那就是“天上飛的理念,必然有落地的實現”。所以push或者pull到底如何落地,得看具體的MQ的產品瞭。

而RocketMQ作為阿裡開源的一款高性能、功能豐富的MQ,自然同時實現瞭push和pull的兩種消費方式,用戶可以選擇在項目中使用push還是pull。

push模式的實現

pull模式的實現

但是一般情況下,項目中都是使用push的方式來消費,因為pull除瞭時實性差外,pull方式還得讓開發人員主動去維護消息消費進度,增加額外的操作。

所以接下來就著重講一下RocketMQ是如何實現push的邏輯。

RocketMQ聰明地實現push的原因

上文說到push模式的優點是時實性好,但是缺點就是消費者壓力會比較大,所以,難道實現push模式,隻能舍棄壓力的控制麼?

就在這時,RocketMQ大喊瞭一聲

是的,RocketMQ對於push模式做到瞭實時和壓力的平衡,這主要是因為RocketMQ的push模式其實算是一個“偽push”模式,真正底層的實現還是基於pull。

到這裡可能有的小夥伴比較迷糊,怎麼push變成“偽push”瞭,還是用pull實現的,到底是push還是pull?

前面我說過,push和pull隻是一種理論,具體的實現看MQ。

所以RocketMQ為瞭兼顧兩者,就選擇通過消費者主動拉消息來實現push的效果,這也是為什麼我稱為“偽push”的原因,RocketMQ都給封裝好瞭,讓你用起來感覺是MQ主動push消息給你的。

既然底層是pull,那麼RokcetMQ在實現消費者的邏輯的時候,就可以很容易實現控制壓力的效果,畢竟這是“拉”方式天然自帶的buff;但是如何通過pull實現push的時實的優點呢?畢竟魚和熊掌我RokcetMQ偏要兼得。

這時這就不得不提到一種叫“長輪詢”的機制。

輪詢與長輪詢

輪詢與長輪詢都屬於pull的實現,都是由客戶端主動給服務端發送請求,拉取數據。套到MQ中,就是都是消費者主動去MQ拉消息。

輪詢

輪詢是指不管服務端數據有無更新,客戶端每隔定長時間請求拉取一次數據,可能有更新數據返回,也可能什麼都沒有。

再拿快遞舉例子,輪詢就好比,小明買的iphone 13 pro max快遞到瞭,顯示正在派送中,但是小明等不及瞭,於是就去快遞站拿,但是快遞還沒放到快遞站,但是小明的心裡急啊,他忍受不瞭相思之苦,於是小明每隔5分鐘就往快遞站跑一次,問一下快遞到瞭沒,到瞭就拿回來。這就是輪詢的意思,也就是不論有沒有數據,客戶端都會每隔一定時間去請求一次服務端。

來分析一下拿快遞的例子的問題:

  • 每隔5分鐘就往快遞站跑,那不是累死個小明麼。
  • 還有一個問題,假設剛跑到快遞站,快遞沒到,就回去瞭,但是剛到傢的時候,快遞到瞭,於是又等瞭5分鐘,再去快遞站終於拿到快遞瞭,但是其實快遞都到瞭幾分鐘瞭,你還是沒有第一時間拿到快遞,這就造成瞭延遲。

從而對應到程序中,就是會產生如下問題

  • 對於消息而言,會一直產生,這就要求消費者不停地間隔一定時間去拉取消息,即使沒有消息也需要去請求,就會造成大量無用的請求,白白浪費大量耗費服務器內存和寬帶資源。
  • 可能造成數據的延遲

長輪詢

說長輪詢概念之前,先來救救小明吧,畢竟小明可不想狗帶。

既然原先小明每隔5分鐘跑一次,那麼是不是可以換種思路,當快遞還沒到的時候,讓小明不要回來,直接在快遞站待著,當快遞到的時候,才讓小明拿著快遞回傢。這下小明就喜死瞭,既可以有時間刷刷某音,逛逛某東,還可以在第一時間拿到13 pro max。

所以這種可以在快遞站等待的機制,就叫長輪詢。

長輪詢也是客戶端請求服務端,如果服務端有數據,那麼就立馬返回,客戶端再次請求;當服務端不存在數據的時候,服務端並不會給客戶端響應,而是將請求給hold住,當服務端有數據的時候才會給客戶端響應,返回數據。

所以長輪詢可以解決如下問題

  • 解決輪詢帶來的頻繁請求服務端但是沒有的問題
  • 一旦新的數據到瞭,那麼消費者能立馬就可以獲取到新的數據,所以從效果上,有點像是push的感覺。

但是長輪詢也會帶來服務端代碼實現邏輯復雜的問題,當然相比於優點來說,都不太重要。

push消費方式源碼探究

理論都講完瞭,接下來就到瞭show me the code的時間瞭,來看看RocketMQ的是如何通過長輪詢機制來實現壓力和時實的平衡。

這裡我畫瞭一張push模式下消費者消費流程圖。

消費者拉取消息的邏輯

  • ①消費者有一個後臺線程,會去處理拉取消息(PullRequest)
  • ②先去判斷有沒有過多消息沒有消費,如果有的話,那麼就間隔一定時間再次從①開始執行拉取消息的邏輯
  • ③消費者沒有過多消息沒有消費,那麼就會直接向MQ發送拉取消息的請求,有消息就返回,沒有消息就hold住請求,等有新的消息到的時候才返回
  • ④消費者獲取到消息之後,會去找用戶自定義的消息處理邏輯的實現(MessageListener的實現)去消費消息,同時會再次拉取消息,繼續從①開始執行邏輯

1、消費者拉取消息控制壓力源碼

當消費者準備去拉消息的時候,會先去判斷當前消費者消費的壓力再決定是否去拉取消息。

RocketMQ提供瞭兩種判斷消費壓力邏輯,一種是基於還未消費的消息的數量的大小,還有一種是基於還未消費的消息所占內存的大小。

控制壓力源碼

  • 判斷還未消費消息的數量,數量太多就等會再執行重新執行拉取消息的邏輯
  • 判斷還未消費消息的大小,如果還未消息的消息占用的內存過大,就等會再執行重新執行拉取消息的邏輯

總的一句話就是,當消費者消費的壓力過大時,就不會去拉取消息,而是等待一定的時間再去執行拉取消息的邏輯,如果壓力還是很大,就還繼續等,如此循環,直到消費者的消費壓力小於閾值的時候,才會真正的發送請求到MQ中拉取消息。

2、MQ將請求hold住源碼

當服務端未找到消息時,就將請求進行掛起,存起來

請求hold住源碼

拉取不到消息時,會調用PullRequestHoldService的suspendPullRequest方法講請求存儲起來。PullRequestHoldService是用來存儲拉取請求的類。

PullRequestHoldService

suspendPullRequest方法會將請求分類,放到ManyPullRequest裡,然後用一個ConcurrentHashMap進行存儲

3、MQ收到消息響應給消費者的源碼

NotifyMessageArrivingListener

當生產者發送的消息達到MQ的時候,MQ會回調NotifyMessageArrivingListener的arriving方法,之後就會調用PullRequestHoldService的notifyMessageArriving方法,MQ會重新處理拉取消息的邏輯,此時就能找到最新來的那條消息,從而將最新的消息通過網絡返回給消費者。

notifyMessageArriving和返回消息邏輯

最後

所以從以上的分析可以看出,RocketMQ對於push的消費方式的實現是基於長輪詢機制來實現的,同時平衡瞭時實和壓力,這其實就很nice瞭。

最後我想說一句,其實不論是pull還是push,又或是輪詢和長輪詢,其實都是一種理論或者說是一種思想,不單單是MQ的東西,就比如在Nacos中,也使用瞭push和長輪詢機制。但是這些理論在不同產品的具體實現,實現方式可能不太一樣,但都是大同小異,所以當你懂瞭這些思想,再看其它框架的源碼,其實就很容易瞭。

以上就是RocketMQ的push消費方式實現示例的詳細內容,更多關於RocketMQ push消費方式的資料請關註WalkonNet其它相關文章!

推薦閱讀: