java分佈式面試接口如何保證冪等及概念理解

引言

穩定性設計第一篇:這一小節開始講設計系統穩定性保證的相關設計,誰都不想自己負責的系統三天兩頭就出故障,也不想周六日跟女票葡萄美酒夜光杯的時候一個電話call去VPN辦公,那麼你就想辦法讓你的系統盡量穩定,我們的目標是讓系統“無人值守”。

阿裡新零售和阿裡媽媽,美團,過去我面試這些公司都被問過接口冪等相關問題,接口冪等設計在分佈式系統開發中非常常見且很重要,後來我自己做面試官也慢慢意識到冪等的重要性。

一些初學者對冪等這個概念完全不理解,更不知道如何設計,這在工作中很容易給自己惹麻煩,所以一定要會!一定要會!一定要會!

1、冪等的概念

面試官:

冪等的概念你瞭解嗎,你設計的系統裡有哪些接口使用到瞭冪等設計?

問題分析:

冪等的概念首先你肯定理解瞭,簡單通俗易懂,就是無論你是 Http 接口還是 RPC 接口,入參不變的情況下,無論請求多少次,結果都是一樣的,請求結果不會因為請求次數不同而改變,沒有任務副作用。

答:我參加工作的第一年,在某在線購票(電影票)App的一傢公司做後臺系統開發,當時我負責積分系統,工作中接到這樣一個線上活動需求。業務場景描述:用戶每天使用 App 點擊簽到按鈕參加活動,領取相應的積分,每個用戶每天隻能參加一次簽到領積分活動,簽到按鈕在點擊一次後會自設置灰色變為不可點擊的狀態,這個領積分的接口由我負責開發,提供 API 給客戶端同事,上線後出現這樣一個bug,當時沒有完善的業務監控系統,功能上線後第二天問出於好奇系統裡積分最高的人有多少積分,就在後臺跑瞭一個sql,這一好奇,驚奇的發現有的用戶積分高達幾萬分,因為積分除瞭簽到領取外,大多都是消費累計積分,一塊錢才能累積一分,我表示懷疑,什麼能人看電影能看幾萬塊錢?

帶著這個疑問,我查詢瞭他的積分累積記錄,發現大部分積分都是靠簽到領積分獲得的,按照活動規則,一個人一天隻能參加一次簽到,不可能有這麼多積分,而這個用戶一天簽到幾百次,後來經過和前端一同檢查bug發現問題所在,原因是簽到按鈕雖然變灰,但是請求的 url 沒有在前端頁面隱藏,用戶通過技術手段繞過 button 變灰的前端限制重復刷新瞭接口,重復獲得積分。

事後問題分析:

這個bug最大問題還在我這裡,因為我的接口沒有做冪等設計,正確的邏輯應該是根據系統當前日期做冪等,冪等後無論用戶發起多少次請求,最後的結果都是一樣的,積分隻累加一次。好在這個bug沒有被黑產發現,隻有幾個用戶發現損失可控。

因為我缺少設計經驗,不懂冪等設計,領導也沒提醒我,所以出現這種bug,經歷更多和錢相關的系統開發後,我明白一個道理,任何系統設計,都要考慮業務的安全性,內部系統可以為瞭節省人力,適當簡化設計,做到防君子不防小人,假設你的同事都是君子,對C端用戶的系統,不光要防君子,還要防小人,風險防范不能全指望風控系統,有時bug可能會來自系統內部,比如用戶並沒有惡意盜刷之意,隻是網絡不好,用戶等瞭兩秒鐘還沒加載完就多點瞭幾次簽到按鈕,我的接口沒有做冪等設計,隻要收到請求就會多給用戶加積分,這個時候能怪用戶嗎?很顯然是開發者的責任。

關於這個接口的冪等設計

我是這樣解決的:

積分接口後臺根據用戶手機號 + userId + 系統當前日期拼接後生成唯一流水號,根據流水號後保存,如果用戶重復發起請求,先根據唯一流水號校驗在後臺做校驗,如果流水號存在直接返回上一次請求結果,考慮到並發的情況下,狀態判斷使用瞭鎖處理。

開發業務監控系統,采用定時任務每天生成系統裡 Top100 積分增長最多名單,運營或者術人員每天觀察有沒有異常。

圖片描述

經過這次bug反思,學習到兩點:

理解冪等設計的重要性,凡是和錢相關的功能請謹慎。

監控系統的重要性,這裡的監控說的是業務類監控,如果那天我沒有好奇系統裡誰的積分最高,這個bug會什麼時候發現?

面試官: 嚯,有點意思,你還真的是寫瞭個大bug,弄懂瞭吸取教訓就好,可別進瞭我的項目組後拿我們的系統寫這bug。

深入分析:

在編程中一個冪等操作的特點是其任意多次執行所產生的影響均與一次執行的影響相同。冪等函數,或冪等方法,是指可以使用相同參數重復執行,並能獲得相同結果的函數。這些函數不會影響系統狀態,也不用擔心重復執行會對系統造成改變。例如,“setTrue()”函數就是一個冪等函數,無論多次執行,其結果都是一樣的。更復雜的操作冪等保證是利用唯一交易號(流水號)實現。

 —— 百度百科

如果你瞭解 Restful 風格接口,相信你對 GET / POST / DELETE 幾個動詞不陌生,在一次面試錘子科技的過程中,面試官問我是否瞭解 Rest 接口,我balabala回答瞭這幾常用的動詞,面試官又問我:那你除瞭知道 GET 是從服務器獲取資源,還有別的理解嗎?當時我沒答上來,出瞭公司以後才想起,GET 動作的設計應該是冪等的。同理 DELETE 也是冪等的,如果你設計的接口 GET / DELETE 不是冪等的,那麼你可能要重新思考一下瞭。

2、工作中常見的冪等設計場景

如果你做的功能和錢相關,或者是能還錢的,那麼你就要小心瞭,每一個接口都要先考慮下是否需要冪等設計,下面是兩種常見的需求場景。

發券/積分接口,通常通過 orderId userId 做冪等校驗。

支付/退款接口,我們不希望用戶發起多次支付都收到用戶的錢,用戶會投訴,還要把錢退還給用戶,對系統還是客服人員來說都是無用功,支付系統非常復雜,想做好支付系統,還有很多東西需要學習,要考慮網絡延遲,服務異常,訂單中心回掉超時等各種不穩定的因素,通常采用前端控制,邏輯層狀態的控制,數據層唯一索引的控制,以及分佈式鎖的控制,在冪等篇不過過多討論。

3、冪等接口常見設計方案

客戶端按鈕提交限制,每次提交一個請求時,按鈕置為不可用。

後臺系統邏輯層處理,生成保存唯一ID(流水號),每次請求先校驗流水號是否已經存在,存在則表示重復操作,直接返回上一次操作結果。

token校驗機制,客戶端請求前先申請token,同一個token隻處理一次,無token或者相同token不做處理。

分佈式鎖,如引入 Redis 分佈式鎖,防止其他請求重復操作。

請求隊列,引入 MQ 排隊的方式讓請求有序處理,關於異步操作的應用會在後面的章節講解。

每一種方案都有自己的優缺點,比如客服端按鈕提交限制,實現簡單,但是不能從根本上解決問題,後臺生成唯一ID,判斷存在狀態必須要保證原子操作,可以采用多種方案組合的方式解決冪等問題,我們的目標是,用最容易維護的方法解決問題。

總結

在過去的工作經歷中,我招進來一個工作三年的同事,場景是開發一個退款接口,review代碼的時候,我發現退款的功能是做完瞭,錢確實能退,但是並沒有做冪等設計,我倆討論瞭下,我說:如果同一個訂單被請求瞭兩次退款,那這錢是不是要退兩次,這很危險呀?當時這個同事並沒有意識到這一點,因為沒有相關經驗,連概念都不知道,作為一個三年經驗的實在不應該,和錢相關的功能一定要慎重,做冪等設計就是為瞭系統能防君子,也要防小人。

以上就是java分佈式面試接口如何保證冪等及概念的詳細內容,更多關於java分佈式面試接口冪等保證的資料請關註WalkonNet其它相關文章!

推薦閱讀: