詳解PHP調用Go服務的正確方式
問題
服務耦合
我們在開發過程中可能會遇到這樣的情況:
- 進程依賴於某服務,所以把服務耦合在進程代碼中;
- 服務初始化耗時長,拖慢瞭進程啟動時間;
- 服務運行要占用大量內存,多進程時內存損耗嚴重。
文本匹配服務,它是消息處理流程中的一環,被多個消息處理進程依賴,每次初始化進程要 6秒 左右時間構造 Trie 樹,而且服務讀取關鍵詞大文件、使用樹組構造 Trie 樹,會占用大量(目前設置為 256M )內存。
我已經把進程寫成瞭守護進程的形式,讓它們長時間執行,雖然不用更多地考慮初始化時間瞭,但占用內存量巨大的問題沒有辦法。如果關鍵詞量再大一些,一臺機器上面跑十來個消息處理進程後就幹不瞭其他瞭。
而且,如果有需求讓我把文本匹配服務封裝為接口給外部調用呢?我們知道,web 服務時,每一個請求處理進程的生存周期是從受理請求到響應結束,如果每次請求都用大量內存和時間來初始化服務,那接口響應時間和服務器壓力可想而知。
服務抽取
這樣,服務形式必須要改變,我們希望這個文本匹配這個服務能做到:
- 隨調隨走,不依賴,不再與“消息處理服務”耦合在一起;
- 一次初始化,進程運行期間持續提供服務;
- 同步響應,高效而準確,最好能不用各種鎖來保持資源占有;
解決辦法也很簡單,就是把這個文本匹配的服務抽取出來,單獨作為一個守護進程來運行,像一個特殊的服務器,多個“消息處理服務”在有需要時能調用此服務進程。
現在,我們需要考慮文本匹配服務進程如何與外界通信,接受匹配請求,響應匹配結果。繞來繞去,問題還是回到瞭 進程間通信。
Unix Domain Sockets
進程間通信
進程間通信(IPC,Inter-Process Communication),指至少兩個進程或線程間傳送數據或信號的一些技術或方法。進程是計算機系統分配資源的最小單位(嚴格說來是線程)。每個進程都有自己的一部分獨立的系統資源,彼此是隔離的。為瞭能使不同的進程互相訪問資源並進行協調工作,才有瞭進程間通信。
進程間通信的方式有很多,網上對此介紹的也很多,下面根據文章的需求來分析一下這些方式:
- 管道:管道是Unix最初的IPC形式,但它隻能用於具有共同祖先進程的各個進程,無法用於在沒有親緣關系的進程。如果使用它,需要在“消息處理服務”中啟動“文本匹配服務”,跟原來差別不大。
- 命名管道:也被稱為有名管道,它在Unix稱為FIFO,它通過一個文件來進行進程間數據交互,但服務於多個進程時,需要添加鎖來保證原子性,從而避免寫入和讀取不對應。
- 信號和信號量:用於進程/線程事件級的通信,但它們能交流的信息太少。
- 消息隊列和共享內存:都是通過一個公共內存介質來進行通信
- socket:通過Unix封裝好的網絡API來進行通信,像數據庫、服務器都是通過這種方式實現,它們也能提供本地服務。不過網絡socket固然能使用,但是要面臨著數據包裝和網絡調用開銷,也不是完美的選擇。
簡單介紹
當然還是有完美的方式的,這就是今天的主角 – Unix Domain Sockets ,它可以理解為一種特殊的 Socket,但它不需要經過網絡協議棧,不需要打包拆包、計算校驗和、維護序號和應答等,隻是將應用層數據從一個進程拷貝到另一個進程,所以在系統內通信效率更高。而且免去瞭網絡問題,它也更能保證消息的完整性,既不會丟失也不會順序錯亂。
作為特殊的 Socket,它的創建、調用方式和網絡 Socket 一樣,一次完整的交互,服務端都要經過create、bind、listen、accept、read、write,客戶端要通過create、connect、write、read。與普通 Socket 不同的是它綁定一個系統內的文件,而不是 IP 和端口。
適用場景
Unix Domain Sockets 真的是進程間通信的一個重型武器,用它可以快速實現進程間的數據、信息交互,而且不需要鎖等繁雜操作,也不用考慮效率,可謂是簡單高效。
當然,“重型武器” 的在各種場景下也有適合不適合。Unix Domain Sockets適用於以下場景:
- 服務長時間存在。 Unix Domain Sockets 的服務端是個服務器一樣的存在,在守護進程中,它阻塞並等待客戶端連接的特性可以被充分利用。
- 一服務器多客戶端。它能通過 Socket 的文件描述符來區分不同的客戶端,避免資源之間的鎖操作。
- 同一系統內。它隻能在同一系統內進行進程數據復制,跨系統請使用傳統 Sockets。
代碼實現
接下來要 show code 瞭,不過學 PHP 的都知道,PHP 不太適合處理 CPU 密集形的任務,我剛好學瞭點 Go,一時手癢,就用 Go 實現瞭下 Trie 樹,所以才牽扯到 PHP 和 Go 之間的通信,有瞭今天的文章。當然介紹的方法,並不隻適合 PHP 與 Go 通信,其他語言也可以,至少 C系語言中是通用的。
Go 實現的 Trie 樹
Trie樹不再是今天的主題,這裡介紹一下數據結構和需要註意的點。
// trie樹結點定義 type Node struct { depth int children map[int32]Node // 用map實現key-value型的 字符-節點 對應 }
需要註意:
- 使用 slice 的 append() 函數保存遞增的匹配結果時,有可能由於 slice 容量不夠而重新分配地址,所以要傳入 slice 的地址來保存遞增後的匹配結果結果,*result = append(*result, word),最後再將遞增之後的 slice 地址傳回。
- 由於 Go 中的編碼統一使用的 utf-8,不用像 PHP 一樣判斷字符的邊界,所以在進行關鍵詞拆散和消息拆散時,直接使用 int32() 方法將關鍵詞和消息都轉換為成員為 int32 類型的 slice,匹配過程中就使用 int32 類型的數字來代表這個中文字符,匹配完成後再使用fmt.Printf(“%c”, int32)將其轉換為中文。
Go Server
Go 中創建一個 socket 並使用的步驟非常簡單,隻是 Go 沒有異常,判斷 error 會比較惡心一點,不知道有沒有大神有更好的寫法。下面為瞭精簡,把 error 全置空瞭。
// 創建一個Unix domain soceket socket, _ := net.Listen("unix", "/tmp/keyword_match.sock") // 關閉時刪除綁定的文件 defer syscall.Unlink("/tmp/keyword_match.sock") // 無限循環監聽和受理客戶端請求 for { client, _ := socket.Accept() buf := make([]byte, 1024) data_len, _ := client.Read(buf) data := buf[0:data_len] msg := string(data) matched := trie.Match(tree, msg) response := []byte("[]") // 給響應一個默認值 if len(matched) > 0 { json_str, _ := json.Marshal(matched) response = []byte(string(json_str)) } _, _ = client.Write(response) }
PHP Client
下面是 PHP 實現的客戶端:
$msg = "msg"; // 創建 連接 發送消息 接收響應 關閉連接 $socket = socket_create(AF_UNIX, SOCK_STREAM, 0); socket_connect($socket, '/tmp/keyword_match.sock'); socket_send($socket, $msg, strlen($msg), 0); $response = socket_read($socket, 1024); socket_close($socket); // 有值則為匹配成功 if (strlen($response) > 3) { var_dump($response); }
小結
效率
這裡總結一下這套設計的效率表現:
純粹用 Go 進行文本關鍵詞匹配,一千條數據運行一秒多,差不多是 PHP 效率的兩倍。不過說好的 8倍效率呢?果然測評都是騙人的。當然,也可能是我寫法有問題或者 Trie 樹不在 Go 的發揮范圍之內。然後是 PHP 使用 Unix Domain Socket 調用 Go 服務的耗時,可能是進程間復制數據耗時或 PHP 拖瞭後腿,3秒多一點,跟純 PHP 腳本差不多。
雜談
用 PHP 的都知道,PHP 因為解釋型語言的特性和其高度的封裝,導致其雖然在開發上速度很快,可是執行與其他語言相比略差。對此,業界的 FB 有 HHVM,PHP7 有 opcache 新特性,據說還要在 PHP8 添加 JIT,用以彌補其先天硬傷。
不過,對於開發者,特別是跟我一樣對於效率有執著追求的人來說,在瞭解使用 PHP 的新特性之外,自己再掌握一門較高執行效率、開發效率略低的語言,用來寫一些高計算量,邏輯單一的代碼,與 PHP 互補或許會更好一點。
於是,在考慮良久,也見識瞭各種 Go 的支持者和反對者之間的撕逼後,我覺得還是要相信一下谷歌爸爸,畢竟也沒什麼其他我覺得可選的語言瞭。
另外C呢,雖然暫時開發中用不到,可是畢竟是當代N多語言的起源,偶爾寫寫數據結構、算法什麼的以免生銹。而且學瞭些C,從 PHP 到 Go,切換起來還略有些得心應手的感覺~
以上就是詳解PHP調用Go服務的正確方式的詳細內容,更多關於PHP調用Go服務的正確方式的資料請關註WalkonNet其它相關文章!
推薦閱讀:
- 用PHP實現的服務端socket具體實例
- 使用C語言實現本地socke通訊的方法
- 如何避免mysql啟動時錯誤及sock文件作用分析
- 詳解MySQL中的pid與socket
- mysql sock 文件解析及作用講解