詳解MySQL 查詢語句的執行過程

首先先簡單的將一個查詢語句背後MySQL做瞭什麼捋一捋:

  • 客戶端發送一條查詢給服務器。
  • 服務器先檢查查詢緩存,如果命中瞭緩存,則立刻返回存儲在緩存中的結果。否則進入下一個階段。
  • 服務器端進行SQL解析,預處理,再由優化器生成對應的執行計劃。
  • MySQL根據優化器生成的執行計劃,調用存儲引擎的API來執行查詢。
  • 將結果返回給客戶端。

接著我們就將這個過程中的這些步驟詳細的進行展開。

1.客戶端和服務器端之間的通信方式

客戶端和服務器之間的通信是一種半雙工的通信,即在同一時刻,隻能有一方向另一方發送數據。所以客戶端在發送完查詢請求之後,所能做的就是等待服務器將查詢的結果返回,並且需要一直地等到返回的數據全部接收完畢後才能進行下一步的操作,而不可以在服務器發送的過程中中斷發送或者斷開連接。

2.查詢緩存

在解析一個查詢語句之前,如果查詢緩存是打開著的,那麼MySQL會優先檢查這個查詢是否命中查詢緩存中的數據。這個檢查是通過一個對大小寫敏感的哈希表來實現的。在查詢命中緩存的情況下,直接從緩存中拿到結果並返回給客戶端。MySQL不會再執行下面的操作,即查詢語句不會被解析,不會生成執行計劃,不會被執行。

3.查詢優化處理

這個環節可能是整個查詢執行過程中最為復雜的一個環節,可以分為解析SQL,預處理和優化SQL執行計劃三個步驟。

(1)語法解析器和預處理
這個過程就是對我們傳入的SQL語句的語法進行檢查,以及驗證查詢的權限。炳輝生成一棵“解析樹”。

(2)查詢優化器
在進入到這一步時,證明我們的語句語法層面已經沒有問題瞭。一條查詢可以有很多種執行計劃都能返回正確的結果,這個環節就是來選取最優的執行計劃的。
MySQL的最優執行計劃是基於成本的。MySQL會為每個操作設定一個成本(如執行一次where比較),並從所有的執行計劃中選擇“成本”最少的。
我們可以使用下列語句查看上一個查詢操作的成本:

mysql> SHOW STATUS LIKE 'last_query_cost';

MySQL會返回一個執行的成本數據:

+-----------------+----------+
| Variable_name  | Value  |
+-----------------+----------+
| Last_query_cost | 0.549000 |
+-----------------+----------+

但值得註意的是,這裡的“成本”最小並不等於查詢的速度最快。即以“成本”來判斷查詢語句的優劣有時候是不可靠的。

優化器的優化策略可以大致地分為兩種:靜態優化和動態優化。

靜態優化是直接對之前生成的解析樹進行分析,例如可以通過一些代數變換將where條件轉化為另一種等價形式。靜態優化在第一次完成後就一直生效,即使使用不同的參數重復執行查詢也不會發生變化,可以認為是一種“編譯(預處理)時優化”。

動態優化和查詢的上下文相關,需要在每一次查詢的時候重新評估,可以認為是一種“運行時優化”。

下面是一些MySQL能夠處理的優化類型:

  • 重新定義關聯表的順序

有時候我們所給的查詢語句關聯表的順序可能對於查詢來說效率並不是最優的,這時候MySQL可以自動幫我們將關聯表的順序進行調整提高效率。

  • 將外連接轉化為內連接

並不是所有的OUT JOIN語句都必須以外連接的方式執行。MySQL能夠識別這一點並重寫查詢,讓其可以調整關聯順序。

  • 使用等價變換規則

使用一些等價的語句來減少比較的次數,移除一些恒成立和不恒成立的條件。例如,(5=5 AND a>5)會被改寫為a>5;如果有(a5 AND b=c AND a=5。

  • 優化COUNT()、MIN()和MAX()

索引和列是否為空可以幫助優化這一類表達式。例如查找最小值的時候就可以借助索引直接查找最左端的記錄,這樣就不用進行整個表的查詢,而是以一個常數進行取代。

  • 覆蓋索引掃描

當索引中的列包含所有查詢中需要使用的列的時候,MySQL就會使用索引返回所需要的數據,而無須查詢對應的數據行。

  • 提前終止查詢

在發現查詢已經能滿足需求的時候,MySQL總能立刻終止查詢。一個典型的例子就是當使用瞭LIMIT子句的時候。

至此,MySQL服務器層已經根據所給的查詢語句給出瞭一個最優的執行計劃。但是我們需要知道的是,我們到目前為止所進行的一些列的操作都是在服務器層進行的,而這一層中並不是數據存儲的地方。因此接下來我們需要拿著我們的最優執行計劃去到實際的存儲引擎中進行查找。因此就引出瞭我們的下一步操作:向存儲引擎獲取相應的統計信息。

4.查詢執行引擎

相對於查詢優化階段,查詢執行階段並不是那麼復雜。MySQL隻是簡單地根據執行計劃給出的指令逐步執行。

5.返回結果給客戶端

查詢執行的最後一個階段是將結果返回給客戶端,即使查詢不需要返回結果集給客戶端,MySQL仍然會返回這個查詢的一些信息,例如查詢影響的行數。
如果查詢可以被緩存,這個階段MySQL會講查詢的結果放到查詢緩存中。
返回結果的過程是一個逐步增量的過程。即當拿到第一個結果的時候就開始向客戶端返回瞭。這樣做的好處是不會一次性返回全部數據導致占用內存過多,而且客戶端也能在第一時間拿到結果。結果集中的每一行都會以一個滿足MySQL客戶端/服務器通信協議的封包發送,再通過TCP協議進行傳輸,在TCP傳輸的過程中,可能對封包進行緩存後再批量發傳輸。

以上就是詳解MySQL 查詢語句的執行過程的詳細內容,更多關於MySQL 查詢語句的資料請關註WalkonNet其它相關文章!

推薦閱讀: