淺談mysql執行過程以及順序

前言:mysql在我們的開發中基本每天都要面對的,作為開發中的數據的來源,mysql承擔者存儲數據和讀寫數據的職責。因為學習和瞭解mysql是至關重要的,那麼當我們在客戶端發起一個sql到出現詳細的查詢數據,這其中究竟經歷瞭什麼樣的過程?mysql服務端是如何處理請求的,又是如何執行sql語句的?本篇博客將來探討這個問題:

一:mysql執行過程

mysql整體的執行過程如下圖所示:

1.1:連接器

連接器的主要職責就是:

①負責與客戶端的通信,是半雙工模式,這就意味著某一固定時刻隻能由客戶端向服務器請求或者服務器向客戶端發送數據,而不能同時進行,其中mysql在與客戶端連接TC/IP的

②驗證請求用戶的賬戶和密碼是否正確,如果賬戶和密碼錯誤,會報錯:Access denied for user ‘root’@’localhost’ (using password: YES)

③如果用戶的賬戶和密碼驗證通過,會在mysql自帶的權限表中查詢當前用戶的權限:

mysql中存在4個控制權限的表,分別為user表,db表,tables_priv表,columns_priv表,mysql權限表的驗證過程為:

1:User表:存放用戶賬戶信息以及全局級別(所有數據庫)權限,決定瞭來自哪些主機的哪些用戶可以訪問數據庫實例

  • Db表:存放數據庫級別的權限,決定瞭來自哪些主機的哪些用戶可以訪問此數據庫
  • Tables_priv表:存放表級別的權限,決定瞭來自哪些主機的哪些用戶可以訪問數據庫的這個表
  • Columns_priv表:存放列級別的權限,決定瞭來自哪些主機的哪些用戶可以訪問數據庫表的這個字段
  • Procs_priv表:存放存儲過程和函數級別的權限

2:先從user表中的Host,User,Password這3個字段中判斷連接的ip、用戶名、密碼是否存在,存在則通過驗證。

3:通過身份認證後,進行權限分配,按照user,db,tables_priv,columns_priv的順序進行驗證。即先檢查全局權限表user,如果user中對應的權限為Y,則此用戶對所有數據庫的權限都為Y,將不再檢查db, tables_priv,columns_priv;如果為N,則到db表中檢查此用戶對應的具體數據庫,並得到db中為Y的權限;如果db中為N,則檢查tables_priv中此數據庫對應的具體表,取得表中的權限Y,以此類推

4:如果在任何一個過程中權限驗證不通過,都會報錯

1.2:緩存

mysql的緩存主要的作用是為瞭提升查詢的效率,緩存以key和value的哈希表形式存儲,key是具體的sql語句,value是結果的集合。如果無法命中緩存,就繼續走到分析器的的一步,如果命中緩存就直接返回給客戶端 。不過需要註意的是在mysql的8.0版本以後,緩存被官方刪除掉瞭。之所以刪除掉,是因為查詢緩存的失效非常頻繁,如果在一個寫多讀少的環境中,緩存會頻繁的新增和失效。對於某些更新壓力大的數據庫來說,查詢緩存的命中率會非常低,mysql為瞭維護緩存可能會出現一定的伸縮性的問題,目前在5.6的版本中已經默認關閉瞭,比較推薦的一種做法是將緩存放在客戶端,性能大概會提升5倍左右

1.3:分析器

分析器的主要作用是將客戶端發過來的sql語句進行分析,這將包括預處理與解析過程,在這個階段會解析sql語句的語義,並進行關鍵詞和非關鍵詞進行提取、解析,並組成一個解析樹。具體的關鍵詞包括不限定於以下:select/update/delete/or/in/where/group by/having/count/limit等.如果分析到語法錯誤,會直接給客戶端拋出異常:ERROR:You have an error in your SQL syntax.

比如:select * from user where userId =1234;

在分析器中就通過語義規則器將select from where這些關鍵詞提取和匹配出來,mysql會自動判斷關鍵詞和非關鍵詞,將用戶的匹配字段和自定義語句識別出來。這個階段也會做一些校驗:比如校驗當前數據庫是否存在user表,同時假如User表中不存在userId這個字段同樣會報錯:unknown column in field list.

1.4:優化器

能夠進入到優化器階段表示sql是符合mysql的標準語義規則的並且可以執行的,此階段主要是進行sql語句的優化,會根據執行計劃進行最優的選擇,匹配合適的索引,選擇最佳的執行方案。比如一個典型的例子是這樣的:

表T,對A、B、C列建立聯合索引,在進行查詢的時候,當sql查詢到的結果是:select xx where B=x and A=x and C=x.很多人會以為是用不到索引的,但其實會用到,雖然索引必須符合最左原則才能使用,但是本質上,優化器會自動將這條sql優化為:where A=x and B=x and C=X,這種優化會為瞭底層能夠匹配到索引,同時在這個階段是自動按照執行計劃進行預處理,mysql會計算各個執行方法的最佳時間,最終確定一條執行的sql交給最後的執行器

1.5:執行器

在執行器的階段,此時會調用存儲引擎的API,API會調用存儲引擎,主要有一下存儲的引擎,不過常用的還是myisam和innodb:

引擎以前的名字叫做:表處理器(其實這個名字我覺得更能表達它存在的意義)負責對具體的數據文件進行操作,對sql的語義比如select或者update進行分析,執行具體的操作。在執行完以後會將具體的操作記錄到binlog中,需要註意的一點是:select不會記錄到binlog中,隻有update/delete/insert才會記錄到binlog中。而update會采用兩階段提交的方式,記錄都redolog中

二:執行的狀態

可以通過命令:show full processlist,展示所有的處理進程,主要包含瞭以下的狀態,表示服務器處理客戶端的狀態,狀態包含瞭從客戶端發起請求到後臺服務器處理的過程,包括加鎖的過程、統計存儲引擎的信息,排序數據、搜索中間表、發送數據等。囊括瞭所有的mysql的所有狀態,其中具體的含義如下圖:

三:sql的執行順序

事實上,sql並不是按照我們的書寫順序來從前往後、左往右依次執行的,它是按照固定的順序解析的,主要的作用就是從上一個階段的執行返回結果來提供給下一階段使用,sql在執行的過程中會有不同的臨時中間表,一般是按照如下順序:

例子: select distinct s.id from T t join S s on t.id=s.id where t.name=”Yrion” group by t.mobile having count(*)>2 order by s.create_time limit 5;

3.1:from

第一步就是選擇出from關鍵詞後面跟的表,這也是sql執行的第一步:表示要從數據庫中執行哪張表。

實例說明:在這個例子中就是首先從數據庫中找到表T

3.2:join on

join是表示要關聯的表,on是連接的條件。通過from和join on選擇出需要執行的數據庫表T和S,產生笛卡爾積,生成T和S合並的臨時中間表Temp1。on:確定表的綁定關系,通過on產生臨時中間表Temp2.

實例說明:找到表S,生成臨時中間表Temp1,然後找到表T的id和S的id相同的部分組成成表Temp2,Temp2裡面包含著T和Sid相等的所有數據

3.3:where

where表示篩選,根據where後面的條件進行過濾,按照指定的字段的值(如果有and連接符會進行聯合篩選)從臨時中間表Temp2中篩選需要的數據,註意如果在此階段找不到數據,會直接返回客戶端,不會往下進行.這個過程會生成一個臨時中間表Temp3。註意在where中不可以使用聚合函數,聚合函數主要是(min\max\count\sum等函數)

實例說明:在temp2臨時表集合中找到T表的name=”Yrion”的數據,找到數據後會成臨時中間表Temp3,temp3裡包含name列為”Yrion”的所有表數據

3.4:group by

group by是進行分組,對where條件過濾後的臨時表Temp3按照固定的字段進行分組,產生臨時中間表Temp4,這個過程隻是數據的順序發生改變,而數據總量不會變化,表中的數據以組的形式存在

實例說明:在temp3表數據中對mobile進行分組,查找出mobile一樣的數據,然後放到一起,產生temp4臨時表。

3.5:Having

對臨時中間表Temp4進行聚合,這裡可以為count等計數,然後產生中間表Temp5,在此階段可以使用select中的別名

實例說明:在temp4臨時表中找出條數大於2的數據,如果小於2直接被舍棄掉,然後生成臨時中間表temp5

3.6:select

對分組聚合完的表挑選出需要查詢的數據,如果為*會解析為所有數據,此時會產生中間表Temp6

實例說明:在此階段就是對temp5臨時聚合表中S表中的id進行篩選產生Temp6,此時temp6就隻包含有s表的id列數據,並且name=”Yrion”,通過mobile分組數量大於2的數據

3.7:Distinct

distinct對所有的數據進行去重,此時如果有min、max函數會執行字段函數計算,然後產生臨時表Temp7

實例說明:此階段對temp5中的數據進行去重,引擎API會調用去重函數進行數據的過濾,最終隻保留id第一次出現的那條數據,然後產生臨時中間表temp7

3.8:order by

會根據Temp7進行順序排列或者逆序排列,然後插入臨時中間表Temp8,這個過程比較耗費資源

實例說明:這段會將所有temp7臨時表中的數據按照創建時間(create_time)進行排序,這個過程也不會有列或者行損失

3.9:limit

limit對中間表Temp8進行分頁,產生臨時中間表Temp9,返回給客戶端。

實例說明:在temp7中排好序的數據,然後取前五條插入到Temp9這個臨時表中,最終返回給客戶端

ps:實際上這個過程也並不是絕對這樣的,中間mysql會有部分的優化以達到最佳的優化效果,比如在select篩選出找到的數據集

四:總結

本篇博客總結瞭mysql的執行過程,以及sql的執行順序,理解這些有助於我們對sql語句進行優化,以及明白mysql中的sql語句從寫出來到最終執行的軌跡,有助於我們對sql有比較深入和細致的理解,提高我們的數據庫理解能力。同時,對於復雜sql的執行過程、編寫都會有一定程度的意義。

到此這篇關於淺談mysql執行過程以及順序的文章就介紹到這瞭,更多相關mysql執行過程及順序內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: