MySQL中varchar和char類型的區別
前述
VARCHAR和CHAR是兩種最主要的字符串類型。不幸的是,很難精確地解釋這些值是怎麼存儲在磁盤和內存中的,因為這跟存儲引擎的具體實現有關。下面的描述假設使用的存儲引擎是InnoDB和/或者MyISAM。如果使用的不是這兩種存儲引擎,請參考所使用的存儲引擎的文檔。
先看看VARCHAR和CHAR值通常在磁盤上怎麼存儲。請註意,存儲引擎存儲CHAR或者VARCHAR值的方式在內存中和在磁盤上可能不一樣,所以MySQL服務器從存儲引擎讀出的值可能需要轉換為另一種存儲格式。
VARCHAR類型
VARCHAR類型用於存儲可變長字符串,是最常見的字符串數據類型。它比定長類型更節省空間,因為它僅使用必要的空間(例如,越短的字符串使用越少的空間)。有一種情況例外,如果MySQL表使用ROW_FORMAT=FIXED創建的話,每一行都會使用定長存儲,這會很浪費空間。
VARCHAR需要使用1或2個額外字節記錄字符串的長度:如果列的最大長度小於或等於255字節,則隻使用1個字節表示,否則使用2個字節。假設采用latin1字符集,一個VARCHAR(10)的列需要11個字節的存儲空間。VARCHAR(1000)的列則需要1002個字節,因為需要2個字節存儲長度信息。
VARCHAR節省瞭存儲空間,所以對性能也有幫助。但是,由於行是變長的,在UPDATE時可能使行變得比原來更長,這就導致需要做額外的工作。如果一個行占用的空間增長,並且在頁內沒有更多的空間可以存儲,在這種情況下,不同的存儲引擎的處理方式是不一樣的。例如,MyISAM會將行拆成不同的片段存儲,InnoDB則需要分裂頁來使行可以放進頁內。其他一些存儲引擎也許從不在原數據位置更新數據。
VARCHAR適用情況
下面這些情況下適用VARCHAR是合適的:
- 字符串列的最大長度比平均長度大很多
- 列的更新很少,所以碎片不是問題
- 使用瞭像UTF-8這樣復雜的字符集,每個字符都使用不同的字節數進行存儲
CHAR類型
CHAR類型是定長的:MySQL總是根據定義的字符串長度分配足夠的空間。當存儲CHAR值時,MySQL會刪除所有的末尾空格。CHAR值會根據需要采用空格進行填充以方便比較。
CHAR適合存儲很短的字符串,或者所有值都接近同一個長度。例如,CHAR非常適合存儲密碼的MD5值,因為這是一個定長的值。對於經常變更的數據,CHAR也比VARCHAR更好,因為定長的CHAR類型不容易產生碎片。對於非常短的列,CHAR比VARCHAR在存儲空間上也更有效率。例如用CHAR(1)來存儲隻有Y和N的值,如果采用單字節字符集隻需要一個字節,但是VARCHAR(1)卻需要兩個字節,因為還有一個記錄長度的額外字節。
測試
下面通過例子來具體說明CHAR與VARCHAR行為上的不同,首先,我們創建一張隻有一個CHAR(10)字段的表,並且往裡面插入一些值:
CREATE TABLE char_test ( char_col CHAR(10) ); INSERT INTO char_test VALUES ('string1'). (' string2'). ('string3 ');
當我們檢索這些值的時候,會發現string3末尾的空格被截斷瞭。
SELECT CONCAT("'", char_col, "'") FROM char_test;
如果用VARCHAR(10)字段存儲相同的值,可以得到如下結果:
CREATE TABLE varchar_test ( varchar_col VARCHAR(10) ); INSERT INTO varchar_test VALUES ('string1'). (' string2'). ('string3 '); SELECT CONCAT("'", varchar_col, "'") FROM varchar_test;
執行結果
VARCHAR(5)與VARCHAR(200)的區別
我們倘若用VARCHAR(5)和VARCHAR(200)來存儲’hello’,我們知道這兩者的空間開銷是一樣的。那麼我們可以讓VARCHAR的長度始終保持很大嗎?使用更短的列有什麼優勢嗎?
事實證明有很大的優勢。更長的列會消耗更多的內存,因為MySQL通常會分配固定大小的內存塊來保存內部值。尤其是使用內存臨時表進行排序或操作時會特別糟糕。在利用磁盤臨時表進行排序時也同樣糟糕。
所以最好的策略是隻分配真正需要的空間。
總結
當我們為字符串類型的字段選取類型的時候,判斷該選取VARCHAR還是CHAR,我們可以從以下幾個方面來考慮:
- 該字段數據集的平均長度與最大長度是否相差很小,若相差很小優先考慮CHAR類型,反之,考慮VARCHAR類型。
- 若字段存儲的是MD5後的哈希值,或一些定長的值,優先選取CHAR類型。
- 若字段經常需要更新,則優先考慮CHAR類型,由於CHAR類型為定長,因此不容易產生碎片。
- 對於字段值存儲很小的信息,如性別等,優先選取CHAR類型,因為VARCHAR類型會占用額外的字節保存字符串長度信息。
總之一句話,當我們能夠選取CHAR類型的時候,或者說空間消耗相對並不是影響因素的重點時,盡量選取CHAR類型,因為在其他方面,CHAR類型都有著或多或少的優勢。而當空間消耗成為瞭很大的影響因素以後,我們則考慮使用VARCHAR類型。
到此這篇關於MySQL中varchar和char類型的區別的文章就介紹到這瞭,更多相關MySQL varchar和char類型內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- 一文帶你瞭解MySQL中的鎖機制
- 幾個MySQL高頻面試題的解答
- Java面試題沖刺第十三天–數據庫(3)
- mysql查詢優化之100萬條數據的一張表優化方案
- 詳解MySQL數據庫千萬級數據查詢和存儲