MySQL中varchar和char類型的區別

前述

VARCHAR和CHAR是兩種最主要的字符串類型。不幸的是,很難精確地解釋這些值是怎麼存儲在磁盤和內存中的,因為這跟存儲引擎的具體實現有關。下面的描述假設使用的存儲引擎是InnoDB和/或者MyISAM。如果使用的不是這兩種存儲引擎,請參考所使用的存儲引擎的文檔。

先看看VARCHAR和CHAR值通常在磁盤上怎麼存儲。請註意,存儲引擎存儲CHAR或者VARCHAR值的方式在內存中和在磁盤上可能不一樣,所以MySQL服務器從存儲引擎讀出的值可能需要轉換為另一種存儲格式。

VARCHAR類型

VARCHAR類型用於存儲可變長字符串,是最常見的字符串數據類型。它比定長類型更節省空間,因為它僅使用必要的空間(例如,越短的字符串使用越少的空間)。有一種情況例外,如果MySQL表使用ROW_FORMAT=FIXED創建的話,每一行都會使用定長存儲,這會很浪費空間。

VARCHAR需要使用1或2個額外字節記錄字符串的長度:如果列的最大長度小於或等於255字節,則隻使用1個字節表示,否則使用2個字節。假設采用latin1字符集,一個VARCHAR(10)的列需要11個字節的存儲空間。VARCHAR(1000)的列則需要1002個字節,因為需要2個字節存儲長度信息。

VARCHAR節省瞭存儲空間,所以對性能也有幫助。但是,由於行是變長的,在UPDATE時可能使行變得比原來更長,這就導致需要做額外的工作。如果一個行占用的空間增長,並且在頁內沒有更多的空間可以存儲,在這種情況下,不同的存儲引擎的處理方式是不一樣的。例如,MyISAM會將行拆成不同的片段存儲,InnoDB則需要分裂頁來使行可以放進頁內。其他一些存儲引擎也許從不在原數據位置更新數據。

VARCHAR適用情況

下面這些情況下適用VARCHAR是合適的:

  • 字符串列的最大長度比平均長度大很多
  • 列的更新很少,所以碎片不是問題
  • 使用瞭像UTF-8這樣復雜的字符集,每個字符都使用不同的字節數進行存儲

CHAR類型

CHAR類型是定長的:MySQL總是根據定義的字符串長度分配足夠的空間。當存儲CHAR值時,MySQL會刪除所有的末尾空格。CHAR值會根據需要采用空格進行填充以方便比較。

CHAR適合存儲很短的字符串,或者所有值都接近同一個長度。例如,CHAR非常適合存儲密碼的MD5值,因為這是一個定長的值。對於經常變更的數據,CHAR也比VARCHAR更好,因為定長的CHAR類型不容易產生碎片。對於非常短的列,CHAR比VARCHAR在存儲空間上也更有效率。例如用CHAR(1)來存儲隻有Y和N的值,如果采用單字節字符集隻需要一個字節,但是VARCHAR(1)卻需要兩個字節,因為還有一個記錄長度的額外字節。

測試

下面通過例子來具體說明CHAR與VARCHAR行為上的不同,首先,我們創建一張隻有一個CHAR(10)字段的表,並且往裡面插入一些值:

CREATE TABLE char_test
(
    char_col CHAR(10)
);
 
INSERT INTO char_test 
VALUES
    ('string1').
    ('  string2').
    ('string3  ');

當我們檢索這些值的時候,會發現string3末尾的空格被截斷瞭。

SELECT CONCAT("'", char_col, "'")
FROM char_test;

 

執行結果

如果用VARCHAR(10)字段存儲相同的值,可以得到如下結果:

CREATE TABLE varchar_test
(
    varchar_col VARCHAR(10)
);
 
INSERT INTO varchar_test 
VALUES
    ('string1').
    ('  string2').
    ('string3  ');
 
SELECT CONCAT("'", varchar_col, "'")
FROM varchar_test;

 

執行結果

VARCHAR(5)與VARCHAR(200)的區別

我們倘若用VARCHAR(5)和VARCHAR(200)來存儲’hello’,我們知道這兩者的空間開銷是一樣的。那麼我們可以讓VARCHAR的長度始終保持很大嗎?使用更短的列有什麼優勢嗎?

事實證明有很大的優勢。更長的列會消耗更多的內存,因為MySQL通常會分配固定大小的內存塊來保存內部值。尤其是使用內存臨時表進行排序或操作時會特別糟糕。在利用磁盤臨時表進行排序時也同樣糟糕。

所以最好的策略是隻分配真正需要的空間。

總結

當我們為字符串類型的字段選取類型的時候,判斷該選取VARCHAR還是CHAR,我們可以從以下幾個方面來考慮:

  • 該字段數據集的平均長度與最大長度是否相差很小,若相差很小優先考慮CHAR類型,反之,考慮VARCHAR類型。
  • 若字段存儲的是MD5後的哈希值,或一些定長的值,優先選取CHAR類型。
  • 若字段經常需要更新,則優先考慮CHAR類型,由於CHAR類型為定長,因此不容易產生碎片。
  • 對於字段值存儲很小的信息,如性別等,優先選取CHAR類型,因為VARCHAR類型會占用額外的字節保存字符串長度信息。

總之一句話,當我們能夠選取CHAR類型的時候,或者說空間消耗相對並不是影響因素的重點時,盡量選取CHAR類型,因為在其他方面,CHAR類型都有著或多或少的優勢。而當空間消耗成為瞭很大的影響因素以後,我們則考慮使用VARCHAR類型。

到此這篇關於MySQL中varchar和char類型的區別的文章就介紹到這瞭,更多相關MySQL varchar和char類型內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: