基於mysql 默認排序規則的坑

mysql默認varchar類型是對大小寫不敏感(不區分),如果想要mysql區分大小寫需要設置排序規則:

utf8_bin將字符串中的每一個字符用二進制數據存儲,區分大小寫。

utf8_genera_ci不區分大小寫,ci為case insensitive的縮寫,即大小寫不敏感。

utf8_general_cs區分大小寫,cs為case sensitive的縮寫,即大小寫敏感。

用utf8_genera_ci沒有區分大小寫,導致這個字段的內容區分大小寫時出問題,比如作為區分大小寫的code或者驗證碼時就出問題瞭。

utf8_general_cs這個選項一般沒有,所以隻能用utf8_bin區分大小寫。

1)設置排序規則是可逆的,如果之前設置的排序規則不符合,更換排序規則後,可能出現亂碼,當再次恢復原來的排序規則後,亂碼即消失。

2)可以將varchar 類型改為 varbinary

3)如果已經使用瞭默認的排序規則,即utf8_genera_ci,而又想查詢結果大小寫區分,可以在查詢時進行限定:

select binary column from table;  

或者

select column2 from table where binary cloumn;

補充:mysql中的字符集和排序規則

字符集:

字符是各種文字和符號的總稱,字符集就是字符的集合。常見字符集名稱:ASCII字符集、GB2312字符集、BIG5字符集、GB18030字符集、Unicode字符集等。

計算機要識別各種字符集文字,就需要字符編碼。所以有些字符集一個字符是2個字節,有些字符集一個字符是3個字節。

排序規則:舉例

utf_bin和utf_general_ci這兩者到底有什麼區別。

ci是case insensitive, 即”大小寫不敏感”,a 和 A 會在字符判斷中會被當做一樣的;

bin是二進制, a 和A 會別區別對待.

utf8_general_ci不區分大小寫,這個你在註冊用戶名和郵箱的時候就要使用。

utf8_general_cs區分大小寫,如果用戶名和郵箱用這個 就會照成不良後果

utf8_bin:字符串每個字符串用二進制數據編譯存儲。區分大小寫,而且可以存二進制的內容

所以排序規則主要說明瞭是否大小寫敏感和存儲方式。

以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方,望不吝賜教。

推薦閱讀: