基於mysql 默認排序規則的坑
mysql默認varchar類型是對大小寫不敏感(不區分),如果想要mysql區分大小寫需要設置排序規則:
utf8_bin將字符串中的每一個字符用二進制數據存儲,區分大小寫。
utf8_genera_ci不區分大小寫,ci為case insensitive的縮寫,即大小寫不敏感。
utf8_general_cs區分大小寫,cs為case sensitive的縮寫,即大小寫敏感。
用utf8_genera_ci沒有區分大小寫,導致這個字段的內容區分大小寫時出問題,比如作為區分大小寫的code或者驗證碼時就出問題瞭。
utf8_general_cs這個選項一般沒有,所以隻能用utf8_bin區分大小寫。
1)設置排序規則是可逆的,如果之前設置的排序規則不符合,更換排序規則後,可能出現亂碼,當再次恢復原來的排序規則後,亂碼即消失。
2)可以將varchar 類型改為 varbinary
3)如果已經使用瞭默認的排序規則,即utf8_genera_ci,而又想查詢結果大小寫區分,可以在查詢時進行限定:
select binary column from table;
或者
select column2 from table where binary cloumn;
補充:mysql中的字符集和排序規則
字符集:
字符是各種文字和符號的總稱,字符集就是字符的集合。常見字符集名稱:ASCII字符集、GB2312字符集、BIG5字符集、GB18030字符集、Unicode字符集等。
計算機要識別各種字符集文字,就需要字符編碼。所以有些字符集一個字符是2個字節,有些字符集一個字符是3個字節。
排序規則:舉例
utf_bin和utf_general_ci這兩者到底有什麼區別。
ci是case insensitive, 即”大小寫不敏感”,a 和 A 會在字符判斷中會被當做一樣的;
bin是二進制, a 和A 會別區別對待.
utf8_general_ci不區分大小寫,這個你在註冊用戶名和郵箱的時候就要使用。
utf8_general_cs區分大小寫,如果用戶名和郵箱用這個 就會照成不良後果
utf8_bin:字符串每個字符串用二進制數據編譯存儲。區分大小寫,而且可以存二進制的內容
所以排序規則主要說明瞭是否大小寫敏感和存儲方式。
以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方,望不吝賜教。