關於MySQL實現指定編碼遇到的坑
寫在前面
環境:MySQL5.7+,MySQL數據庫字符編碼實現為utf8,表也為utf8
場景:微信授權獲取用戶信息(包括昵稱)並保存到數據庫,有的用戶成功瞭,少數用戶卻失敗瞭
那麼為什麼會失敗呢?
貼上報錯日志
Incorrect string value: ‘\xF0\x9F\x98\x98\xF0\x9F…’ for column ‘nickname’ at row 1
是因為失敗的用戶微信昵稱中帶有emoji符號導致的
剖析:
MySQL支持多種字符編碼集,如UTF-8、GB2312、GBK等
可以通過 SHOW CHARSET 命令查看。
通常我們會建議使用 UTF-8 作為默認的字符編碼方式。
從上圖我們可以看到,MySQL數據庫有兩套 UTF-8 編碼實現。
- utf8:utf8 編碼隻支持三個字節以內。在 utf8 編碼中,中文是占瞭3個字節,其他的英文、數字、符號都是占1個字節。但是emoji符號占4個字節,一些比較復雜的文字、繁體字也是占4個字節。
- utf8mb4:UTF-8編碼的完整實現。最多可支持4個字節,所以,可以用來存儲emoji符號。
查閱資料,官方解釋:
最後
Tips:如果有需要保存emoji符號的字段,記得一定要指定編碼為 utf8mb4 。
到此這篇關於一個關於MySQL指定編碼實現的小坑的文章就介紹到這瞭,更多相關MySQL指定編碼內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- MySQL中你可能忽略的COLLATION實例詳解
- MySQL修改字符集的實戰教程
- 分享mysql的current_timestamp小坑及解決
- 為什麼在MySQL中不建議使用UTF-8
- MySQL 數據庫的對庫的操作及其數據類型