MySQL中存儲時間的最佳實踐指南
前言
平時開發中經常需要記錄時間,比如用於記錄某條記錄的創建時間以及修改時間。在數據庫中存儲時間的方式有很多種,比如 MySQL 本身就提供瞭日期類型,比如 DATETIME,TIMESTAMEP 等,我們也可以直接存儲時間戳為 INT 類型,也有人直接將時間存儲為字符串類型。
那麼到底哪種存儲時間的方式更好呢?
不要使用字符串存儲時間類型
這是初學者很容易犯的錯誤,容易直接將字段設置為 VARCHAR 類型,存儲”2021-01-01 00:00:00″這樣的字符串。當然這樣做的優點是比較簡單,上手快。
但是極力不推薦這樣做,因為這樣做有兩個比較大的問題:
- 字符串占用的空間大
- 這樣存儲的字段比較效率太低,隻能逐個字符比較,無法使用 MySQL 提供的日期API
MySQL 中的日期類型
MySQL 數據庫中常見的日期類型有 YEAR、DATE、TIME、DATETIME、TIMESTAMEP。因為一般都需要將日期精確到秒,其中比較合適的有DATETIME,TIMESTAMEP。
DATETIME
DATETIME 在數據庫中存儲的形式為:YYYY-MM-DD HH:MM:SS,固定占用 8 個字節。
從 MySQL 5.6 版本開始,DATETIME 類型支持毫秒,DATETIME(N) 中的 N 表示毫秒的精度。例如,DATETIME(6) 表示可以存儲 6 位的毫秒值。
TIMESTAMEP
TIMESTAMP 實際存儲的內容為‘1970-01-01 00:00:00’到現在的毫秒數。在 MySQL 中,由於類型 TIMESTAMP 占用 4 個字節,因此其存儲的時間上限隻能到‘2038-01-19 03:14:07’。
從 MySQL 5.6 版本開始,類型 TIMESTAMP 也能支持毫秒。與 DATETIME 不同的是,若帶有毫秒時,類型 TIMESTAMP 占用 7 個字節,而 DATETIME 無論是否存儲毫秒信息,都占用 8 個字節。
類型 TIMESTAMP 最大的優點是可以帶有時區屬性,因為它本質上是從毫秒轉化而來。如果你的業務需要對應不同的國傢時區,那麼類型 TIMESTAMP 是一種不錯的選擇。比如新聞類的業務,通常用戶想知道這篇新聞發佈時對應的自己國傢時間,那麼 TIMESTAMP 是一種選擇。Timestamp 類型字段的值會隨著服務器時區的變化而變化,自動換算成相應的時間,說簡單點就是在不同時區,查詢到同一個條記錄此字段的值會不一樣。
TIMESTAMP 的性能問題
TIMESTAMP 還存在潛在的性能問題。
雖然從毫秒數轉換到類型 TIMESTAMP 本身需要的 CPU 指令並不多,這並不會帶來直接的性能問題。但是如果使用默認的操作系統時區,則每次通過時區計算時間時,要調用操作系統底層系統函數 __tz_convert(),而這個函數需要額外的加鎖操作,以確保這時操作系統時區沒有修改。所以,當大規模並發訪問時,由於熱點資源競爭,會產生兩個問題:
- 性能不如 DATETIME:DATETIME 不存在時區轉化問題。
- 性能抖動:海量並發時,存在性能抖動問題。
為瞭優化 TIMESTAMP 的使用,建議使用顯式的時區,而不是操作系統時區。比如在配置文件中顯示地設置時區,而不要使用系統時區:
[mysqld] time_zone = "+08:00"
簡單總結一下這兩種數據類型的優缺點:
- DATETIME 沒有存儲的時間上限,而TIMESTAMP存儲的時間上限隻能到‘2038-01-19 03:14:07′
- DATETIME 不帶時區屬性,需要前端或者服務端處理,但是僅從數據庫保存數據和讀取數據而言,性能更好
- TIMESTAMP 帶有時區屬性,但是每次需要通過時區計算時間,並發訪問時會有性能問題
- 存儲 DATETIME 比 TIMESTAMEP 多占用一部分空間
數值型時間戳(INT)
很多時候,我們也會使用 int 或者 bigint 類型的數值也就是時間戳來表示時間。
這種存儲方式的具有 Timestamp 類型的所具有一些優點,並且使用它的進行日期排序以及對比等操作的效率會更高,跨系統也很方便,畢竟隻是存放的數值。缺點也很明顯,就是數據的可讀性太差瞭,你無法直觀的看到具體時間。
如果需要查看某個時間段內的數據
select * from t where created_at > UNIX_TIMESTAMP('2021-01-01 00:00:00');
DATETIME vs TIMESTAMP vs INT,怎麼選?
每種方式都有各自的優勢,下面再對這三種方式做一個簡單的對比:
日期類型 | 占用空間 | 日期格式 | 日期范圍 | 是否存在時區問題 |
DATETIME | 8 字節 | YYYY-MM-DD HH:MM:SS | 1000-01-01 00:00:00 ~9999-12-31 23:59:59 | 是 |
TIMESTAMP | 4 字節 | YYYY-MM-DD HH:MM:SS | 1970-01-01 00:00:00 ~2038-01-19 03:14:07 | 否 |
INT | 4 字節 | 全數字時間戳 | 1000-01-01 00:00:01 之後的時間 | 否 |
TIMESTAMP 與 INT 本質一樣,但是相比而言雖然 INT 對開發友好,但是對 DBA 以及數據分析人員不友好,可讀性差。所以《高性能 MySQL 》的作者推薦 TIMESTAMP 的原因就是它的數值表示時間更加直觀。下面是原文:
至於時區問題,可以由前端或者服務這裡做一次轉化,不一定非要在數據庫中解決。
總結
本文比較瞭幾種最常使用的存儲時間的方式,我最推薦的還是 DATETIME。理由如下:
- TIMESTAMP 比數值型時間戳可讀性更好
- DATETIME 的存儲上限為 9999-12-31 23:59:59,如果使用 TIMESTAMP,則 2038 年需要考慮解決方案
- DATETIME 由於不需要時區轉換,所以性能比 TIMESTAMP 好
- 如果需要將時間存儲到毫秒,TIMESTAMP 要 7 個字節,和 DATETIME 8 字節差不太多
到此這篇關於MySQL中存儲時間的文章就介紹到這瞭,更多相關MySQL存儲時間內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- PostgreSQL timestamp踩坑記錄與填坑指南
- UTC時間、GMT時間、本地時間、Unix時間戳的具體使用
- MySQL中建表與常見的類型設計陷阱詳解
- MySQL如何比較時間(datetime)大小
- MySQL日期及時間字段的查詢