python中的時區問題
問題背景
使用 Python 進行瞭許久的開發,一直沒有踩到時區的坑,最近新的業務中引入瞭比較多的服務,而且使用 grpc 進行數據通訊,不幸踩到瞭時區的坑,果然偷的懶最終還是會有報應的,於是梳理下對應的時區問題,同時發現系統中之前的數據庫 Mongo 中的時區問題,一起整理如下。
基礎概念
幾個時間概念
首先是幾個常見的時間概念
- GMT 時間:格林威治時間,基準時間
- UTC 時間:Coordinated Universal Time,全球協調時間,更精準的基準時間,與 GMT 基本等同
- CST 中國基準時間:為 UTC 時間 + 8 小時,即 UTC 時間的 0 點對應於中國基準時間的 8 點,即為一般稱為東八區的時間
ISO 8601
一種標準化的時間表示方法,表示格式為 :YYYY-MM-DDThh:mm:ss ± timezone,可以表示不同時區的時間,時區部分用Z 表示為 UTC 標準時區。兩個例子:
- 1997-07-16T08:20:30Z 表示的是 UTC 時間的 1997 年 7 月 16 號 8:20:30
- 1997-07-16T19:20:30+08:00 表示的是東八區時間的 1997 年 7 月 16 號 19:20:30
時間戳
1970年1月1日 00:00:00 UTC+00:00時區的時刻稱為epoch time,記為0,當前的時間戳即為從 epoch time 到現在的秒數,一般叫做 timestamp,因此一個時間戳一定對應於一個特定的 UTC 時間,同時也對應於其他時區的一個確定的時間。因此時間戳可以認為是一個相對安全的時間表示方法。
datetime 實踐
datetime 是 python 中最基礎的一個時間管理包,下面分別利用 datetime 去實踐下對應的時區概念
datetime 類型
datetime 分成兩種類型:
- naive,本地類型的時間,當 datetime 中沒有指定時區信息時就是這種類型,此類型的時區是根據運行環境確定對應的時區。因此這種類型的時間會因為運行環境的不同而得到不同時間戳
- aware,帶有時區類型的時間,這種類型的時間對象由於時間和時區都是確定的,因此對應於確定的時間戳
舉例如下:
from datetime import datetime, timezone now = datetime.now() now.tzinfo # None utc_now = datetime.now(timezone.utc) utc_now.tzinfo # UTC
可以看到上面的例子中,now 沒有指定時區,為 naive 類型的時間,其時區與運行環境相關。而 utc_now 指定瞭 UTC 時區,為 aware 類型的時間。
獲取當前時間
- datetime.now() 可用於獲取當前時間,支持設置對應的時區,如果不設置時區默認獲取的是本地的時間,根據是否指定時區可能穿件出 naive 類型的時間或者 aware 類型的時間,但是對應的時間戳都是符合預期的。
- datetime.utcnow() 謹慎使用 獲取是當前 UTC 對應的時間,但是生成的 datetime 對象是沒有指定時區的,因此使用的是本地時區,創建的是 naive 類型的時間。因此如果運行環境為東八區,得到的時間是 UTC 對應的時間,但是時區是東八區,最終得到的時間會比預期早 8 個小時,轉化得到時間戳也是不符合預期的。
舉例如下:
from datetime import datetime now = datetime.now() now.timestamp() # 1610035129.323702 unow = datetime.utcnow() unow.timestamp() # 1610006329.323797
最終在 2021-01-07 23:58:49 在東八區環境下運行上面的代碼,now.timestamp() 得到時間戳轉化為對應的時間為東八區的 2021-01-07 23:58:49,但是 unow.timestamp() 得到的時間戳對應的時間為東八區的 2021-01-07 15:58:49,對應於 UTC 時間 2021-01-07 07:58:49,和 UTC 的當前時間完全對不上。
時間戳操作
- datetime.timestamp() 生成當前時間對應的時間戳
- datetime.fromtimestamp() 根據時間戳生成運行環境時區對應的時間
- datetime.utcfromtimestamp() 謹慎使用 根據時間戳生成對應的 UTC 時間,由於生成的 datetime 是沒有指定時區的,因此獲取時間戳看起來得到的是 8 個小時之前時間的時間戳
對於上面的例子,我們使用前面得到的當前時間戳 1610035129 進行測試如下:
from datetime import datetime timestamp = 1610035129 d1 = datetime.fromtimestamp(timestamp) # 2021-01-07 23:58:49 d2 = datetime.utcfromtimestamp(timestamp) # 2021-01-07 15:58:49
最終得到 d1 是本地時區正確的時間,但是 d2 是 UTC 的是啊金,但是沒有指定的時區,因此看起來就是就是本地 8 個小時前的時間瞭
時區設置
默認構建的 datetime 是沒有時區信息的,可以通過 datetime.replace() 為時間設置上時區,但是這樣必須保證對應的時間與時區信息匹配,否則就會導致錯誤的時區的時間,一個簡單例子就是:
from datetime import datetime, timedelta, timezone tz_utc_8 = timezone(timedelta(hours=8)) # 創建時區UTC+8:00,即東八區對應的時區 now = datetime.now() # 默認構建的時間無時區 dt = now.replace(tzinfo=tz_utc_8) # 強制設置為UTC+8:00
設置上對應的時區後,對應的日期與時間是不變的,但是由於設置瞭全新的時區,如果與之前的時區不同,那麼對應的時間戳就會改變,使用此方法時要謹慎
時區轉換
可以將一個帶有時區信息的時間轉換為另一個時區的時間,通過 datetime.astimezone() 可以實現,一個簡單的例子是:
from datetime import datetime, timedelta, timezone utc_dt = datetime.utcnow().replace(tzinfo=timezone.utc) # 構建瞭 UTC 的當前時間 bj_dt = utc_dt.astimezone(timezone(timedelta(hours=8))) # 將時區轉化為東八區的時間
通過 astimezone() 進行轉換後,雖然時間變化瞭,但是對應的是同樣的基準時間,因此對應的時間戳是不變的,
Grpc 實踐
在 Grpc 的使用中,設計到時間戳對象 Timestamp 與時間的轉換,Timestamp 對象支持通過 python 中的時間戳構建,即當前時間的對應的時間戳秒數,也支持通過 datetime 構建。對應的接口如下:
- Timestamp.FromSeconds() 此方法是根據時間戳生成 Grpc 的時間戳對象,沒有特殊的地方
- Timestamp.FromDatetime() 謹慎使用 此方法根據 datetime 時間生成時間戳對象,隱含期望 datetime 是 UTC 時間,如果錯誤傳入東八區時間,會導致得到一個 8 個小時後的絕對時間
我們在實踐中有混用這兩個方法,最終發現調用 FromDatetime() 時獲得的時間戳是完全不符合預期的。一個簡單例子如下:
from datetime import datetime from google.protobuf.timestamp_pb2 import Timestamp now = datetime.now() now_timestamp = int(now.timestamp()) # 1610245593 t1 = Timestamp() t1.FromSeconds(now_timestamp) # 1610245593 t2 = Timestamp() t2.FromDatetime(now) # 1610274393
可以看到通過 FromDatetime() 得到訂單時間戳與預期是不相符的,隻有傳入的 datetime 是 UTC 的時間時兩者才是一致的
而轉換為 datetime 對象的接口為:
- Timestamp.ToSeconds() 此方法是根據時間戳對象得到對應的整數時間戳,沒有問題
- Timestamp.ToDatetime() 謹慎使用 此方法是根據 grpc 的時間戳對象生成 datetime,隱含輸出的 datetime 是 UTC 時間 ,而生成的 datetime 是沒有時區信息的,默認會按照本地時區進行處理,不做處理的情況下得到的就是 8 個小時前,對應的時間戳也是錯誤的
與上面的問題類似,通過 ToDatetime() 得到的時間是 UTC 時間,但是由於得到的 datetime 沒有指定時區,隻有在 UTC 的運行環境下得到的時間才是符合預期的。
Pymongo 實踐
之前的在使用 Pymongo 進行數據存儲時,直接使用的是 Pymongo 的默認設置,運行環境設置為東八區,在使用中直接將沒有指定時區的 datetime 存入數據庫中,之後再取出進行使用工作起來看起來一切正常。但是本次在梳理時區時查看數據庫中存儲的數據時,就發現瞭一個明顯的問題,數據庫中存儲的看起來日期與時間是對的,但是是 UTC 的時間,也就是說實際存儲的時間比預期晚 8 小時瞭,但是為什麼又能正常工作呢?確認後結果如下:
- Pymongo 在沒有指定時區的情況下, 默認不認為此時間為本地時間,事實上認為此時間為 UTC 時間,最終會利用此時間計算得到對應的時間戳並進行存儲,所以最終存儲的時間戳會晚 8 小時;
- 而在默認設置下,從 Pymongo 中返回的時間也沒有時區,而時間依舊是 UTC 時間,因此會導致計算得到時間又早瞭 8 小時,因此時間看起來是正常的。
如何才能保證存入正確時間,返回的也是符合預期的呢?
- 存入的時間可以設置上對應的時區,即避免存入 naive 類型的時間,應該存入 aware 類型的時間,避免輸入是認為是 UTC 的時間
- 在 Pymongo 中設置輸出帶時區的時間,避免默認輸出時間的問題,Pymongo 可以通過 tz_aware 指定輸出帶時區的時間,通過 tzinfo 指定輸出時間的時區,這個設置在構建 Pymongo 時傳入即可。對應如下:
from datetime import timedelta, timezone db = MongoClient(settings.MONGODB_DSN, tz_aware=True, tzifo=timezone(timedelta(hours=8))).get_default_database()
總結
根據上面的的實踐,分別對三個部分進行使用如下:
- datetime 的使用中,如果運行環境設置為非 UTC 時區,建議禁用 utc 相關的方法,比如 utcnow ,utcfromtimestamp() ,同時盡量避免使用 naive 使用,保證時間與運行環境解耦;
- grpc 的使用中盡量避免調用 FromDatetime() 和 ToDatetime() 這種包含隱含信息的方法,盡量通過時間戳與 grpc 的 TimeStamp 對象進行交互;
- Pymongo 中盡量傳入的帶有時區的時間,輸出也配置上時區輸出,避免隱含的問題;
一條總原則就是:與第三方的服務交互或存儲時,盡量隻使用時間戳這種絕對機制,這樣才能從根本上杜絕問題。
以上就是python中的時區問題的詳細內容,更多關於python 時區的資料請關註WalkonNet其它相關文章!
推薦閱讀:
- Python 時間操作datetime詳情(下)
- Python表示當前時間的方法合集
- Python 時間操作datetime詳情
- Pandas數據分析固定時間點和時間差
- Python中的datetime包與time包包和模塊詳情