pytorch 如何使用float64訓練
pytorch默認使用單精度float32訓練模型,
原因在於:
使用float16訓練模型,模型效果會有損失,而使用double(float64)會有2倍的內存壓力,且不會帶來太多的精度提升。
本人,最近遇到需要使用double數據類型訓練模型的情況,具體實現需要把模型的權重參數數據類型和輸入數據類型全部設置為torch.float64即可。
可使用torch的一個函數,輕松地把模型參數轉化為float64
torch.set_default_dtype(torch.float64)
輸入類型可使用
tensor.type(torch.float64)
補充:float32和float64的本質區別
首先我們需要知道何為bits和bytes?
bits:名為位數bytes:為字節簡單的數就是MB和G的關系!
那麼8bits=1bytes,下面是各個單位的相互轉化!
那麼float32和float64有什麼區別呢?
數位的區別一個在內存中占分別32和64個bits,也就是4bytes或8bytes數位越高浮點數的精度越高它會影響深度學習計算效率?
float64占用的內存是float32的兩倍,是float16的4倍;
比如對於CIFAR10數據集,如果采用float64來表示,需要60000*32*32*3*8/1024**3=1.4G,光把數據集調入內存就需要1.4G;
如果采用float32,隻需要0.7G,如果采用float16,隻需要0.35G左右;
占用內存的多少,會對系統運行效率有嚴重影響;(因此數據集文件都是采用uint8來存在數據,保持文件最小)
以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。
推薦閱讀:
- Pytorch 實現變量類型轉換
- pytorch常用數據類型所占字節數對照表一覽
- Pytorch數據類型與轉換(torch.tensor,torch.FloatTensor)
- 解決numpy和torch數據類型轉化的問題
- PyTorch中Tensor和tensor的區別及說明