pytorch中的model=model.to(device)使用說明
這代表將模型加載到指定設備上。
其中,device=torch.device(“cpu”)代表的使用cpu,而device=torch.device(“cuda”)則代表的使用GPU。
當我們指定瞭設備之後,就需要將模型加載到相應設備中,此時需要使用model=model.to(device),將模型加載到相應的設備中。
將由GPU保存的模型加載到CPU上。
將torch.load()函數中的map_location參數設置為torch.device(‘cpu’)
device = torch.device('cpu') model = TheModelClass(*args, **kwargs) model.load_state_dict(torch.load(PATH, map_location=device))
將由GPU保存的模型加載到GPU上。確保對輸入的tensors調用input = input.to(device)方法。
device = torch.device("cuda") model = TheModelClass(*args, **kwargs) model.load_state_dict(torch.load(PATH)) model.to(device)
將由CPU保存的模型加載到GPU上。
確保對輸入的tensors調用input = input.to(device)方法。map_location是將模型加載到GPU上,model.to(torch.device(‘cuda’))是將模型參數加載為CUDA的tensor。
最後保證使用.to(torch.device(‘cuda’))方法將需要使用的參數放入CUDA。
device = torch.device("cuda") model = TheModelClass(*args, **kwargs) model.load_state_dict(torch.load(PATH, map_location="cuda:0")) # Choose whatever GPU device number you want model.to(device)
補充:pytorch中model.to(device)和map_location=device的區別
一、簡介
在已訓練並保存在CPU上的GPU上加載模型時,加載模型時經常由於訓練和保存模型時設備不同出現讀取模型時出現錯誤,在對跨設備的模型讀取時候涉及到兩個參數的使用,分別是model.to(device)和map_location=devicel兩個參數,簡介一下兩者的不同。
將map_location函數中的參數設置 torch.load()為 cuda:device_id。這會將模型加載到給定的GPU設備。
調用model.to(torch.device(‘cuda’))將模型的參數張量轉換為CUDA張量,無論在cpu上訓練還是gpu上訓練,保存的模型參數都是參數張量不是cuda張量,因此,cpu設備上不需要使用torch.to(torch.device(“cpu”))。
二、實例
瞭解瞭兩者代表的意義,以下介紹兩者的使用。
1、保存在GPU上,在CPU上加載
保存:
torch.save(model.state_dict(), PATH)
加載:
device = torch.device('cpu') model = TheModelClass(*args, **kwargs) model.load_state_dict(torch.load(PATH, map_location=device))
解釋:
在使用GPU訓練的CPU上加載模型時,請傳遞 torch.device(‘cpu’)給map_location函數中的 torch.load()參數,使用map_location參數將張量下面的存儲器動態地重新映射到CPU設備 。
2、保存在GPU上,在GPU上加載
保存:
torch.save(model.state_dict(), PATH)
加載:
device = torch.device("cuda") model = TheModelClass(*args, **kwargs) model.load_state_dict(torch.load(PATH)) model.to(device) # Make sure to call input = input.to(device) on any input tensors that you feed to the model
解釋:
在GPU上訓練並保存在GPU上的模型時,隻需將初始化model模型轉換為CUDA優化模型即可model.to(torch.device(‘cuda’))。
此外,請務必.to(torch.device(‘cuda’))在所有模型輸入上使用該 功能來準備模型的數據。
請註意,調用my_tensor.to(device) 返回my_tensorGPU上的新副本。
它不會覆蓋 my_tensor。
因此,請記住手動覆蓋張量: my_tensor = my_tensor.to(torch.device(‘cuda’))
3、保存在CPU,在GPU上加載
保存:
torch.save(model.state_dict(), PATH)
加載:
device = torch.device("cuda") model = TheModelClass(*args, **kwargs) model.load_state_dict(torch.load(PATH, map_location="cuda:0")) # Choose whatever GPU device number you want model.to(device) # Make sure to call input = input.to(device) on any input tensors that you feed to the model
解釋:
在已訓練並保存在CPU上的GPU上加載模型時,請將map_location函數中的參數設置 torch.load()為 cuda:device_id。
這會將模型加載到給定的GPU設備。
接下來,請務必調用model.to(torch.device(‘cuda’))將模型的參數張量轉換為CUDA張量。
最後,確保.to(torch.device(‘cuda’))在所有模型輸入上使用該 函數來為CUDA優化模型準備數據。
請註意,調用 my_tensor.to(device)返回my_tensorGPU上的新副本。
它不會覆蓋my_tensor。
因此,請記住手動覆蓋張量:my_tensor = my_tensor.to(torch.device(‘cuda’))
以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。
推薦閱讀:
- pytorch模型的保存和加載、checkpoint操作
- pytorch中Tensor.to(device)和model.to(device)的區別及說明
- pytorch中.to(device) 和.cuda()的區別說明
- PyTorch 多GPU下模型的保存與加載(踩坑筆記)
- PyTorch中的CUDA的操作方法