PyTorch中Tensor和tensor的區別及說明

Tensor和tensor的區別

本文列舉的框架源碼基於PyTorch1.0,交互語句在0.4.1上測試通過

import torch

在PyTorch中,Tensor和tensor都能用於生成新的張量:

>>> a=torch.Tensor([1,2])
>>> a
tensor([1., 2.])
>>> a=torch.tensor([1,2])
>>> a
tensor([1, 2])

但是這二者的用法有什麼區別呢?我沒有找到合適的中文資料,英文的資料如 https://discuss.pytorch.org/t/what-is-the-difference-between-tensor-and-tensor-is-tensor-going-to-be-deprecated-in-the-future/17134/8 也已經過時瞭,那就自己動手豐衣足食吧。

首先,我們需要明確一下,torch.Tensor()是python類,更明確地說,是默認張量類型torch.FloatTensor()的別名,torch.Tensor([1,2])會調用Tensor類的構造函數__init__,生成單精度浮點類型的張量。

>>> a=torch.Tensor([1,2])
>>> a.type()
'torch.FloatTensor'

而torch.tensor()僅僅是python函數:https://pytorch.org/docs/stable/torch.html#torch.tensor ,函數原型是:

torch.tensor(data, dtype=None, device=None, requires_grad=False)

其中data可以是:list, tuple, NumPy ndarray, scalar和其他類型。

torch.tensor會從data中的數據部分做拷貝(而不是直接引用),根據原始數據類型生成相應的torch.LongTensor、torch.FloatTensor和torch.DoubleTensor。

>>> a=torch.tensor([1,2])
>>> a.type()
'torch.LongTensor'
>>> a=torch.tensor([1.,2.])
>>> a.type()
'torch.FloatTensor'
>>> a=np.zeros(2,dtype=np.float64)
>>> a=torch.tensor(a)
>>> a.type()
'torch.DoubleTensor'

這裡再說一下torch.empty(),根據 https://pytorch.org/docs/stable/torch.html?highlight=empty#torch.empty ,我們可以生成指定類型、指定設備以及其他參數的張量,由於torch.Tensor()隻能指定數據類型為torch.float,所以torch.Tensor()可以看做torch.empty()的一個特殊情況。

最後放一個小彩蛋

>>> a=torch.tensor(1)
>>> a
tensor(1)
>>> a.type()
'torch.LongTensor'
>>> a=torch.Tensor(1)
>>> a
tensor([0.])
>>> a.type()
'torch.FloatTensor'

pytorch Tensor變形函數

view(), resize(), reshape() 在不改變原tensor數據的情況下修改tensor的形狀,前後要求元素總數一致,且前後tensor共享內存

如果想要直接改變Tensor的尺寸,可以使用resize_()的原地操作函數。

在resize_()函數中,如果超過瞭原Tensor的大小則重新分配內存,多出部分置0,如果小於原Tensor大小則剩餘的部分仍然會隱藏保留。

transpose()函數可以將指定的兩個維度的元素進行轉置,而permute()函數則可以按照給定的維度進行維度變換。

在實際的應用中,經常需要增加或減少Tensor的維度,尤其是維度為1的情況,這時候可以使用squeeze()與unsqueeze()函數,前者用於去除size為1的維度,而後者則是將指定的維度的size變為1。

有時需要采用復制元素的形式來擴展Tensor的維度,這時expand就派上用場瞭。

expand()函數將size為1的維度復制擴展為指定大小,也可以使用expand_as()函數指定為示例Tensor的維度。

註意:在進行Tensor操作時,有些操作如transpose()、permute()等可能會把Tensor在內存中變得不連續,而有些操作如view()等是需要Tensor內存連續的,這種情況下需要使用contiguous()操作先將內存變為連續的。在PyTorch v0.4版本中增加瞭reshape()操作,可以看做是Tensor.contiguous().view()

Tensor的排序與取極值

排序函數sort(),選擇沿著指定維度進行排序,返回排序後的Tensor及對應的索引位置。max()與min()函數則是沿著指定維度選擇最大與最小元素,返回該元素及對應的索引位置。

Tensor與NumPy轉換

Tensor與NumPy可以高效地進行轉換,並且轉換前後的變量共享內存。在進行PyTorch不支持的操作時,甚至可以曲線救國,將Tensor轉換為NumPy類型,操作後再轉為Tensor。

以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。

推薦閱讀: