聊聊Pytorch torch.cat與torch.stack的區別
torch.cat()函數可以將多個張量拼接成一個張量。torch.cat()有兩個參數,第一個是要拼接的張量的列表或是元組;第二個參數是拼接的維度。
torch.cat()的示例如下圖1所示
圖1 torch.cat()
torch.stack()函數同樣有張量列表和維度兩個參數。stack與cat的區別在於,torch.stack()函數要求輸入張量的大小完全相同,得到的張量的維度會比輸入的張量的大小多1,並且多出的那個維度就是拼接的維度,那個維度的大小就是輸入張量的個數。
torch.stack()的示例如下圖2所示:
圖2 torch.stack()
補充:torch.stack()的官方解釋,詳解以及例子
可以直接看最下面的【3.例子】,再回頭看前面的解釋
在pytorch中,常見的拼接函數主要是兩個,分別是:
1、stack()
2、cat()
實際使用中,這兩個函數互相輔助:關於cat()參考torch.cat(),但是本文主要說stack()。
函數的意義:使用stack可以保留兩個信息:[1. 序列] 和 [2. 張量矩陣] 信息,屬於【擴張再拼接】的函數。
形象的理解:假如數據都是二維矩陣(平面),它可以把這些一個個平面(矩陣)按第三維(例如:時間序列)壓成一個三維的立方體,而立方體的長度就是時間序列長度。
該函數常出現在自然語言處理(NLP)和圖像卷積神經網絡(CV)中。
1. stack()
官方解釋:沿著一個新維度對輸入張量序列進行連接。 序列中所有的張量都應該為相同形狀。
淺顯說法:把多個2維的張量湊成一個3維的張量;多個3維的湊成一個4維的張量…以此類推,也就是在增加新的維度進行堆疊。
outputs = torch.stack(inputs, dim=?) → Tensor
參數
inputs : 待連接的張量序列。
註:python的序列數據隻有list和tuple。
dim : 新的維度, 必須在0到len(outputs)之間。
註:len(outputs)是生成數據的維度大小,也就是outputs的維度值。
2. 重點
函數中的輸入inputs隻允許是序列;且序列內部的張量元素,必須shape相等
—-舉例:[tensor_1, tensor_2,..]或者(tensor_1, tensor_2,..),且必須tensor_1.shape == tensor_2.shape
dim是選擇生成的維度,必須滿足0<=dim<len(outputs);len(outputs)是輸出後的tensor的維度大小
不懂的看例子,再回過頭看就懂瞭。
3. 例子
1.準備2個tensor數據,每個的shape都是[3,3]
# 假設是時間步T1的輸出 T1 = torch.tensor([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) # 假設是時間步T2的輸出 T2 = torch.tensor([[10, 20, 30], [40, 50, 60], [70, 80, 90]])
2.測試stack函數
print(torch.stack((T1,T2),dim=0).shape) print(torch.stack((T1,T2),dim=1).shape) print(torch.stack((T1,T2),dim=2).shape) print(torch.stack((T1,T2),dim=3).shape) # outputs: torch.Size([2, 3, 3]) torch.Size([3, 2, 3]) torch.Size([3, 3, 2]) '選擇的dim>len(outputs),所以報錯' IndexError: Dimension out of range (expected to be in range of [-3, 2], but got 3)
可以復制代碼運行試試:拼接後的tensor形狀,會根據不同的dim發生變化。
dim | shape |
---|---|
0 | [2, 3, 3] |
1 | [3, 2, 3] |
2 | [3, 3, 2] |
3 | 溢出報錯 |
4. 總結
1、函數作用:
函數stack()對序列數據內部的張量進行擴維拼接,指定維度由程序員選擇、大小是生成後數據的維度區間。
2、存在意義:
在自然語言處理和卷及神經網絡中, 通常為瞭保留–[序列(先後)信息] 和 [張量的矩陣信息] 才會使用stack。
函數存在意義?》》》
手寫過RNN的同學,知道在循環神經網絡中輸出數據是:一個list,該列表插入瞭seq_len個形狀是[batch_size, output_size]的tensor,不利於計算,需要使用stack進行拼接,保留–[1.seq_len這個時間步]和–[2.張量屬性[batch_size, output_size]]。
以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。
推薦閱讀:
- Pytorch中torch.stack()函數的深入解析
- pytorch下的unsqueeze和squeeze的用法說明
- 淺談pytorch中stack和cat的及to_tensor的坑
- pytorch中的廣播語義
- Broadcast廣播機制在Pytorch Tensor Numpy中的使用詳解