python的廣播機制詳解

為什麼會有廣播機制

python語言在設計的時候,就就考慮到用於兩個運算的矩陣向量維度不匹配的問題。例如,我們有矩陣A,讓矩陣每個元素都加1,直接使用
A+1,就可以完成目的。這其中就用到瞭python的廣播機制,所以在很多python的第三方庫中,都支持廣播機制,例如Numpypytorch

在矩陣或向量相關運算中的廣播機制

1、一般的運算

假設我們有一個矩陣A,一個矩陣B,它們的 + - * 運算,就是一一對應元素的操作

在這裡插入圖片描述

2、一個矩陣一個向量的情況

矩陣 A ∈ R 3 × 3 A\in R^{3\times 3} A∈R3×3 與向量 b ∈ R 1 × 3 b\in R^{1\times 3} b∈R1×3 的運算,向量 b ∈ R 1 × 3 b\in R^{1\times 3} b∈R1×3會根據矩陣A的維度,擴展自身的維度, [ 1 × 3 ] → [ 3 × 3 ] [1\times 3]\to[3 \times 3] [1×3]→[3×3], 第一個維度大小是1,所以就會向列的方向擴展,即復制多個行。如圖所示。

在這裡插入圖片描述

同樣,如果向量 b ∈ R 3 × 1 b\in R^{3\times 1} b∈R3×1 ,就會向行擴展,即復制多個列。

在這裡插入圖片描述

3、兩個向量

如果兩個向量的size相同,那就沒話說瞭,運算之後也還是向量,隻有在兩個向量size不相同的時候才有廣播。
向量 a ∈ R 3 × 1 a\in R^{3\times 1} a∈R3×1 向量 b ∈ R 1 × 3 b\in R^{1\times 3} b∈R1×3 或者向量 b ∈ R 3 b\in R^{3} b∈R3,兩者的size就不一樣瞭。向量a會向維度大小為1的方向擴張,b也是這樣。
值得註意的是,我們使用numpy的時候,

# 構造一個向量 
import numpy as np
a = np.arange(10)  # (10,None)	
a是隻有一個維度的。不管你是旋轉還是轉置,它都不會變化。要想實現廣播,就要給a增加一個維度
import numpy as np
a = np.arange(10)
a = np.expand_dims(a,1)  # (10,1)
在這裡插入圖片描述

4、矩陣乘法的廣播機制

在這裡插入圖片描述

總結

到此這篇關於python的廣播機制詳解的文章就介紹到這瞭,更多相關python廣播機制內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: