python之np.argmax()及對axis=0或者1的理解

對於np.argmax()讓我迷惑瞭很久,尤其是其中的axis=1的比較結果。

一、np.argmax()的理解

1、最簡單的例子

假定現在有一個數組a = [3, 1, 2, 4, 6, 1]現在要算數組a中最大數的索引是多少。最直接的思路,先假定第0個數最大,然後拿這個和後面的數比,找到大的就更新索引。代碼如下

a = [3, 1, 2, 4, 6, 1]
maxindex = 0
i = 0
for tmp in a:
    if tmp > a[maxindex]:
        maxindex = i
    i += 1
print(maxindex)

這個問題可以幫助我們理解argmax.

2、函數的解釋

一維數組

import numpy as np
a = np.array([3, 1, 2, 4, 6, 1])
print(np.argmax(a))

argmax返回的是最大數的索引.argmax有一個參數axis,默認是0,表示第幾維的最大值。

二維數組

import numpy as np
a = np.array([[1, 5, 5, 2],
              [9, 6, 2, 8],
              [3, 7, 9, 1]])
print(np.argmax(a, axis=0))

為瞭描述方便,a就表示這個二維數組。np.argmax(a, axis=0)的含義是a[0][j],a[1][j],a[2]j中最大值的索引。從a[0][j]開始,最大值索引最初為(0,0,0,0),拿a[0][j]和a[1][j]作比較,9大於1,6大於5,8大於2,所以最大值索引由(0,0,0,0)更新為(1,1,0,1),再和a[2][j]作比較,7大於6,9大於5所以更新為(1,2,2,1)。

再分析下面的輸出.

import numpy as np
a = np.array([[1, 5, 5, 2],
              [9, 6, 2, 8],
              [3, 7, 9, 1]])
print(np.argmax(a, axis=1))

np.argmax(a, axis=1)的含義是a[i][0],a[i][1],a[i][2],a[i]3中最大值的索引。從a[i][0]開始,a[i][0]對應的索引為(0,0,0),先假定它就是最大值索引(思路和上節簡單例子完全一致)拿a[i][0]和a[i][1]作比較,5大於1,7大於3所以最大值索引由(0,0,0)更新為(1,0,1),再和a[i][2]作比較,9大於7,更新為(1,0,2),再和a[i][3]作比較,不用更新,最終值為(1,0,2)

三維數組

import numpy as np
a = np.array([
              [
                  [1, 5, 5, 2],
                  [9, -6, 2, 8],
                  [-3, 7, -9, 1]
              ],

              [
                  [-1, 5, -5, 2],
                  [9, 6, 2, 8],
                  [3, 7, 9, 1]
              ]
            ])
print(np.argmax(a, axis=0))

np.argmax(a, axis=0)的含義是a[0][j][k],a[1][j][k] (j=0,1,2,k=0,1,2,3)中最大值的索引。

從a[0][j][k]開始,a[0][j][k]對應的索引為((0,0,0,0),(0,0,0,0),(0,0,0,0)),拿a[0][j][k]和a[1][j][k]對應項作比較6大於-6,3大於-3,9大於-9,所以更新這幾個位置的索引,將((0,0,0,0),(0,0,0,0),(0,0,0,0))更新為((0,0,0,0),(0,1,0,0),(1,0,1,0)).。

再看axis=1的情況

import numpy as np
a = np.array([
              [
                  [1, 5, 5, 2],
                  [9, -6, 2, 8],
                  [-3, 7, -9, 1]
              ],

              [
                  [-1, 5, -5, 2],
                  [9, 6, 2, 8],
                  [3, 7, 9, 1]
              ]
            ])
print(np.argmax(a, axis=1))

np.argmax(a, axis=1)的含義是a[i][0][k],a[i][1][k] (i=0,1,k=0,1,2,3)中最大值的索引。從a[i][0][k]開始,a[i][0][k]對應的索引為((0,0,0,0),(0,0,0,0)),拿a[i][0][k]和a[i][1][k]對應項作比較,9大於1,8大於2,9大於-1,6大於5,2大於-5,8大於2,所以更新這幾個位置的索引,將((0,0,0,0),(0,0,0,0))更新為((1,0,0,1),(1,1,1,1)),現在最大值對應的數組為((9,5,5,8),(9,6,2,8))。

再拿((9,5,5,8),(9,6,2,8))和a[i][2][k]對應項從比較,7大於5,7大於6,9大於2.更新這幾個位置的索引。

將((1,0,0,1),(1,1,1,1))更新為((1,2,0,1),(1,2,2,1)).axis=2的情況也是類似的。

二、關於axis的理解

設置axis的主要原因是方便我們進行多個維度的計算。

通過例子來進行理解

比如:

a = np.array([[1, 2, 3], 
     [2, 3, 4], 
     [5, 4, 3], 
     [8, 7, 2]])
np.argmax(a, 0)   #輸出:array([3, 3, 1]
np.argmax(a, 1)   #輸出:array([2, 2, 0, 0]

axis = 0:

你就這麼想,0是最大的范圍,所有的數組都要進行比較,隻是比較的是這些數組相同位置上的數(我的理解是0 列比較輸出):

a[0] = array([1, 2, 3])
a[1] = array([2, 3, 4])
a[2] = array([5, 4, 3])
a[3] = array([8, 7, 2])
# output : [3, 3, 1]

axis = 1: (行比較輸出)

等於1的時候,比較范圍縮小瞭,隻會比較每個數組內的數的大小,結果也會根據有幾個數組,產生幾個結果。

a[0] = array([1, 2, 3]) #2
a[1] = array([2, 3, 4]) #2
a[2] = array([5, 4, 3]) #0
a[3] = array([8, 7, 2]) #0

特例

這是裡面都是數組長度一致的情況,如果不一致,axis最大值為最小的數組長度-1,超過則報錯。

當不一致的時候,axis=0的比較也就變成瞭每個數組的和的比較。

比較示例如下

當數組長度都一樣時

import numpy as np
a = np.array([
              [
                  [1, 5, 5, 2],
                  [9, -6, 2, 8],
                  [-3, 7, -9, 1]
              ],

              [
                  [-1, 5, -5, 2],
                  [9, 6, 2, 8],
                  [3, 7, 9,1]
              ]
            ])
print(np.argmax(a, axis=0))
print(np.argmax(a, axis=1))

輸出為

[[0 0 0 0]
[0 1 0 0]
[1 0 1 0]]
[[1 2 0 1]

[1 2 2 1]]

當數組長度都不一樣時,

  a = np.array([
                  [
                      [1, 5, 5, 2],
                      [9, -6, 2, 8],
                      [-3, 7, -9, 1]
                  ],
    
                  [
                      [-1, 5, -5, 2],
                      [9, 6, 2, 8],
                      [3, 7, 9]
                  ]
                ])
    print(np.argmax(a, axis=0))
 print(np.argmax(a, axis=1))

輸出為

[0 1 1]
[1 1]

numpy 的argmax的參數axis=0/1的概念

對numpy的argmax一直記不得默認是行還是列搜索,總是用糊塗,每次都要查資料,今天突然醒悟。

先列後行,為什麼呢?

看下面的一個列表,就知道瞭。

>>b=np.array([1, 2, 3, 4, 3, 2, 1])
>>np.argmax(b)
>>3
>>np.argmax(b, axis=0)
>>3

默認axis=0,列表隻有一個維度,自然就是一行數據的最大數的索引。

那麼對於二維向量,隻需要記住axis是坐標軸的方向,不是行列的概念。

在Numpy庫中:

軸用來為超過一維的數組定義的屬性,二維數據擁有兩個軸:

第0軸沿著行的垂直往下,第1軸沿著列的方向水平延伸。簡單的來記就是axis=0代表往跨行(down),而axis=1代表跨列(across)。

所以axis=0代表的就是列查找,axis=1代表著行查找。

>>a = np.array([[1, 5, 5, 2],
               [9, 6, 2, 8],
               [3, 7, 9, 1]])
>>np.argmax(a,axis=0)
>>array([1, 2, 2, 1], dtype=int64)
>>np.argmax(a,axis=1)
>>array([1, 0, 2], dtype=int64)

結論:

argmax返回的是最大數的索引。argmax有一個參數axis,默認是0,表示每一列的最大值的索引,axis=1表示每一行的最大值的索引。

以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。

推薦閱讀: