Python數組變形的幾種實現方法

1.reshape

reshape是重塑,常用的三種寫法如下:

numpy.arange(n).reshape(a, b)    
# 依次生成 n個自然數,並且以 a行 b列的數組形式顯示
numpy.arange(a,b,c)    
# 從數字 a起, 步長為 c, 到 b結束,生成 array
numpy.arange(a,b,c).reshape(m,n) 
# 將array的維度變為 m 行 n 列。

例一:

import numpy as np
arr=np.arange(1,25.0).reshape(4,6)

關於order:
order可以是數組排序的方向不同
(1)order='F'列為主序
(2)order='C'行為主序

一種是以order='F'的方式讓數組豎著排序:

arr=np.arange(1,25.0).reshape((6,-1),order='F')

一種是以order='C'的方式讓數組橫著排序:

arr=np.arange(1,25.0).reshape((6,-1),order='C')

reshapeflattern:
前者完成的是從低維到高維的轉換,後者則相反,還可以使用reval函數

2.flatten

numpy.ndarray.flattern()是用來返回一維數組的函數。
也可以像reshape一樣使用order

arr2=arr.flatten(order='F')

一般默認是使用order='C',有特定需求則使用order='F'

flatten()返回的是拷貝,意味著改變元素的值不會影響原始數組。

3.ravel

ravel()方法將數組維度拉成一維數組

ravelflatten的區別:

  • ravel在進行扁平化處理的時候沒有復制原來的數組,隻在列主序打平時復制原來的數組
  • flatten在所有情況下打平時都復制瞭原來的數組
  • ravel()返回的是視圖,意味著改變元素的值會影響原始數組;
  • flatten()返回的是拷貝,意味著改變元素的值不會影響原始數組。
  • 相同點:這兩個函數的功能都是將多維數組轉換成一維

ravel()返回的是視圖,意味著改變元素的值會影響原始數組;

4.stack

numpy.stack(arrays, axis=0):沿著新軸連接數組的序列。

一系列的stack函數有:stack(),hstack(),vstack()

(1)concatenate

還有屬性例如:concatenate
numpy.concatenate((a1,a2,…), axis=0)函數,能夠一次完成多個數組的拼接。其中a1,a2,…是數組類型的參數

arr1=['穿過寒冬擁抱你','反貪風暴5:最終章','李茂扮太子','誤殺2']
arr2=['以年為單位的戀愛','愛情神話','黑客帝國:矩陣重啟','雄獅少年']
np.concatenate([arr1,arr2])

註意,兩個list合並的時候需要用到 [ ] ,否則出錯。

axis參數指定新軸在結果尺寸中的索引。例如,如果axis=0,它將是第一個維度,如果axis=-1,它將是最後一個維度。

默認情況下axis=0

arr1=np.arange(1,25.0).reshape(4,6)
arr2=np.arange(26,50.0).reshape(4,6)
np.concatenate([arr1,arr2],axis=1)
np.concatenate([arr1,arr2],axis=0)

如上圖所示,axis=1是將不同的列串聯起來,axis=0則類似於append,是合並。

arr1arr2進行對調:

(2)vstack

函數原型:vstack(tup) ,參數tup可以是元組,列表,或者numpy數組,返回結果為numpy的數組。它是垂直(按照行順序)的把數組給堆疊起來。

vstack 和concatenate( ),axis=0等價

(3)dstack

dstack是deep stack,即在深度方向進行合並。

dstack可以將一維數組變成三維數組。

import numpy as np

# vstack
np.vstack([arr1,arr2])
#結果:
array([[ 1.,  2.,  3.,  4.,  5.,  6.],
       [ 7.,  8.,  9., 10., 11., 12.],
       [13., 14., 15., 16., 17., 18.],
       [19., 20., 21., 22., 23., 24.],
       [26., 27., 28., 29., 30., 31.],
       [32., 33., 34., 35., 36., 37.],
       [38., 39., 40., 41., 42., 43.],
       [44., 45., 46., 47., 48., 49.]])
       
# dstack
np.dstack([arr1,arr2])
# 結果:
array([[[ 1., 26.],
        [ 2., 27.],
        [ 3., 28.],
        [ 4., 29.],
        [ 5., 30.],
        [ 6., 31.]],

       [[ 7., 32.],
        [ 8., 33.],
        [ 9., 34.],
        [10., 35.],
        [11., 36.],
        [12., 37.]],

       [[13., 38.],
        [14., 39.],
        [15., 40.],
        [16., 41.],
        [17., 42.],
        [18., 43.]],

       [[19., 44.],
        [20., 45.],
        [21., 46.],
        [22., 47.],
        [23., 48.],
        [24., 49.]]])

(4)hstack

函數原型:hstack(tup) ,參數tup可以是元組,列表,或者numpy數組,返回結果為numpy的數組,水平(按列順序)把數組給堆疊起來,vstack()函數正好和它相反。

(5)r,c模式

np.r_[arr1,arr2] ,實際上是vstack 與 axis=0 做瞭一個合並(concatenate)。
np.c_[arr1,arr2] , hstack 與 axis=1 做瞭一個合並(concatenate)。

print(np.r_[-2:2:1,[0]*3,5,6])

上面那段代碼由三部分組成,-2:2:1表示從-2~2的數字,間隔為1,並且2沒有,然後是3個0,接下來是5和6

print((np.r_['r',-2:2:1,[0]*3,5,6])) #二維數組,以行的方式呈現
print((np.r_['c',-2:2:1,[0]*3,5,6])) #二維數組,以列的方式呈現

默認是為r,表示沿著行的方向創建,c則表示以列的方式創建。

註:shape表示矩陣的維度大小。

也可以用'a,b,c'來進行表示,a代表軸,沿著軸a來進行合並,代表合並後數組維度至少是bc是代表在第c維度上做維度提升

print(np.r_['0,2,0',[1,2,3],[4,5,6]],'\n')
print(np.r_['0,2,1',[1,2,3],[4,5,6]],'\n')
print(np.r_['1,2,0',[1,2,3],[4,5,6]],'\n')
print(np.r_['1,2,1',[1,2,3],[4,5,6]])

 b:合並後數組的維度
 a=0,沿著軸0合並。(3,)-->(1,3)
 a=1,沿著軸1合並。(3,1)-->(3,2)
 c=0,在軸0上上升一維,(3,)-->(3,1)
 c=1,在軸1上上升一維,(3,)-->(1,3)

5.split

(1)split

split 具體有 split() , hsplit() , vsplit()

arr1=np.arange(1,13.0).reshape(2,6)
arr2=np.arange(14,26.0).reshape(2,6)
arr=np.concatenate([arr1,arr2])
arr3=np.split(arr,2)   # 默認情況下是 axis=0

由上圖可知,split分割成為二維數組

arr4=np.split(arr,3,axis=1)
print(arr4[0].shape)
arr4

arr5=np.split(arr,4,axis=0)
arr6=np.split(arr,[1,2,3],axis=0)

上述代碼塊的兩行表示是相同的,第二行相當於使用數組的切片方式進行處理。

(2)vsplit和hsplit

  • vsplit 垂直(按行)將陣列拆分為多個子陣列。
  • hsplit 水平(按列)將陣列拆分為多個子陣列。

這部分希望大傢看下圖體會~

arrv=np.vsplit(arr,[1,2,3,4])
arrh=np.hsplit(arr,[1,2,3,4,5])

6.repeat

repeat(): 復制數組中的每個指定元素。
一維數組:用整數型和列表型參考來控制元素被復制的個數
多維數組:用整數型和列表型來控制元素被復制的個數

import numpy as np
arr=np.arange(3)
print(arr.shape)

(1)標量參數

print(arr.repeat(3))   # 每個元素復制三次

(2)列表參數

print(arr)
print(arr.repeat([1,2,3]))  
# 第一個沒有復制,第二個復制瞭兩個,,依次類推

當列表的元素少於數組元素,或者多餘數組元素,都會報錯,就如下圖所示。

上面是一維數組的,接下來再看看二維數組中利用標量參數和軸參數:

print(arr.repeat(2)) # 此時二維數組變成一維的瞭
print(arr.repeat(2,1)) 
print(arr.repeat(2,axis=0)) # 在行上面進行復制

再來看看二維數組中的列表參數和軸參數:

7.tile

關於repeat和title,二者的本質都是復制,而repeat是在元素層面進行賦值,title是在數組層面進行賦值。

(1)標量參數

print(np.tile(arr,2))
print(np.repeat(arr,2))

(2)元組參數

元組參數即括號裡面用相關參數進行分割。

print(np.tile(arr,(2,3)))

print(np.tile(arr,(2,3,4)))

在軸0上面復制兩遍,復制3遍,復制4遍。

8.sort

排序分為:

  • 直接排序
  • 間接排序

直接排序sort() :在原來的數組上進行排序操作,而不重新創建一個數組

(1)一維數組排序方法

arr=np.array([9,1,5,7,2,3,8,6]) # 先創建一個無序數組
arr
print('排序之前的數組:',arr)
arr.sort()
print('排序之後的數組:',arr)

arr[::-1] # 使用倒序的方法顯示

(2)多維數組排序方法

先使用random隨機生成一個二維數組:(每次)

import numpy as np
np.random.seed(1000)
arr=np.random.randint(40,size=(3,4))
arr

以上的方法在每次重新刷新瞭之後會變化數組的數字。

如果對二維數組直接使用arr.sort(),則會直接對行進行排序。

對列進行排序:

print('排序之前的數組:')
print(arr)
arr[:,0].sort()
print('排序之後的數組:')
print(arr)

np.sort(arr[:,2]) # 選擇第三列進行排序

arr.sort(axis=1) # 橫著排序,原來數組改變
np.sort(arr,axis=1) # 橫著排序,但原來的數組不會改變
arr.sort(axis=0) # 豎著排序,原來數組改變
np.sort(arr,axis=0) # 豎著排序,但原來的數組不會改變

(3)argsort函數

接下來看看間接排序:

間接排序:利用特定的參數進行排序,按需排序,需要使用argsort( )函數
argsort函數:返回的是數組值從小到大的索引值。

score=np.array([100,65,76,89,58])
idx=score.argsort()
idx

因此如果打印數組的時候帶上下標就相當於排序瞭:

print(score[idx]) # 利用索引標簽來打印

arr[:,arr[0].argsort()]
#按第一行從低到高進行排序,並且對應的列也會跟著變化 
arr#由於使用的是argsort,因此原數組不會改變 

(4)lexsort函數

numpy.lexsort() 用於對多個序列進行排序。把它想象成對電子表格進行排序,每一列代表一個序列,排序時優先照顧靠後的列。

這裡舉一個應用場景:小升初考試,重點班錄取學生按照總成績錄取。在總成績相同時,數學成績高的優先錄取,在總成績和數學成績都相同時,按照英語成績錄取…… 這裡,總成績排在電子表格的最後一列,數學成績在倒數第二列,英語成績在倒數第三列。

arr1=np.array(['E','B','C','A','D'])
arr2=np.array(['4','1','3','2','5'])
idx=np.lexsort((arr1,arr2))

9.insert

insert 是插入,但原數組不會改變。

arr=np.arange(6)
np.insert(arr,1,100) # 在下標為1的位置插入100

arr=np.arange(6)
np.insert(arr,1,100) # 在下標為1的位置插入100

10.delete

delete是刪除,但原數組同樣不會改變。

arr=np.arange(6)
np.delete(arr,1)
np.delete(arr,[1,2])

11.copy

關於copyview ,這裡需要瞭解一下數組切片和列表切片的區別:

  • 數組切片得到的是原數組的一個view(視圖),修改切片中的內容改變原來數組
  • 列表切片得到的是原列表的一個copy(復制),修改切片後的列表不會改變原列表
arr=np.arange(6)
arr_copy=arr.copy()
arr_copy[0]=100
arr_copy

12.view

arr=np.arange(6)
arr_view=arr.view()
arr_view[0]=100
arr_view

講瞭以上12種數組變形,那麼如何使用容器型數據的特性和數組相關函數的方法對字符串或者其他對象進行去重呢?

s='數組切片得到的是原數組的一個,修改切片中的內容會改變原來數組'

假設現在要對s進行去重:

方法一:使用set

sets=set(s)

方法二:使用unique

sarr=np.array(s)
np.unique(list(s))

 到此這篇關於Python數組變形的幾種實現方法的文章就介紹到這瞭,更多相關Python數組變形內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: