Python中的Numpy 面向數組編程常見操作

數組編程

使用Numpy數組可以使你利用簡單的數組表達式完成多項數據操作任務,而不需要編寫大量的循環,這個極大的幫助瞭我們高效的解決問題。我們都知道向量化的數組操作比純Python的等價實現在速度這一方面快很多,至於多少(一到兩個數量級)甚至更多,生活需要慢節奏,但是計算就不可以瞭,掌握高效的計算模型,可以讓數據分析如虎添翼!

簡單例子

我們生成從-3.14–3.14,按照0.01的間隔生成,最後計算表達式X^2+Y^2的值

邏輯條件作為數組操作

numpy.where函數是三元表達式 x if condition else y 的向量化版本,假設我們有一個佈爾值數組和兩個數值數組

首先我們要明確的是我們自己去寫這個邏輯來進行判斷的話就比較的失敗,因為遇到比較大的數組,速度會比較的慢,因為所有的代碼工作都是解釋器Python代碼完成的,其次如果是多維的那就無法湊效瞭,但是我們使用np.where就可以簡單的完成。

在np.where的第二個和第三個參數並需要數組,它們可以是標量,where在數據分析中的一個典型用法就是根據一個數組來生成一個新的數組。假設你有一個隨機生成的矩陣數據,並且你想要其中的正值都有替換為2,所有的負數都替換為-2,使用這個函數輕松解決。

數學和統計方法

許多關於計算整個數組統計值或關於軸向數據的數據函數,可以作為數組類型的方法被調用。你可以使用聚合函數(通常也叫縮減函數),比如sum,mean,STD(標準差)既可以直接調用也可以使用頂層的numpy函數

 對於統計方法我們的案例其實差不多,至於怎樣去瞭解那就需要自己去琢磨瞭,下面有一個基礎數組的統計方法

基礎數組的統計方法:

sum

計算總數

 

mean

數學平均,0長度的數組平均值為NaN

std,var

標準差與方差

min,max

最小值和最大值

argmin,argmax

最小值和最大值的位置

cumsum

從0開始元素累計和(等差數列求和)

cumprod

從1開始元素累計積(階乘)

一行代碼計算1+2+….10數之和

佈爾數組的方法

sum通常可以計算佈爾值數組中true的個數,對於佈爾數組,有兩個非常常用的方法any和all。any用於檢查數組中是否至少有一個true,如果有一個以上那麼它就會返回true,any檢查是否每一個值都是true,如果有一個不是true那就返回false。

排序

和Python類建列表相似,numpy數組可以使用sort方法按照位置排序

唯一值和其他的邏輯集合

介紹:

numpy包含一些針對一維ndarray的基礎集合操作。常用的一個方法是np.unique返回的是包含數組唯一的排好序的集合,首先集合肯定是唯一的,那麼我們在進行排序,解決它的無序性

應用場景假設有一個數組裡面有很多值,而且有大量的重復的值我們需要對其進行排序,就可以使用這個方法瞭,下面是一些數組集合的操作

數組集合操作:

unique(x) 計算X的唯一值,並排序 intersect1d(x,y) 計算X和Y的交集,並排序 union1d(x,y) 計算X和Y的並集,並排序 in1d(x,y) 計算X中的元素是否包含在Y中,返回一個佈爾值數組 setdiff1d(x,y) 差集,在X中但不在Y中的元素 setxor1d(x,y) 異或集,在X或Y中,但不屬於X,Y交集的元素

到此這篇關於Python中的Numpy 面向數組編程常見操作的文章就介紹到這瞭,更多相關Python Numpy 內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: