Python數據清洗工具之Numpy的基本操作
1. Numpy(Numberical Python)
Anaconda中已經集成瞭NumPy,可以直接使用。如果想要自行安裝的話,可以使用流行的Python
包安裝程序 pip 來安裝 NumPy,目前使用的是Anaconde的環境進行學習和使用這個庫
1.1 這庫的安裝方法
CMD :pip install numpy
或者使用清華源的鏡像庫:pip install numpy -i https://pypi.tuna.tsinghua.edu.cn/simple
(直接復制可用)
如果想查看這個庫的版本:
import numpy as np np.__version__
其實很多其他庫也可以用這個方法進行查看庫的版本
2.Numpy的基礎操作
Numpy的操作對象是一個ndarray,所以在使用這個庫進行計算的時候需要將數據進行轉化
2.1 數組的創建:np.arrary()
np.array 可以把 list,tuple或者其他的序列模式的數據轉創建為 ndarray,默認創建一個新的
ndarray
我們會發現原來數據裡面有int, float型的數據都被轉換成相同的類型瞭,統一轉變成float型的數據瞭,因為Numpy是要求array裡面的數據類型是一致的
2.2 N維數組的創建
Numpy不僅可以生成一維數組,也可以生成多維數組。
比如,可以生成如下的二維數組:
2.3 常用數組
2.4 線性數組的生成
2.5 數組的運算
數組的運算時對應位置的元素進行簡單的四則運算
這裡需要註意的是,數組x和數組y的元素個數是相同的(兩者均是元素個數為3的一維數組)
當兩者元素個數相同時,可以對各個元素進行算術運算。如果元素個數不同,則會報錯,所以保
持元素個數一致非常重要。
此外,Numpy數組不僅可以進行對應元素的算術運算,還可以和單一的數值(標量)組合起來進
行運算(這個功能也被稱為廣播,後面會詳細介紹),比如:
會把數據轉成數組默認的float的數據類型
2.6 數組的形狀變換
我們先定義一個數組
如果數組的量級比較大,對於計算的時候隻知道其他的一個維度數字,則可以使用下面的-1,作為占位符,會自動幫你補齊另外一個維度的信息
除此之外,還有一種比較常用的數組拉平方法, m.flatten()以及m.ravel(),這兩種方法類似
3. 數組的索引
可以將這個二維的數組看成一個矩陣,3行四列, 通過數字的下標索引進行提取數字,這裡的切片操作還是左閉右開的
4.廣播功能
術語廣播是指 NumPy 在算術運算期間處理不同形狀的數組的能力。
廣播可以簡單理解為用於不同大小數組的計算(加、減、乘、除等)的一組規則。
如果數組的形狀相同,則對相應元素逐個計算,但是如果數組的維度不相同,就需要用到廣播機制
Numpy的廣播遵循一組嚴格的規則:
規則1:如果兩個數組的維度數不相同,那麼小維度數組的形狀將會在最左邊補1規則2:如果兩個數組的形狀在任何一個維度上都不匹配,那麼數組的形狀會沿著維度為1的維度擴展以匹配另外一個數組的形狀規則3:如果兩個數組的形狀在任何一個維度上都不匹配並且沒有任何一個維度為1,則會引 發異常無法廣播
到此這篇關於Python數據清洗工具之Numpy的基本操作的文章就介紹到這瞭,更多相關Python數據清洗內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- None Found