一起學習,一起成長!
Numpy(Numerical Python的簡稱)是高性能科學計算和數據分析的基礎包。
- ndarray,一個具有矢量算術運算和復雜廣播能力的快速且節省空間的多維數組。
- 用于對整組進行快速運算的標準數學函數(無需編寫循環)。
- 用于讀寫磁盤數據的工具以及用于操作內存映射文件的工具。
- 線性代數、隨機數生成以及傅里葉變換功能。
- 用于集成由C、C++、Fortran等語言編寫的代碼的工具。
數據分析主要關注的功能:
- 用于數據整理和清理、子集構造和過濾、轉換等快速的矢量化數組運算。
- 常用的數組算法,如排序、唯一化、集合運算等等。
- 高效的描述統計和數據聚合/摘要運算。
- 用于異構數據集的合并/連接運算的數據對齊和關系型數據運算。
- 將條件邏輯表達為數組表達式(而不是帶有if-elif-else分支的循環)。
- 數據的分組運算(聚合、轉換、函數應用等)。
Numpy最重要的一個特點就是其N維數組對象(即ndarray),該對象是一個快速而靈活的大數據集容器。可以利用這種數組對整塊數據執行一些數學運算。
import numpy as np
data=np.array(data) #可以進行加減乘除等運算
data
Out[5]:
array([[ 0.9526, -0.246 , -0.8856],
[ 0.5639, 0.2379, 0.9104]])
ndarray是一個通用的同構數據多維容器,也就是說,其中的所有元素必須是相同類型的。每個數組都有一個shape(一個表示各維度大小的元組)和一個dtype(一個用于說明數組數據類型的對象)。
#查看元組各維度大小
In[9]:data.shape
Out[9]: (2, 3)
#查看數組數據類型的對象
In[10]:data.dtype
Out[10]: dtype('float64')