详解Numpy中的数组,


Numpy定义

NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。NumPy 通常与 SciPy(Scientific Python)和 Matplotlib(绘图库)一起使用,这种组合广泛用于替代 MatLab,是一个强大的科学计算环境,有助于我们通过 Python 学习数据科学或者机器学习。

NumPy 主要应用包括:

机器学习模型:在编写机器学习算法时,需要对矩阵进行各种数值计算。例如矩阵乘法、换位、加法等。NumPy提供了一个非常好的库,用于简单(在编写代码方面)和快速(在速度方面)计算。NumPy数组用于存储训练数据和机器学习模型的参数。

图像处理和计算机图形学:计算机中的图像表示为多维数字数组。NumPy成为同样情况下最自然的选择。实际上,NumPy提供了一些优秀的库函数来快速处理图像。例如,镜像图像、按特定角度旋转图像等。

数学任务:NumPy对于执行各种数学任务非常有用,如数值积分、微分、内插、外推等。因此,当涉及到数学任务时,它形成了一种基于Python的MATLAB的快速替代。

为什么要用numpy

Python中提供了list容器,可以当作数组使用。但列表中的元素可以是任何对象,因此列表中保存的是对象的指针,这样一来,为了保存一个简单的列表[1,2,3]。就需要三个指针和三个整数对象。对于数值运算来说,这种结构显然不够高效。Python虽然也提供了array模块,但其只支持一维数组,不支持多维数组(在TensorFlow里面偏向于矩阵理解),也没有各种运算函数。因而不适合数值运算。NumPy的出现弥补了这些不足。(——摘自张若愚的《Python科学计算》)

详情请参考:

https://numpy.org/doc/stable/index.html

NumPy安装

因为numpy通常跟 scipy matplotlib一起使用,所以一起安装三个模块即可

pip3 install --user numpy scipy matplotlib

numpy array基础使用

np数组的创建

  1. import numpy as np 
  2.  
  3. a = np.array([1,2,3,4]),#1行4列矩阵,即一维数组 
  4.  
  5. b = np.arange(4) # 1行4列矩阵,元素递增1的一维数组 
  6.  
  7. c = np.array([[1,2],[3,4]]) # 2行2列矩阵,即二维数组d = np.arange(4).reshape((2,2)) #变换输出 2行2列print (a) 
  8.  
  9. print(type(a)) #输出a的类型print (b) 
  10.  
  11. print (c) 
  12.  
  13. print (d) 

分别输出:

  1. [1 2 3 4] 
  2.  
  3. [0 1 2 3] 
  4.  
  5. [[1 2] 
  6.  
  7. [3 4]] 
  8.  
  9. [[0 1] 
  10.  
  11. [2 3]] 

np数组的广播

广播(Broadcast)是 numpy 对不同形状(shape)的数组进行数值计算的方式,对数组的算术运算通常在相应的元素上进行。如果两个数组 a 和 b 形状相同,即满足a.shape == b.shape,那么 a*b 的结果就是 a 与 b 数组对应位相乘。这要求维数相同,且各维度的长度相同。

例如代码

  1. a = np.array([1,2,3]) 
  2. b = np.array([10,20,30]) 
  3. c = a * b 
  4. print (c) 

输出

  1. [10 40 90] 

数组广播相加操作

  1. a = np.array([[ 0, 0, 0], [10,10,10], [20,20,20], [30,30,30]]) #4x3 的二维数组 
  2. b = np.array([1,2,3]) 
  3. print(a + b) 

输出

  1. [[11 12 13] 
  2.  
  3. [2122 23]] 

下面的图片展示了数组 b 如何通过广播来与数组 a 兼容。4x3 的二维数组与长为 3 的一维数组相加,等效于把数组 b 在二维上重复 4 次再运算:

详解numpy中的数组(附源码)

np数组的切片和索引

ndarray对象的内容可以通过索引或切片来访问和修改,与 Python 中 list 的切片操作一样。ndarray数组可以基于0-n的下标进行索引,切片对象可以通过内置的 slice 函数,并设置 start, stop 及 step 参数进行,从原数组中切割出一个新数组。相信大家理解python list切片相关操作,一定会对该部分的内容感到熟悉,这里举几个经典的例子:

基础实例

  1. import numpy as np 
  2. a = np.arange(10) # [0 1 2 3 4 5 6 7 8 9] 
  3. b = a[5] #下标5元素的值 
  4. c = np.array([[1,2,3],[3,4,5],[6,7,8]])print(b) 
  5. print(a[3:5]) #输出下标3-5的值,注意这里可以输出下限3,而不包括上限5 
  6. print(c[0,0]) #输出第一行第一列的元素即[1,2,3]中的1 
  7. print (c[...,1]) #第2列元素print (c[1,...]) # 第2行元素print (c[...,1:]) # 第2列及剩下的所有元素 

输出

  1.  
  2. [3 4] 
  3.  
  4.  
  5. [2 4 7] 
  6.  
  7. [3 4 5] 
  8.  
  9. [[2 3] 
  10.  
  11. [45] 
  12.  
  13. [78]] 

布尔索引实例

我们可以通过一个布尔数组来索引目标数组。布尔索引通过布尔运算(如:比较运算符)来获取符合指定条件的元素的数组。

  1. c = np.array([[1,2,3],[3,4,5],[6,7,8]]) 
  2. print (c[c > 3]) #打印出大于3的元素 

输出

  1. [4 5 6 7 8] 

numpy array遍历

直接上代码,普通一维数组

  1. arr = np.array([1, 2, 3]) 
  2. for x in arr: 
  3.     print(x) 

输出

  1.  
  2.  

定义一个numpy的二维数组,二维以上的数组这里不做讨论

  1. arr = np.array([[1, 2, 3], [4, 5, 6]]) 
  2. #遍历 
  3. for x in arr: 
  4.      print(x) 

输出

  1. [1 2 3] 
  2.  
  3. [4 5 6] 

如果想一个一个地输出每一个元素,可以这样编写代码

  1. for x in arr: 
  2.      for y in x: 
  3.            print(y) 

输出

  1.  
  2.  
  3.  
  4.  
  5.  

上面的方式比较麻烦,我们可以通过方法np.nditer实现一个一个地输出每一个元素

  1. for x in np.nditer(arr): 
  2.      print(x) 

输出

  1.  
  2.  
  3.  
  4.  
  5.  

numpy array元素过滤

实例,在np数组中,过滤大于2的元素

  1. arr = np.array([1, 2, 3, 4]) 
  2. newarr = arr[arr >2] 
  3. print(newarr) 

输出

  1. [3 4] 

怎么样,是不是非常非常简单!

numpy array 关于字符的处理

如果np数组中存储的是字符,如果相对字符元素进行相关操作,需要使用api —np.char

有这样一个需求,把字符'0.01%','1.1%','1.21%' 中的%去掉,并把字符转型为float类型。如何实现呢?代码如下:

  1. b=np.array(['0.01%','1.1%','1.21%']) 
  2. newb=np.char.rstrip(b,'%').astype(float) 
  3. print(newb) 

输出

  1. [0.01 1.1 1.21] 

其中:

rstrip表示删除某个字符

astype(float)表示把元素转型为float

评论关闭