NumPy基础:数组和矢量计算

NumPy的ndarray:一种多维数组对象

data=randn(2,3) #生成一个2行3列的数组

data
data*10
data+data
data.shape #数组的维度大小
data.dtype #数组的数据类型(所有元素必须是相同类型的)

创建ndarray

使用array函数,接受一切序列型的对象

data1 = [6, 7, 8, 9.5, 10]
arr1 = np.array(data1)

也可以接收嵌套序列,转换为多维数组

data2 = [[1, 2, 3, 4], [5, 6, 7, 8]]
arr2 = np.array(data2)

arr2.ndim 返回数组的维度(行数)

np.zeros(10) 获得10列全为0的数组
np.zeros((2,3)) 获得2行3列全为0的数组
np.zeros_like() 以另一个数组为参数,根据形状和dtype创建全为0的数组

np.ones() 的用法与ones类似

np.empty(2, 3, 4) 创建一个没有任何具体值的数组;这里是创建2个3行4列的新数组

np.arange(15) 输出array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14])

np.eye/identity(N) 创建一个正方的NxN单位矩阵

ndarray的数据类型

array()中接受dtype=xxx作为参数传入
np.array([1, 2, 3], dtype=np.float64)
可以通过astype方法显式的转换dtype,代码如下:
float_arr = arr.astype(np.float64) 相当于生产了一个新的数组,换了数据类型;不会改变arr的数据类型

如果某字符串数组表示的全是数组,也可以用astype将其转换为数值形式
array2 = np.array(['1.25', '3.7', '-9.4'], dtype=np.string_)
array2.astype(float) 注意np.float64也可以
array([1.25, 3.7, -9.4])

数组和标量之间的运算

对数据进行批量运算,这称作矢量化
大小相等的数组之间的任何算术运算可以将运算应用到元素级
大小不同的数组之间的运算叫做广播

基本的索引和切片

arr[N] 表示第N+1个元素,因为是0开始
arr[X:Y] 表示第X+1到第Y+1的切片(不包括Y+1)

arr[X:Y] = 2 相当于把切片的数据全部换成2, 会改变原arr的数据
使用arr[X:Y].copy()可以显式的进行复制操作

切片索引

布尔型索引

花式索引

数组转置和轴对换

arr.T

np.dot计算矩阵内积
np.dot(arr.T, arr)

理解arr.transpose()


参考源码
多谢大神的解释

还有np.swapaxes()方法,接受一对轴编号
np.swapaxes(arr, X, Y) 或者arr.swapaxes(X, Y)

通用函数:快速的元素级组函数

利用数组进行数据处理

矢量化,用数组表达式代替循环的做法

将条件逻辑表述为数组运算

数学和统计方法

和\标准差等聚合运算

用于布尔型数组的方法

arr=randn(100)
(arr>0).sum()# Number of positive values

bools=np.array([False,False,True,False])
bools.any() 存在一个或多个
bools.all() 是否都是

排序

arr.sort
多维数组可以在任何一个轴向上进行排序,将轴编号传给sort即可

唯一化以及其他的集合逻辑

np.unique(arr)

np.in1d用于测试一个数组中的值在另一个数组中的成员的成员资格
values=np.array([6,0,0,3,2,5,6])
np.in1d(values,[2,3,6]) #注意这里是数字1
>>>array([ True, False, False,  True,  True, False,  True], dtype=bool)

还有一些集合函数,参见表4-6

用于数组的文件输入输出

np.save()
np.load()

存取文本文件

np.loadtxt和np.genfromtxt

或者pandas的read_csv和read_table

线性代数

表4-7有常用的numpy.linalg函数

随机数生成

normal可以得到标准正太分布的样本数组

表4-8 部分numpy.random函数

推荐阅读更多精彩内容