3-Numpy数组

NumPy数组属性

首先让我们讨论一些有用的数组属性。我们将从定义三个随机数组开始,分别是一维,二维和三维数组。我们将使用NumPy的随机数生成器,我们将使seed设置初始值,以确保每次运行此代码时都生成相同的随机数组:

In [8]: import numpy as np
   ...: np.random.seed(0)  # seed for reproducibility
   ...: 
   ...: x1 = np.random.randint(10, size=6)  #一维数组
   ...: x2 = np.random.randint(10, size=(3, 4))  # 3*4的二维数组
   ...: x3 = np.random.randint(10, size=(3, 4, 5))  # 3*4*5的三维数组

每个数组都有属性ndim(维数),形状(每个维的大小)和大小(数组的总大小):
查看x3的相关信息

In [2]: print("x3 ndim: ", x3.ndim)
   ...: print("x3 shape:", x3.shape)
   ...: print("x3 size: ", x3.size)
x3 ndim:  3
x3 shape: (3, 4, 5)
x3 size:  60

In [3]: x3
Out[3]: 
array([[[8, 1, 5, 9, 8],
        [9, 4, 3, 0, 3],
        [5, 0, 2, 3, 8],
        [1, 3, 3, 3, 7]],

       [[0, 1, 9, 9, 0],
        [4, 7, 3, 2, 7],
        [2, 0, 0, 4, 5],
        [5, 6, 8, 4, 1]],

       [[4, 9, 8, 1, 1],
        [7, 9, 9, 3, 6],
        [7, 2, 0, 3, 5],
        [9, 4, 4, 6, 4]]])
# 取出第一维的下标1种二维下标1三维下表为0的数
In [4]: print(x3[1][1][0])
4
# 类型
In [5]: print("dtype:",x3[1][1][0].dtype)
dtype: int32

可以查看数组单个元素的字节和总字节数

In [7]: print("itemsize:", x3.itemsize, "bytes")
   ...: print("nbytes:", x3.nbytes, "bytes")
# int32的为4字节
itemsize: 4 bytes
#总共3*4*5=60个元素 60*4 个字节
nbytes: 240 bytes

2. 数组索引:访问单个元素

In [8]: x1
Out[8]: array([5, 0, 3, 3, 7, 9])

In [9]: x1[0]
Out[9]: 5

In [10]: x2
Out[10]: 
array([[3, 5, 2, 4],
       [7, 6, 8, 8],
       [1, 6, 7, 7]])

In [11]: x2[0][1]
Out[11]: 5

从数组末端访问用负号,-1从最后开始依次往前,可自己尝试

In [13]: x1
Out[13]: array([5, 0, 3, 3, 7, 9])

In [14]: x1[-1]
Out[14]: 9

In [15]: x3
Out[15]: 
array([[[8, 1, 5, 9, 8],
        [9, 4, 3, 0, 3],
        [5, 0, 2, 3, 8],
        [1, 3, 3, 3, 7]],

       [[0, 1, 9, 9, 0],
        [4, 7, 3, 2, 7],
        [2, 0, 0, 4, 5],
        [5, 6, 8, 4, 1]],

       [[4, 9, 8, 1, 1],
        [7, 9, 9, 3, 6],
        [7, 2, 0, 3, 5],
        [9, 4, 4, 6, 4]]])

In [16]: x3[-2][-1][0]
Out[16]: 5

数组切片,访问子数组

正如我们可以使用方括号来访问单个数组元素一样,我们也可以使用方括号来访问带有切片符号(由冒号(:)字符标记)的子数组。 NumPy切片语法遵循标准Python列表的语法;要访问数组x的切片,请使用以下命令:

x[start:stop:step]

In [20]: x = np.arange(10)
    ...: x
Out[20]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
#前三个
In [21]: x[:3]
Out[21]: array([0, 1, 2])
#从下标2截取
In [22]: x[2:]
Out[22]: array([2, 3, 4, 5, 6, 7, 8, 9])

In [23]: x[1:3]
Out[23]: array([1, 2])
# 从索引1开始步长为2截取
In [24]: x[1::2]
Out[24]: array([1, 3, 5, 7, 9])
# 如果步长为负,则反向截取
In [27]: x[::-2]
Out[27]: array([9, 7, 5, 3, 1])

多维子数组

In [33]: x2[1,1]
Out[33]: 6
# 截取一维前两个元素后,对应的二维截取前三个元素
In [34]: x2[:2,:3]
Out[34]: 
array([[3, 5, 2],
       [7, 6, 8]])
# 截取一维前两个元素后,对应的二维截取步长为2截取
In [35]: x2[:2,::2]
Out[35]: 
array([[3, 2],
       [7, 8]])

#利用负的步长可以将二维数组完全反转
In [37]: x2[::-1, ::-1]
Out[37]: 
array([[7, 7, 6, 1],
       [8, 8, 6, 7],
       [4, 2, 5, 3]])

访问数组的行和列

数组的冒号:可以访问当前维度的所有

Out[40]: 
array([[3, 5, 2, 4],
       [7, 6, 8, 8],
       [1, 6, 7, 7]])
# 访问索引0的列
In [41]: x2[:,0]
Out[41]: array([3, 7, 1])
# 访问列
In [45]: x2[1]
Out[45]: array([7, 6, 8, 8])

数组视图

numpy数组切片的一个重要且极其有用的事情是,它们返回视图而不是数组数据的副本。这是NumPy数组切片与Python列表切片不同的一个领域:在Python 列表中,切片将是副本。之前的二维数组:

In [46]: x2
Out[46]: 
array([[3, 5, 2, 4],
       [7, 6, 8, 8],
       [1, 6, 7, 7]])

In [47]: x2_sub=x2[:2,:2]

In [48]: x2_sub
Out[48]: 
array([[3, 5],
       [7, 6]])

In [49]: x2_sub[0,0]=233

In [50]: x2
Out[50]: 
array([[233,   5,   2,   4],
       [  7,   6,   8,   8],
       [  1,   6,   7,   7]])

上面我们看到修改子数组x2_sub后,x2的元素也被修改了
这种默认行为实际上非常有用:这意味着当我们使用大型数据集时,我们可以访问和处理这些数据集的片段,而无需复制基础数据缓冲区。

创建数组副本

尽管数组视图具有出色的功能,但有时在数组或子数组中显式复制数据有时还是很有用的。使用copy()方法可以很容易地做到这一点:

In [51]: x2
Out[51]: 
array([[233,   5,   2,   4],
       [  7,   6,   8,   8],
       [  1,   6,   7,   7]])

In [52]: x2_copy=x2[:2,:2].copy()

In [53]: x2_copy
Out[53]: 
array([[233,   5],
       [  7,   6]])

In [54]: x2_copy[0,0]=888

In [55]: x2_copy
Out[55]: 
array([[888,   5],
       [  7,   6]])

In [56]: x2
Out[56]: 
array([[233,   5,   2,   4],
       [  7,   6,   8,   8],
       [  1,   6,   7,   7]])

可以看到修改copy后的数组,x2不会改变

重塑数组

另一种有用的操作类型是数​​组的重塑。最灵活的方法是使用整形方法。例如,如果要将数字1到9放在3×3的网格中,则可以执行以下操作:

In [57]: grid = np.arange(1, 10).reshape((3, 3))
    ...: print(grid)
[[1 2 3]
 [4 5 6]
 [7 8 9]]

请注意,要使此方法起作用,初始数组的大小必须与调整后的数组的大小匹配。在可能的情况下,reshape将使用初始数组的无副本视图,但是对于非连续的内存缓冲区,情况并非总是如此。

另一种常见的重塑模式是将一维数组转换为二维行或列矩阵。可以使用reshape方法完成此操作,也可以通过在slice操作中使用newaxis关键字更轻松地完成此操作:

In [64]: x
Out[64]: array([1, 2, 3])
# 形成 1*3的二维数组
In [65]: x.reshape(1,3)
Out[65]: array([[1, 2, 3]])
# 使用newaxis方式,后面:截取所有
In [66]: x[np.newaxis,:]
Out[66]: array([[1, 2, 3]])
# 形成 3*1的二维数组
In [67]: x.reshape(3,1)
Out[67]: 
array([[1],
       [2],
       [3]])

In [68]: x[:,np.newaxis]
Out[68]: 
array([[1],
       [2],
       [3]])

In [69]: x
Out[69]: array([1, 2, 3])
# 也可以这样处理三维
In [73]: x.reshape(3,1,1)
Out[73]: 
array([[[1]],

       [[2]],

       [[3]]])
#或者
In [74]: x[:,np.newaxis,np.newaxis]
Out[74]: 
array([[[1]],

       [[2]],

       [[3]]])

数组串联与分割

前面所有例子均在单个数组上运行。也可以将多个数组合并为一个,然后将单个数组拆分为多个数组。我们将在这里查看这些操作。

  1. 数组的串联
In [81]: x = np.array([1, 2, 3])
    ...: y = np.array([3, 2, 1])
    ...: np.concatenate([x, y])
Out[81]: array([1, 2, 3, 3, 2, 1])
# 也可以使用二维数组上
In [83]: grid=np.array([[1,2,3],[4,6,0]])

In [84]: np.concatenate([grid,grid])
Out[84]: 
array([[1, 2, 3],
       [4, 6, 0],
       [1, 2, 3],
       [4, 6, 0]])
In [101]: # concatenate along the second axis (zero-indexed)
     ...: np.concatenate([grid, grid], axis=1)
Out[101]: 
array([[1, 2, 3, 1, 2, 3],
       [4, 6, 0, 4, 6, 0]])

对于使用混合维度的数组,使用np.vstack(垂直堆栈)和np.hstack(水平堆栈)函数会更加清楚:

In [102]: x = np.array([1, 2, 3])
     ...: grid = np.array([[9, 8, 7],
     ...:                  [6, 5, 4]])
     ...: # 垂直锥线
     ...: np.vstack([x, grid])
Out[102]: 
array([[1, 2, 3],
       [9, 8, 7],
       [6, 5, 4]])
In [103]: #水平锥线
     ...: y = np.array([[66],
     ...:               [88]])
     ...: np.hstack([grid, y])
Out[103]: 
array([[ 9,  8,  7, 66],
       [ 6,  5,  4, 88]])

数组分割

与 串联的相反是分割,它是通过np.split,np.hsplit和np.vsplit实现。对于每一个数组,我们都可以传递给出分割点的索引表:

In [111]: x = [1, 2, 3, 99, 99, 3, 2, 1]
     ...: x1,x2,x3=np.split(x,[1,2])
     ...: print(x1,x2,x3)
[1] [2] [ 3 99 99  3  2  1]
  • 注意,N个分裂点会产生N + 1个子数组。相关功能np.hsplit和np.vsplit相似:
In [114]: grid = np.arange(16).reshape((4, 4))
     ...: grid
Out[114]: 
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15]])
# 上下分割,从第二行
In [115]: upper, lower = np.vsplit(grid, [2])
     ...: print(upper)
     ...: print(lower)
[[0 1 2 3]
 [4 5 6 7]]
[[ 8  9 10 11]
 [12 13 14 15]]
# 从第二列分割
In [122]: left, right = np.hsplit(grid, [2])
     ...: print(left)
     ...: print(right)
[[ 0  1]
 [ 4  5]
 [ 8  9]
 [12 13]]
[[ 2  3]
 [ 6  7]
 [10 11]
 [14 15]]

np.dsplit和前面类似处理三维数组

In [127]: x = np.arange(16.0).reshape(2, 2, 4)
     ...: print(x)
     ...: np.dsplit(x, 2)
[[[ 0.  1.  2.  3.]
  [ 4.  5.  6.  7.]]

 [[ 8.  9. 10. 11.]
  [12. 13. 14. 15.]]]
Out[127]: 
[array([[[ 0.,  1.],
         [ 4.,  5.]],

        [[ 8.,  9.],
         [12., 13.]]]),
 array([[[ 2.,  3.],
         [ 6.,  7.]],

        [[10., 11.],
         [14., 15.]]])]

更新github

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,847评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,208评论 1 292
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,587评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,942评论 0 205
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,332评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,587评论 1 218
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,853评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,568评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,273评论 1 242
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,542评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,033评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,373评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,031评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,073评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,830评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,628评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,537评论 2 269

推荐阅读更多精彩内容