Python中的二维矩阵“相减”——答东小羊问

问题描述:

在一个 220*2 的矩阵 A 中,以行为单位(即每行),行与行之间不存在重复的数据。现已经得到了矩阵 A 中的 i 行数据构成的矩阵 B,求另外 220-i 行数据构成的矩阵 C 。

问题分析:
很明显这个问题其实并不难,我们最容易想到的解决办法就是for循环,一个不行就两个,两个不行就三个……但如果要求你尽可能少的使用for循环时,这个问题又该如何处理呢?

本文实验环境:Python 3.6.1 |Anaconda 4.4.0 (64-bit)

方案1

拼接矩阵 + 虚数转化 + 计数器

针对东小羊的这个具体的应用场景,可以一个for循环也不使用。我们将B矩阵拼接在A矩阵的下方,得到拼接矩阵A_B,由于只有两列数据,所以我们借助虚数的概念,将每一行数据转化为一个整体,再使用计数器判断矩阵A_B中每个元素的个数,其中个数为1的即是我们要寻找的数据。创建 get_others.py 代码如下:

import numpy as np
from collections import Counter

mat = np.arange(20).reshape((10, 2))
sample_1 = np.arange(0, 6).reshape((3, 2))  # 测试样例
############# 关键代码开始 #############
con_mat = np.concatenate((mat, sample_1), axis=0)  # 拼接矩阵
x = con_mat[:, 0] + con_mat[:, 1] * 1j  # 利用虚数
res = np.array(list(Counter(x).values()))
sample_2 = mat[res == 1, :]
############# 关键代码结束 #############
print("总的矩阵为:\n", mat)
print("第一部分为:\n", sample_1)
print("第二部分为:\n", sample_2)

上述代码的缺陷在于,仅仅只适用于矩阵为两列的情况,如何让代码的鲁棒性更强呢。

方案2

拼接矩阵 + 元组转化 + 计数器

·方案1 中的虚数转化其实就是将一行数据变为一个单元,那么同样的我们可以将 get_others.py 中的虚数转换部分改变为 tuple 即可,修改后的代码如下:

import numpy as np
from collections import Counter

mat = np.arange(20).reshape((10, 2))
sample_1 = np.arange(0, 6).reshape((3, 2))  # 测试样例
############# 关键代码开始 #############
con_mat = np.concatenate((mat, sample_1), axis=0)  # 拼接矩阵
con_row_tuple = [tuple(t) for t in con_mat] # 将矩阵中的每一行转换为tuple类型
res = np.array(list(Counter(con_row_tuple).values()))
sample_2 = mat[res == 1, :]
############# 关键代码结束 #############
print("总的矩阵为:\n", mat)
print("第一部分为:\n", sample_1)
print("第二部分为:\n", sample_2)

方案3

元组转化 + 集合运算

在前面的基础上,只要你明白了每一行为一个元素,那么引入集合来进行减运算也是非常容易理解的了。代码如下:

import numpy as np

mat = np.arange(20).reshape((10, 2))
sample_1 = np.arange(0, 6).reshape((3, 2))  # 测试样例
############# 关键代码开始 #############
mat_tuple_set = set([tuple(t) for t in mat])  # 将矩阵中的每一行转换为tuple类型并将结果转为集合类型
sample_tuple_set = set([tuple(t) for t in sample_1])  # 将矩阵中的每一行转换为tuple类型并将结果转为集合类型
sample_2 = np.array([list(t) for t in (mat_tuple_set - sample_tuple_set)])  # 集合相减,再将结果转换为二维矩阵形式
############# 关键代码结束 #############
print("总的矩阵为:\n", mat)
print("第一部分为:\n", sample_1)
print("第二部分为:\n", sample_2)

利用集合来解决这个问题的思路是不错的,但主要在数据类型的转换上花了较多时间。

总结

通过本文的描述,二维矩阵按行(列)去重或计数有了一定的解决办法。去重和计数问题平常见得比较多的主要出现在一维的列表或数组中,通过借助 numpy.unique()collections.Counter() 或 转换为 set 类型等等方法进行解决。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 156,265评论 4 359
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 66,274评论 1 288
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 106,087评论 0 237
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,479评论 0 203
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 51,782评论 3 285
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,218评论 1 207
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,594评论 2 309
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,316评论 0 194
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 33,955评论 1 237
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,274评论 2 240
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,803评论 1 255
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,177评论 2 250
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,732评论 3 229
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 25,953评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,687评论 0 192
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,263评论 2 267
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,189评论 2 258

推荐阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 170,537评论 25 707
  • 《ilua》速成开发手册3.0 官方用户交流:iApp开发交流(1) 239547050iApp开发交流(2) 1...
    叶染柒丶阅读 9,715评论 0 11
  • 手机的普及伴随而来的是,越来越多各式各样的App产品。选用正确实用的APP,可以简化生活,提高工作的效率。今天推荐...
    小二翻身做掌柜阅读 1,552评论 9 15
  • 今天的晨读有意思。 老生常谈的排列组合,却感觉多了许多新东西。 温故而知新? 说说我看晨读时候的心里路程。 001...
    李爹阅读 216评论 9 7
  • 我们很多人都在一个房子里,实际上我们是不自由被关起来的,但由于人很多房子也比较大,并没有人恐慌。在一个桌子上堆了很...
    kirakira阅读 192评论 0 1