Semi-Supervised Multimodal Deep Learning for RGB-D Object Recognition

总体上看,这篇文章的主要贡献包含两块:
  1. 网络使用 AlexNet + 自编码器 进行预训练,该初始化方法的结果要优于 AlexNet+ImageNet的初始化,作者解释原因为: AlexNet + 自编码器 的方法让网络学到了 RGB-D 数据中更多的领域知识。
  2. 该框架提出了“ diversity preserving co-training" 方法(多样性保留协同训练)。区别于传统的co-training,该方法在给 unlabeled data 做标记的过程中,并非使用 catagory classifier(目标分类器),而是借助convex clustering(凸聚类),使用 attribute classifier(属性分类器)进行标记。传统的协同训练方法容易导致有偏的标记,提出的新算法则避免了此问题。(简单理解为:新算法可以标记的更准确?)
下面介绍 diversity preserving co-training 算法思路:

首先利用Reconstrunction Netiwork进行网络权值初始化。然后按以下三步进行迭代训练

  1. Convex Clustering(目的是发现类内多样性)。凸聚类只在有标签数据上进行,并且分别在RGB模态和Depth模态都要进行凸聚类。目的是对有标签数据进行进一步的细分。例如,数据集中包含10个类别,分别代表杯子、椅子……电视。凸聚类根据这些类标签进行聚类,聚类的结果是每一个类形成一个类簇,例如有“杯子类簇”、“椅子类簇”,与普通聚类区别在于,“杯子类簇”下还有细分的子类簇(sub-cluster),子类簇形成的原因是,虽然都属于杯子类簇,但是不同的杯子形状颜色各不相同,例如有“高脚杯类簇”、“mug类簇”、“茶杯类簇”……这些子类簇的名字我们是不知道的,一般按照数字进行标定,如子类簇1,子类簇2……,这里称为“高脚杯类簇”等是为了便于说明该算法的思想。这里,paper中将每一个子类簇定义为一个attribute,至此,对于一个labeled sample(文中用“exemplar”术语来代替术语“sample”,我是这么理解的,不知道是否有错误?)而言,它同时拥有了两个标签,其中一个是catagory label(用来表示样本属于哪一类,如“杯子”类),另一个是属性attribute label(用来表示样本的属性,如“高脚杯类簇”,其实就是一种更细的划分)。因为一个sample的data有两种模态,一种模态是RGB数据,一种模态是Depth数据,所以文中分别在RGB convnet和Depth covnet进行分类和聚类操作,聚类的结果,paper中给出如下形式化定义:

Z^RGB = {ZRGB_1,...ZRGB_C} -------------------(3)
Z^depth = {Z^depth ,...Z^depth_C}

  1. Multitask Learning 分别在两个模态各自进行多目标分类器的训练。训练样本此时都是来自labeled pool。
  2. Co-Training 利用步骤2训练好的训练器,进行协同训练。用训练好的attribute分类器从unlabeled pool挑选出高置信的样本(此时样本根据attribute分类器贴上相应的attribute labels),根据公式(3)的对应关系,将attribute标签映射回catagory labels。RGB-attribute分类器选出的新样本在下一轮训练中给Depth-catagory 分类器使用,相反亦然(这是Co-training的思想)。attribute labels在下次迭代要重新进行凸聚类,因为这个过程是比较耗时的,所以实验过程中只在前5次迭代时每次都会重新凸聚类,以后的迭代会采用第5次凸聚类的结果。

疑问:

  1. Section 3.2 提到, 重构网络包含 12 层全连接网络用于编码?图中只显示了4层。
  2. Convex Clustering 中提到beta控制sparseness,而引用的paper中说的是beta控制sharpness,不知道这两个词是否是一回事。
  3. Convex Clustering 中提到的一个术语 exemplar 是不是和 sample 表达的是一个东西?
  4. Co-Training 中困惑是paper中等式 score()=f(), f是softmax function,所以score()应该是一个向量,那么为什么向量score()可以和标量tao进行关系运算?
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,716评论 4 364
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,558评论 1 294
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,431评论 0 244
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,127评论 0 209
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,511评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,692评论 1 222
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,915评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,664评论 0 202
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,412评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,616评论 2 245
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,105评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,424评论 2 254
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,098评论 3 238
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,096评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,869评论 0 197
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,748评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,641评论 2 271

推荐阅读更多精彩内容