论文阅读“A Clustering-guided Contrastive Fusion for Multi-view Representation Learning”

Ke G, Chao G, Wang X, et al. A Clustering-guided Contrastive Fusion for Multi-view Representation Learning[J]. arXiv preprint arXiv:2212.13726, 2022.

摘要导读

在过去的二十年里,多视图表示学习领域取得了越来越快的进展,多视图方法可以从不同的领域提取有用的信息,促进了其应用程序的发展。然而,该社区面临着两个挑战: i)如何从大量的未标记的数据中学习鲁棒的表示,以对抗噪声或不完整视图的情况;ii)在各种下游任务中,如何平衡视图的一致性和互补性。为此,本文利用深度融合网络,将各视图特定的表示融合到视图公共表示中,提取高级语义来获得鲁棒表示。此外,采用了一个聚类任务来指导融合网络,以防止得出平凡的解决方案。为了平衡一致性和互补性,提出的模型中设计了一个非对称的对比策略,来对齐视图公共表示和每个视图的特定表示。以上这些模块被纳入到一个统一的框架中,称为 Clustering-guided Contrastive Fusion(CLOVEN)。在不完全视图数据的情况下,提出的方法可以更好地抵抗噪声干扰。可视化分析表明,CLOVEN可以保留视图特定表示的内在结构,同时提高了视图表示的紧凑性。

模型浅析

从模型图的设计可以看出,该模型将多视图融合的过程也做成了深度融合的形式。简单来说,设计了一个相对复杂的融合模块,而在融合模块之后也是一个常规的聚类驱动的反调。因为前序的View-specific Encoders都是常规操作,这里对其所用的结构不进行赘述,各位可移步到实现细节的部分看各个视图编码器的结构。这里主要对融合模块,以及所采用的非对称对比策略进行分析。

  • 融合模块的结构
    多视图融合的目标是将视图特定的表示集成到一个紧凑的表示空间中,得到视图公共表示。与浅层融合(直接拼接或者带权相加)不同,该模块的设计是为了逐层提取有价值的特征信息。假设这种方法可以产生语义更丰富、更紧凑、更有表达的视图公共表示。
  1. 最简单的方式是使用堆叠的全连接层(vanilla MLP),将视图特定的表示映射到低维的语义表示空间中:
    然而,先前的工作表明,当网络变得更深(即层数增加)时,该网络可能会学习到这个无价值的解决方案。因此,这里引入了如下的残差块(residual block):
    其中norm(\cdot)表示batch normalization。
  2. 为提高Z的表示能力,作者设计了两个子模块ScaleBlock和LatentBlock分别用于将中间层升维为输入的2倍然后再映射到输入维度以及将输入降维到一半再映射到输入维度。升维的过程可以看成是稀疏编码的过程,将会增加嵌入表示的多样性,而降维表示等价于information bottleneck,会增强中间层的表示能力。两个模块所对应的操作分别可以形式化为如下:
    因此,文中的残差块可以表示为:
    该模块使融合网络更加深入,同时减轻了深层网络的负面影响。
  • 非对称对比策略
    作者这里提到的非对称对比主要说的是并不是视图之间的两两对比,主要有以下两点原因:(1)会破坏多视图内部的结构,降低表示的多样性(2)如果遇到模型崩溃的情况将会丢失掉所有视图的信息。不同于单视图使用增强的数据进行对比,在多视图的设置中--假设不同的视图是各种形式的增强,并且一旦发生崩溃,是无法区分哪些是原始视图的。而使用非对称的对比策略所学到的额外的表示包含了所有视图的信息,可以直接作为视图公共表示用于下游任务。因此,两种级别的对比损失可以由如下定义:
    p(\cdot)是一个由三层全连接网络组成的映射函数,用于将表示Z映射到对比空间。
    同理g(\cdot)用于将Z映射到聚类空间,得到样本到每个类簇的概率值。sim(\cdot)表示余弦相似度。
    最终的策略为:
    而后面那一项是为了避免所有样本都分到同一个类簇中,其计算方式如下:
  • 聚类驱动
    最终的任务型驱动使用的是deep divergence-based clustering 损失:
    和DEC所构造的聚类损失类似,\mathcal{L}_{ddc}也算是较为成熟的聚类驱动损失。这里留个坑,改天再来填。
  • Total Loss

整个模型中较为出彩的模块就是融合模块的设计,即保留了各视图之间的表示,也学习了视图共用表示。改观了笔者对融合模块的映像。后续可以添加将其作为一个额外的映射空间做对齐融合。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 162,825评论 4 377
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 68,887评论 2 308
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 112,425评论 0 255
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,801评论 0 224
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 53,252评论 3 299
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 41,089评论 1 226
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 32,216评论 2 322
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 31,005评论 0 215
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,747评论 1 250
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,883评论 2 255
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,354评论 1 265
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,694评论 3 265
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,406评论 3 246
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,222评论 0 9
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,996评论 0 201
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 36,242评论 2 287
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 36,017评论 2 281

推荐阅读更多精彩内容