论文阅读“Consistent graph embedding network with optimal transport for incomplete multi-view clustering”

Lin R, Du S, Wang S, et al. Consistent graph embedding network with optimal transport for incomplete multi-view clustering[J]. Information Sciences, 2023, 647: 119418.

摘要导读

现有的不完整多视图学习的模型通过探索不同视图之间的互补性和一致性信息来重构多个视图的潜在信息。然而,为视图不全缺失的信息会损失一致性,同时,融合和重构视图还会面临过拟合的问题。最优传输(optimal transport)算法巧妙的测量两个分布之间的距离,从而使得重构损失不在增加并且保证了数据的多个视图之间的一致性和互补性。受此启发,本文提出将最优传输算法整合到不完整多视图聚类的框架中。提出的一致的图嵌入网络(CGEN-OT)通过最优传输和对抗模块和融合模块的结合来生成完整的潜在图嵌入表示。具体来说,CGEN-OT利用一个对抗模块来生成完整的潜在图嵌入,将其融合为一个一致的嵌入,并且引入重构损失和Sinkhorn损失来联合优化提出的网络以获得更好的潜在图嵌入表示和聚类结果。在多个数据集上的结果都展示了提出模型的有效性。

模型浅析
动机

现有的不完整多视图聚类取得了较好的效果,但这些方法大多都需要通过重参数技巧来计算梯度导致模型并不灵活。为解决这些问题,本文为不完整聚类设计了一个一致的最优传输网络。该网络使用生成对抗网络来完整化不完整图信息,然后通过深度融合网络进行融合。最终,在最优传输的基础上构建了一个灵活的likelihood-free框架高效的拟合重构损失。

一致的图对抗模块

给定数据集,首先通过高斯核构建视图对应的初始KNN亲和图W_v,然后利用生成对抗属性来挖掘不完整多视图数据的一致性。该模块使用不完整视图同时训练生成器和判别器,因而这里并不需要每个视图都必须完整。具体来说,不完整的视图作为生成器的输入来产生一个完整视图。同时,生成的视图和原始的不完整视图同时输入到判别器中,该策略可以增强生成器的生成能力,从而从不完整数据中称为完整的视图表示。通过生成对抗的方式,使得该模块有效的补全了缺失的视图信息。
该模块的生成网络用于学习现有信息图的初始非线性结构。为学习具有辨别性的特征和多有视图的几何结构,每个视图通过对抗学习来捕获更高阶的图嵌入。整个过程可形式化为:A_v=G_v(W_v, \Theta_{D_v}),其中A_v表示视图v的对抗亲和图;G_v表示视图v的生成器,\Theta_{D_v}为视图v的判别器D_v的可训练参数。通过迭代式的生成对抗训练,最终抽取每个视图的图表示。

互补的图融合模块

前序模块在保证多视图一致性的情况下为各视图抽取具有辨别性的特征,但互补性和缺失信息并没有进行处理。受多通道信息处理的启发,本文设计了一个互补图融合模块。该模块通过融合多通道的图信息,推动生成包含完整信息的图。所有的对抗亲和图\{A_v\}_{v=1}^V通过矩阵C构建完整图。该过程形式化为如下(6):

最终融合模块的输出F包含了缺失样本的多个视图。

最优传输嵌入模块

在将F应用到聚类任务前,本文还设计了一个最优传输嵌入模块来学习低维的潜在图嵌入。该模块采用包含编码器E和解码器Q的自编码结构。最优传输算法来实现重构的嵌入表示和已知分布的有效匹配。该模块为图嵌入模块提供了最大似然,并增强了所提出框架的性能。关于AE的学习形式化为:\text{L}=\rho(E(F),\Theta_{E})(7)其中,L表示中间层低维潜在嵌入,\Theta_{E}表示编码器E中可训练的参数,\rho为激活函数。重构的嵌入和所有对抗性亲和图通过最优传输算法进行匹配。经过t轮迭代,可以学习到更好的潜在表示\text{L}

训练损失

整体框架的训练损失(12)为:

其中\mathcal{L}_1为重构损失,S_{c,\epsilon}(\overline{F}, A_v)是Sinkhorn损失,\lambda是调节损失的平衡因子。总体的算法流程如下所示:

实现

在实现的细节中,论文使用的是channel number of convolutional layer,这里笔者认为指卷积输出层的通道数,即卷积核的个数。当然这里说的不知道到底是并行还是串行,笔者认为串行的可能性较大,因为后续的实现细节并没有说明多个feature map怎么整合。
每个模块的层都是卷积层,在第一个模块中生成器和判别器对应的卷积核个数分别为[1,4,4,1],第二个模块则是为每个视图先使用了相同的四层卷积,然后定义了输出层的通道数[v, 1](这两个channel number竟然不一样?),整合到一个融合的图。第三模块,使用的是结构为[1,4,8,8,4,1]的卷积自编码器。


比较好奇在真正的缺失视图数据中,缺失的数据是用什么形式来存储的,是如何一般将其处理为正常的输入形式?后续有机会再来填坑。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,569评论 4 363
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,499评论 1 294
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,271评论 0 244
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,087评论 0 209
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,474评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,670评论 1 222
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,911评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,636评论 0 202
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,397评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,607评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,093评论 1 261
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,418评论 2 254
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,074评论 3 237
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,092评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,865评论 0 196
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,726评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,627评论 2 270

推荐阅读更多精彩内容