论文阅读“Contrastive and attentive graph learning for multi-view clustering”

Wang R, Li L, Tao X, et al. Contrastive and attentive graph learning for multi-view clustering[J]. Information Processing & Management, 2022, 59(4): 102967.

摘要导读

基于图的多视图聚类旨在利用多视图图信息来提供聚类解决方案。多视图的一致性约束是多视图图聚类的关键。现有的研究大多是生成融合图,并通过聚类损失来约束多视图的一致性。本文认为局部视图对的一致性可以实现多个视图中的共识信息的fine-modeling(精细建模)。为此,本文提出了一种新的对比和注意图学习框架的多视图聚类方法。具体来说,本文设计了一个多视图图学习的 contrastive fine-modeling,利用最大化成对视图的相似性,以保证多视图的一致性。同时,采用基于注意力网络的附加加权细化融合图模块,动态捕捉不同视图的容量差异,进一步促进了单个视图和融合视图的相互强化。此外,提出的CAGL可以通过一个自训练的聚类模块来学习一个专门的聚类表示。最后,开发了一个联合优化目标来平衡每个模块,并在图编解码器的框架下迭代优化所提出的CAGL。

With the development of information collection and processing technology, multi-view data with multiple types of features are pervasive in various application domains. For example, a text document can be analyzed by word, sentence, and paragraph or different languages. (Cross language text classification via subspace co-regularized multi-view learning)

Intro结构记录
  • 多视图数据介绍
  • 图表示的引入

The graph is widely used in representation learning as an important data structure to represent the relationship between various types of objects.

  • 基于图的多视图聚类方法的介绍

Given the natural advantages of graph structure, graph-based multi-view clustering (GMC) has made impressive progress.

  • 现有方法存在的缺点总结(因此本文提出了什么方法)
  • 本文提出的解决方案的模块化介绍

    整体流程图可以由如下表示:
    flow chart
  • 总结
  • 文章的章节安排
方法浅析

数据定义:给定包含m个视图多视图图数据集,\{X^1,\cdots,X^m\}X^m=\{x^m_1,\cdots,x^m_n\} \in R^{d_m \times n}。即,视图m包含n个样本点,且对于视图m而言,其维度为d^m
除一个多视图图自编码器之外,整体的模型主要包含三个主要模块,分别为基于注意权重的融合模块,对比多视图图学习模块,以及一个自训练的聚类模块。

  • Multi-view graph encoder
    GCN每一层的计算可以写成:
    其中,\rho为激活函数,\tilde{A}=D^{-\frac{1}{2}}AD^{-\frac{1}{2}}是正则化之后的对称邻接矩阵。W_0为权重矩阵。l表示GCN的层数。当l=0时,L^{(0)}=X
    对于每个视图的输入,都对应着一个自己视图的GCN图编码器。
  • Att-weighted graph fusion module


对样本特征进行加权平均融合特征和对视图特征拼接往往导致性能次优。因此,作者引入了注意力机制学习每个视图的权重参数。基于该思想,模型可以对来自不同视图的信息进行利用,其z_i^{fusion}计算方式如下:

其中s_mm视图的加性核学习,a_i^m为softmax得到的权重参数。z_i^{fusion}为融合后的特征表示。s_m的计算可以由两层的MLP计算得到,首先通过的是一个带有偏置项和激活函数的全连接层,第二层相当于是权重的修正学习。
通过att加权融合模块获得的融合特征增强了多视图的全局识别程度。

  • Contrastive multi-view graph learning module


在此基础上,本模块的目标是实现在多个视图中的共识信息的fine-modeling。本模块对传统的基于样本的视图对齐的对比学习方法:

此时正负例的设置是来自视图的同一样本和不同样本。在此基础上,为了最大化正例以实现一致的表示特征,本文对负例进行了重新定义,即s_{ii}^{(m,v)}, v \neq m'为负例样本。
这个式子我觉得存在一定的错误,即红框之内的,v \neq i,首先v是视图的角标,i是样本的角标,二者不存在相等的关系。其次,在给定的负例的定义中,仅包含当前样本的不同视图表示,因此分母部分存在一定的笔误。
笔者认为关于l_i^{(m,m')}的定义应该是如下的形式:l_i^{(m,m')}=-log\frac{exp(s_{ii}^{(m,m')})/\tau}{\sum_{v \neq m' I_{[v \neq m]}}exp(s_{ii}^{(m,v)})/\tau}上式中,排除了(m,m)(m,m')作为负例的情况。在这种情况下,对于仅包含两个视图的数据集,其计算就被简化为l_i^{(m,m')}=-log~exp(s_{ii}^{(m,m')})/\tau。(作者在实验中缺失避免了对两个视图数据集的使用
对于一个batch中的所有样本,其损失计算方式如下:
通过最小化该损失,使得整个模型增加了局部视图对的一致性,实现了多个视图中共识信息的fine-modeling。

  • Self-training clustering module


该模块的主要操作是形成以聚类分配驱动的深度框架,聚类损失还是对DEC的沿用。这里给出公式,不再赘述:
  • Multi-view graph decoder

    在该模块,仅构造了一个decoder去恢复m个视图对应的图的输入。本文采用的是分别对每个视图的A^{(m)}进行重构,其损失函数写成:
    关于视图m,其计算如下\tilde{A}^{(m)}=Sigmoid(z^{(fusion)}w^{(m)}z^{(fusion)T})

  • Joint loss

    由于提出的方法是基于图编解码器的框架,因此可以通过一个联合优化目标轻松地实现端到端学习。整体框架的优化包含三个部分的学习目标:
    其中,𝜆1、𝜆2、𝜆3是调整各子损失函数之间的权重。

总体而言,其创新点主要是框架的集成和模块化目标的设计。作为我的梦中情刊,竟然被我发现了好多错误。。。但是不得不说,关于论文的组织结构和语言的组织,都很厉害。
大量的实验证明了该框架的有效性。特别是关于参数敏感性学习的部分,对z^{(fusion)}的维度,学习率\epsilon,收敛性分析,以及loss的参数(\lambda_1,\lambda_2,\lambda_3)(这里又出现了错误,明明说这3个参数都在[0,1],结果画出的图的坐标竟然。。。截图为证)进行了展示。

损失函数中权重的敏感性学习

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 162,825评论 4 377
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 68,887评论 2 308
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 112,425评论 0 255
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,801评论 0 224
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 53,252评论 3 299
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 41,089评论 1 226
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 32,216评论 2 322
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 31,005评论 0 215
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,747评论 1 250
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,883评论 2 255
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,354评论 1 265
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,694评论 3 265
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,406评论 3 246
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,222评论 0 9
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,996评论 0 201
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 36,242评论 2 287
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 36,017评论 2 281

推荐阅读更多精彩内容

  • 字符串 1.什么是字符串 使用单引号或者双引号括起来的字符集就是字符串。 引号中单独的符号、数字、字母等叫字符。 ...
    mango_2e17阅读 7,447评论 1 7
  • 《闭上眼睛才能看清楚自己》这本书是香海禅寺主持贤宗法师的人生体悟,修行心得及讲学录,此书从六个章节讲述了禅修是什么...
    宜均阅读 9,935评论 1 25
  • 前言 Google Play应用市场对于应用的targetSdkVersion有了更为严格的要求。从 2018 年...
    申国骏阅读 63,245评论 14 98
  • 第七章:理性的投资观 字数: 1.投资要围绕目的进行 投资的目的是为了挣钱。投资的除了金钱还有时间和精力也是一种投...
    幸福萍宝阅读 3,253评论 1 2
  • 本文转载自微信公众号“电子搬砖师”,原文链接 这篇文章会以特别形象通俗的方式讲讲什么是PID。 很多人看到网上写的...
    这个飞宏不太冷阅读 6,649评论 2 15