CS224W-图神经网络 笔记5.3:Spectral Clustering - 谱图聚类的具体操作步骤

CS224W-图神经网络 笔记5.3:Spectral Clustering - 谱图聚类的具体操作步骤

本文总结之日CS224W Winter 2021只更新到了第四节,所以下文会参考2021年课程的PPT并结合2019年秋季课程进行总结以求内容完整

课程主页:CS224W: Machine Learning with Graphs

视频链接:【斯坦福】CS224W:图机器学习( 中英字幕 | 2019秋)

[toc]

引言

通过前一篇文章介绍,我们知道如何评价图划分的好坏;和为什么能根据图拉普拉斯矩阵的第二小特征值对应的特征向量对图进行近似分割。前面算是理论部分,下面进入实践部分。

1 谱聚类流程

1.1 谱聚类步骤

谱聚类过程分为三个步骤。

第三步划分组,对倒数第二小特征向量进行升序排列后,如何确定分割的点呢?

  • 基础操作

    • 0点 作为分割点,(正负号)
    • 中位数作为分割点
  • 其他 (相对复杂方法)

    • 逐步计算,选择使得Normalied cut 最小的分割点。(Sweep procedure)

1.2 如何实现 K 分类呢?

上面介绍的都是二分的情况,如何推广到多(K)分的情况呢?

具体,有2个基本的方法:

  1. 以分层划分的方式递归地调用二分类算法

    • 缺点是效率低,不稳定(每一次都是近似,误差会放大)。
  2. 采用多个特征向量的谱聚类

  • 按照\lambda的值(排除最小的 λ)从小到大依次取 m 个特征向量,将节点嵌入到低维空间中,每个节点通过 m 维数据表示,之后通过 K-means 算法进行聚类。通常也不需要取很大的值。多个特征向量,减少信息丢失,并已被证明能够近似地逼近最优划分。

1.3 如何选择社区的数量 K?

1.3.1 特征间距

可将特征值从大到小排序后,两个连续的特征值之间的差被称为特征间距(Eigengap)

通常来说,通过选取最大化特征差距的 K 大概率能获得稳定的划分结果。如下图对应的K=2是特征间距最大。

2 基于motif 的图划分

第三节中有介绍到motif,将图拆解为一个个子图来重新看待网络,motif给了网络一个新的定义方式,可以考虑从motif的角度(而不是上述边的角度)出发来进行谱图聚类。

具体操作过程与基于边分割类似,不同的是需要对于划分标准,拉普拉斯矩阵进行转换。

2.1 Motif Conductance

对于最优划分标准类比edge cut和conductance,针对motif思想也是同样,就是要组内motif尽可能多,组间motif尽可能少。具体对比定义如下

所以问题就变成了,给定motif M和图G,如何划分节点,使motif conductance最小。但找到最小motif conductance也为np问题,也需要采用算法近似估算

2.2 Motif Spectral Clustering

类比一般谱图聚类,基于motif的谱聚类也分为三步:

1. 数据预处理:基于motif对图边权重进行重新定义,每个边权重为出现过的motif次数.得到权重矩阵和拉普拉斯矩阵。

2. 分解:类似于标准的谱图聚类方法,计算拉普拉斯矩阵和对应的特征值特征向量

3. 分组:利用Sweep procedure方法,对第二小的特征值对应的特征向量x的元素从小到达排列,计算每一种划分下的motif conductance,选择使motif conductance最小的划分。

如下图左下角所示,当r=5时,motif conductance最小。

此外,最小 motif conductance 也可以根据cheeger 不等式。

基于motif 的谱聚类算法的价值:

  • 它提供了从更高维度去观察网络社区结构的新角度。
  • 算法简单、快速和灵活,便于应用。

2.3 基于motif的谱聚类案例

课上老师给了一个食物链网络中基于motif的谱图聚类结果。可以看出,基于motif的聚类在每一类结果中捕捉了特定的motif的结构,在每一类内部有较多的给定motif,而类与类之间这种motif较少。

参考文章

  1. https://blog.csdn.net/klcola/article/details/104800804
  2. 图网络机器学习 | 社区发现 — 谱聚类算法
  3. 斯坦福CS224W 图与机器学习5】Spectral Clustering
  4. 谱聚类方法推导和对拉普拉斯矩阵的理解
  5. https://linalg.apachecn.org/#/docs/chapter21
  6. https://www.cnblogs.com/xingshansi/p/6702188.html?utm_source=itdadao&utm_medium=referral
  7. http://www.cs.yale.edu/homes/spielman/sgta/SpectTut.pdf
  8. http://www.math.ucsd.edu/~fan/wp/cheeger.pdf
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 162,547评论 4 374
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 68,787评论 2 308
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 112,175评论 0 254
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,752评论 0 223
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 53,169评论 3 297
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 41,056评论 1 226
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 32,195评论 2 321
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,980评论 0 214
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,724评论 1 250
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,872评论 2 254
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,344评论 1 265
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,667评论 3 264
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,379评论 3 245
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,202评论 0 9
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,992评论 0 201
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 36,189评论 2 286
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,987评论 2 279

推荐阅读更多精彩内容