CS224W-图神经网络笔记3.1：Motifs and Structural Roles in Networks - 网络的结构（Motifs and Graphlet）

本文总结之日CS224W Winter 2021只更新到了第四节，所以下文会参考2021年课程的PPT并结合2019年秋季课程进行总结以求内容完整
课程主页：CS224W: Machine Learning with Graphs
视频链接：【斯坦福】CS224W：图机器学习( 中英字幕 | 2019秋)

1 引言

前面两节，讨论的网络的整体统计信息，这一节开始聚焦网络中的一些特殊结构（子图）和其中节点的的角色。

2 一些新概念

在深入学习本节前，需要先理解几个关键概念。

子图/子网络（Subgraph/Subnetwork）
motifs
graphlet
（节点的）结构性角色（structural rols）

2.1 子图Subgraph/子网络/Subnetwork

定义：字面上就可以理解，就是网络中的一部分节点和它们之间的边。

重要性（why）：我们可以借助子图挖掘出图的一部分性质和信息。

图片

例如，对不同类型的网络统计三个节点的各类子图出现的频次，得到不同网络的重要性概览（Network significance profile）。同类网络，有相似的子图分布。有的子图低于平均，有的高于平均。顺带一提高于平均的是下面要介绍的motifs。

图片

2.2 motifs

定义：（what）一类特殊子图的统称，它具有如下特点:

pattern：小的诱导子图（Small induced subgraph）。
- 诱导induced 表示节点之间的连接都包含在内。
recurring：高频出现
significant：重要指比预想（随机图）中出现的频率更高。

其他特点：

同一类motifs 之间，诱导子图的边必须完全一致。多一条边改个方向都不行
不同 motifs 之间可以重叠。

重要性（why）

帮助我们理解网络，理解不同节点之间关系。描述了节点间交互模式，通过模式匹配去理解网络。

如何衡量重要性（how）

因为Motifs 的定义要求Motif出现频率要更高，更重要。因此可以通过与随机网络中的Motifs数进行对比，以衡量真实网络中一种子图的显著性。具体通过下面的公式进行：

图片

因为，通常更大规模的网络有更高的Z值。因此，为了更方便在不同规模的网络之间进行比较，通过标准化之后的Z值的向量SP的方式解决。如上图所示。

关键问题 —— 随机网络怎么生成？

配置模型：根据给定的度序列k_1, k_2, …, k_N生成随机图，用来与真实网络进行对比。通常称为零模型（null model）
生成配置模型的两种方式：

图片

- 随机连接： 该方法生成的随机图，因为会忽略重边和自连接，故同一节点的度会发生改变。但根据《网络科学引论》的p275 。当网络规模足够大时，网络中的自边和重边的平均数将会趋于常数。
- 随机交换： 随机选择一对边，然后重连两个边，交叉两个点。生的随机图的节点的度，不发生改变。但计算的代价会较高，运行慢。为了保证随机图的随机性，需要运行的次数为 Q * E 次，其中Q应尽可能的大，如100。

获取具有相同节点数，边数，节点度数的随机图之后，我们就可以计算子图 $i$ 的 $Z$ 值。高值说明该子图是图G的一个Motif。

将一组子图的Z值作为网络的特征向量 $SP$ ，我们就得到了上面展示的对比图1。

2.3 Graphlets

非同构子图单元，是一类特殊的子图。Graphlets是对motif的扩展。它与motifs的区别：
- motif是从全局的角度来描述图的。用不同motifs来构成一个图的向量表示。
- 而Graphlet是从局部(节点)的角度出发来描述节点。用不同graphlet中的节点相对位置（局部信息），来形成一个节点的向量表示。

截屏2021-02-01 下午3.27.39

截屏2021-02-01 下午3.27.17

截屏2021-02-01 下午3.36.52

2.3.1 同构图（isomorphic graph）

可以参考知乎上的解释：怎么理解图的同构?怎么判断两个图是否同构？ - 少文的回答 - 知乎

这里给出图论上的定义：

在图论中，假设G=(V,E)和G1=(V1，E1)是两个图，如果存在一个双射m：V→V1，使得对所有的 $x, y \in V$ 均有 $x, y \in E$ 等价于 $m(x)m(y) \in E_1$ ，则称G和G1是同构的。

简单的说，两个同构图，节点和边一致，且存在一个一一映射使得每个节点相互对应。

2.3.2 非同构子图集

不同节点数的子图可以构成的非同构子图数量不同，节点越多，非同构子图数量呈指数增加。如下图，可以看到，不同颜色的点，代表相对位置不同类型的点。

图片

2.3.3 Graphlet degree vector（GDV）

通过计算一个节点所在的Graphlets中不同的非对称位置，可以对节点附近的局部结构进行衡量。

GDV的定义：一个节点所在位置的频率组成的向量。

2.4 如何获得motifs和graphles（how）

可将问题拆解为两步：

1.枚举所有大小为k的子图。
2.计算这些子图出现的次数。
- 这里涉及子图同构的判断，是一个 NP-complete问题，计算困难。通常，子图的大小选择在 3到8个点。

第一步：Extract Subgraph Enumeration(ESU)

为了枚举所有大小为k的子图，老师介绍了ESU算法。ESU算法[Wernicke 2006]中的两个集合：

$V_{subgrapg}$ : 目前已经构造的子图
$V_{extension}$ : 用于扩展子图的候选节点集合

算法思想：每个节点分配唯一序号，从一个节点开始，添加符合以下性质的节点到：

$u$ 的节点编号必须大于 $v$
$u$ 只能是某个新加入的节点 $w$ 的邻居，不能是任何 $V_{subgrapg}$ 中的节点的邻居

$ESU$ 算法是一个递归算法，运行过程呈现为一个深度为 k 的树，被称作ESU-tree。

图片

第二步：Extract Subgraph Enumeration(ESU)

为了计算这些子图出现的次数，因为涉及到如何判断图与图之间是否同构，可使用 McKay’s nauty 算法 [McKay 1981]。

即若图G中任意一对邻接的节点 u 和 v ，在图H中都有f(u)和f(v)邻接，则图G和图H同构。

n个节点的两个同构图判断，需要 $n!$ 次计算，计算量很大。

图片

通过上面两步我们可以得到图的 motifs 和 graphlet和对应GDV。

截屏2021-02-01 下午3.47.00

3 总结

本节，为了研究网络的结构特性，通过定义了motif 和 graphlet 两类子图，从不同角度对图的拓扑性质进行了研究。

其中，GDV 算是早期node embedding的一种。

截屏2021-02-01 下午3.30.20

4 参考文章

https://blog.csdn.net/lssx0817/article/details/106195822
《网络科学引论》郭世泽陈哲译
https://snap-stanford.github.io/cs224w-notes/preliminaries/motifs-and-structral-roles_lecture

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 156,757评论 4赞 359
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 66,478评论 1赞 289
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 106,540评论 0赞 237
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 43,593评论 0赞 203
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 51,903评论 3赞 285
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 40,329评论 1赞 210
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 31,659评论 2赞 309
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 30,383评论 0赞 195
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 34,055评论 1赞 238
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 30,337评论 2赞 241
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 31,864评论 1赞 256
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 28,227评论 2赞 251
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 32,820评论 3赞 231
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 25,999评论 0赞 8
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 26,750评论 0赞 192
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 35,365评论 2赞 269
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 35,260评论 2赞 258

CS224W-图神经网络 笔记3.1：Motifs and Structural Roles in Networks - 网络的结构（Motifs and Graphlet）