《Max-Margin DeepWalk: Discriminative Learning of Network Representation》简评

本文同时发布于西土城的搬砖工和简书
论文链接:Max-Margin DeepWalk: Discriminative Learning of Network Representation

引用格式:
Cunchao Tu, Weicheng Zhang, Zhiyuan Liu, Maosong Sun. Max-Margin DeepWalk: Discriminative Learning of Network Representation. International Joint Conference on Artificial Intelligence (IJCAI 2016).

标题:Max-Margin DeepWalk: Discriminative Learning of Network Representation
来源:IJCAI 2016
问题:
作者提出,DeepWalk作为一种典型的学习社交网络节点向量表示的方法,在一些任务上缺乏足够的区分能力。故作者在本文提出Max-Margin(最大间隔)DeepWalk方法,在最大间隔分类器的影响下,原先学习到的节点向量的区分能力有所增强。

背景简介:

相关工作 解决问题
DeepWalk 基于随机游走和Skip-Gram学习图节点表示
矩阵分解形式的DeepWalk 证明DeepWalk等价于矩阵分解,分解结果包含内容属性
Max-Margin DeepWalk 引入SVM分类器增强前述模型习得向量的区分能力

主要方法:
基于矩阵分解的DeepWalk模型(MFDW)
再提及该方法前需要对DeepWalk进行简单的介绍,该方法的具体描述见《DeepWalk: Online Learning of Social Representations》DeepWalk大致过程如下:随机游走遍历某节点的邻节点,得到一个节点序列,再借鉴skip-gram的原理,由单个节点预测前后序列,学习得到该节点的向量表示。在这其中利用Hierarchical Softmax减小搜索空间。
基于矩阵分解的DeepWalk具体可以参考《Network Representation Learning with Rich Text Information》。简单概括的话,作者通过数学推导,证明DeepWalk的学习过程类似传统主题模型矩阵分解的操作。示意图如下:


其中M表示图的邻接矩阵,W表示节点的向量表示矩阵,(MRn×k ,n表示节点个数,k表示节点向量维度),T矩阵根据作者推导,类似主题模型矩阵分解的处理思路,作者认为该矩阵反应了节点本身的内容特征。易知,HTRn×k .最后就可以将之后将WHT同一行的向量拼接在一起,作为2k维的向量表示节点属性。
最大间隔DeepWalk模型(MMDW)

基于最大间隔思想设计的分类器中,最为有名的即为SVM分类器,作者使用On the Algorithmic Implementation of Multiclass Kernel-based Vector Machines中提出的多类SVM分类器。该多类分类器的关键在于构造W参数矩阵。(WRL×K)的矩阵,L表示label个数,K表示特征向量维度)在比较时可以将特征向量x依次与W矩阵每一行参数点乘,根据值的大小判断所属类别类别。相应的优化函数如下:

但是如果只用上述SVM分类器做分类.对节点向量本身不产生影响。基于此,作者将前面MFDW的训练过程与这里SVM分类器的训练过程,利用节点向量x作为纽带结合起来,具体方法是利用biased gradient在节点向量学习时,传递SVM分类器参数的变化情况。这样将节点在SVM分类器中反应的label属性融合到特征向量中,并且由于SVM分类器本身区分能力强的特点,提高了特征向量的区分能力。经过上述过程后,优化函数如下:

]
相关工作:
参数学习:
参数学习是模型训练的重要部分。本文由于是SVM分类器与MFDW模型的结合,模型的迭代更新也自然分为这两部分。在每一轮次中,针对某模型的参数进行学习更新时,需要保证另一模型的参数不变。
对于SVM分类器中的分类器参数W和松弛变量ζ 而言,学习思路参考Crammer&Singer提出的方法,并结合Keerthi在2008年提出的解决序列对偶问题的方法。
对于节点特征向量矩阵X和内容矩阵Y的迭代更新,由于节点向量矩阵X的的节点特征向量同时在两个模型中出现。那么在优化X,Y的时候,我们考虑加入偏置,使节点特征向量xi朝着前面最大间隔分类器优化的方向迭代更新。即在求取前述LDW关于xi的偏导时,引入下面的bias因子

实验结果:
由于实验结果较多,且部分涉及模型本身性能的分析,这里重点说明自己感兴趣的部分:
节点区分能力图示:
左图是传统DeepWalk的方法,右图表示本文提出的DeepWalk改进模型,从图中可以看出,由于结合最大间隔模型,本文模型的区分能力更强:

模型对语义信息的把握:
下表反应的是原模型与作者改进模型在某论文数据集上进行聚类得到的部分结果对比图。该轮文数据集主要包含论文的基本信息及相互引用的情况。可以看出,由于隐含的结合了label信息在内,本文所提出的MMDW模型在主题层面对于数据的划分相比之前的模型,更为准确。


简评:
选择这篇论文主要是由于经过一段时间的调研,感觉目前学习网络节点的embedding表示的方法层出不穷。自己感觉在研究过程中,如果不能结合具体问题分析具体特征,很难有好的论文创新点。这篇论文就是作为发表在今年IJCAI上的论文,是一个将其他节点属性信息融合到节点向量学习的很好的例子。具体说来,本文为有以下几点值得学习:
创新点突出:
DeepWalk模型是在2014年提出的,在2015年,有人证明DeepWalk可以视作矩阵分解问题,并得出分解得到的矩阵包含图节点的向量表示和内容特征。而最大间隔方法之前在主题模型、分词等NLP传统领域使用较多,这里,作者能将该方法迁移用于改善向量区分能力。这一创新之前无人涉及,也取得了很好的效果。
选择选择得当:
本文提出模型中需要用到与节点内容属性相关的特征。针对这一情况,本文在实验中,使用的主要数据包括Cora、Citeseer、Wiki。前两个数据集包括论文基本信息及其引用情况。Wiki中如果将url视作节点,相互引用的wiki之间视作存在关系对,我们就可以将其转换为社交关系网络来处理。这些数据的文本部分包含丰富的语义信息,可以有效说明论文模型的适用性和优势。
基础知识扎实:
文中利用文本特征驱动节点向量训练时,采用了biased gradient的方法,由于暂时没有查到相关资料,这里可能这是作者独立提出来的。该方法从算法角度并不复杂,但却可以有效的改变训练方向,加入SVM学习到的相关信息,从而“引导”节点向量的迭代更新。该方法的提出以及文中大量关于SVM模型的分析推导过程均显示出了作者该领域不俗的功力。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,560评论 4 361
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,104评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,297评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,869评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,275评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,563评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,833评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,543评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,245评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,512评论 2 244
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,011评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,359评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,006评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,062评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,825评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,590评论 2 273
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,501评论 2 268

推荐阅读更多精彩内容