Graph Classification常用数据集

通过复现《How powerful are graph neural networks?》这篇论文,熟悉图分类常用数据集。必须注意到cora, citeseer和pubmed这三个数据集不是用于graph分类的,而是用于node分类的。
GNN常用的公开数据集大致有分子、蛋白质、论文引用网络、社交网络等这几类。
官方代码地址
本人复现代码地址
常用图数据集
吐槽:学术论文的开源代码,实在没法看。
吐槽:编写图神经网络模型,我感觉构造coo格式的稀疏矩阵才是最头疼的

数据集描述

  1. IMDB数据集:每个节点代表一个演员,每条边代表两个演员是否出现在同一个电影里。IMDB-BINARY类别有两个:爱情片和动作片(???)如果同时是爱情片和动作片的话,就会归类为动作片。IMDB-MULTI则在爱情片和动作片的基础上,加了一个科幻片类别。
  2. COLLAB数据集:每个节点代表一个researcher,每个graph我猜是代表了一个科研团体?每一个Graph有一个类别,共有高能物理、凝聚态物理和天体物理3个类别。
  3. Reddit数据集:每个节点代表一个用户,每个graph代表一个帖子,帖子里如果一个用户回复了另一个用户的评论就构成一条边。graph的类别代表了帖子类型。Reddit-Binary、Reddit5K、Reddit12K分别有2类、2类和11类。
  4. MUTAG数据集:每个graph代表一个硝基化合物分子,有两个类别,代表这个分子是诱变芳香族或杂芳香族。
  5. PTC数据集:也是分子化合物,和上述一样
  6. NCI1数据集:也是分子化合物,和上述一样
  7. Protein数据集:每个节点是一个secondary structure elements,如果两个节点在氨基酸序列或3D空间中是相邻节点就会存在一条边。
    总结如下表
数据集 图数量 图类别数 图平均节点 节点标签数
IMDB-binary 1000 2 19.77 0
IMDB-multi 1500 3 13 0
COLLAB 5000 3 74.49 0
Reddit-Binary 2000 2 429.61 0
Reddit-multi-5K 5000 2 508.5 0
Reddit-multi-12K 11929 11 391.4 0
MUTAG 188 2 17.9 7
PTC 344 2 25.5 19
NCI1 4110 2 29.8 37
Protein 1113 2 39.1 3

Graph Isomorphism Network复现结果

论文给的结果如下图,这个结果好像是跑了10 folds,把test set的ACC取平均的结果。精力有限,我只跑了一个fold。官方的GIN模型code有个细节,就是参考了Xu et al. 2018提出的JKNet,使用了Layer Aggregator。每一层的输出,都经过一个Linear层,再求和,作为最后的输出。


GIN官方实验结果

我复现的结果见以下7张图。模型设置:neighbor aggregator和graph aggregator都使用sumPool,没加epsilon参数(也就是论文的GIN0,而不是GIN-eps)。由于资源有限,Reddit数据集跑起来OOM了,就不跑Reddit的了。
如图所示,Test Accuracy在某个Epoch都刚好达到了文中给的结果,NCI1数据集除外,我也不知道为什么。


IMDB_BIN_GIN0

IMDB_MULTI_GIN0

MUTAG_GIN0

NCI1_GIN0

PROTEINS_GIN0

PTC_GIN0

COLLAB_GIN0
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,736评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,167评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,442评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,902评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,302评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,573评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,847评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,562评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,260评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,531评论 2 245
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,021评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,367评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,016评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,068评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,827评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,610评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,514评论 2 269

推荐阅读更多精彩内容