Arxiv网络科学论文摘要10篇(2021-05-07)

  • ConsisRec:通过一致的邻居聚合来增强GNN以进行社会推荐;
  • 科学发现的协作路径:协作科学中的劳动、生产力和创新分配;
  • 揭示城市空间和社会互动的社会经济结构;
  • 捕捉多语言社会的多样性;
  • 蚁群算法启发的合作科研模型;
  • CrossWalk:公平性增强的节点表示学习;
  • 您应该从WallStreetBets获得投资建议吗?数据驱动的方法;
  • 识别复杂网络中的关键高阶交互;
  • 基于数据融合的交通流量缺失概率模型;
  • 带辅助信息的社区检测的半定规划;

ConsisRec:通过一致的邻居聚合来增强GNN以进行社会推荐

原文标题: ConsisRec: Enhancing GNN for Social Recommendation via Consistent Neighbor Aggregation

地址: http://arxiv.org/abs/2105.02254

作者: Liangwei Yang, Zhiwei Liu, Yingtong Dou, Jing Ma, Philip S. Yu

摘要: 社交推荐旨在将社交链接与用户-项目交互融合在一起,以缓解评级预测的冷启动问题。图神经网络(GNN)的最新发展促使人们努力设计基于GNN的社交推荐框架,以同时汇总社交和用户项交互信息。但是,大多数现有方法都忽略了社会矛盾问题,这直观地表明社会联系不一定与评级预测过程保持一致。可以从上下文级别和关系级别观察到社会前后矛盾。因此,我们打算赋予GNN模型以解决社会矛盾问题的能力。我们建议通过将采样概率与邻居之间的一致性评分相关联来对一致的邻居进行抽样。此外,我们采用关系关注机制来分配具有高重要性因子的一致关系进行聚合。在两个真实世界的数据集上进行的实验验证了模型的有效性。

科学发现的协作路径:协作科学中的劳动、生产力和创新分配

原文标题: A collaborative path to scientific discovery: Distribution of labor, productivity and innovation in collaborative science

地址: http://arxiv.org/abs/2105.02303

作者: Floriana Gargiulo, Maria Castaldo, Tommaso Venturini, Paolo Frasca

摘要: 在这项工作中,我们通过研究尚未开发的信息资源:Polymath项目,来探索科学发现的过程。 Polymath项目是在在线协作环境中集体解决数学问题的原始尝试。为了调查Polymath实验,我们分析了与项目相关的所有帖子,这些帖子到达了同行评审的出版物,并特别关注劳动力的组织和作者贡献的创新。我们观察到,零星贡献者的大量存在提高了最活跃用户的生产力,而就帖子数量而言,生产力与贡献者的数量呈超线性增长。当涉及大规模合作中的创新时,没有一个确切的规则可以确定主要创新者将是谁。有时,零星贡献者的偶然互动可能会对发现过程产生重大影响,偶尔的参与者发表单个帖子可以将工作推向新的方向。

揭示城市空间和社会互动的社会经济结构

原文标题: Uncovering the socioeconomic structure of spatial and social interactions in cities

地址: http://arxiv.org/abs/2105.02519

作者: Maxime Lenormand, Horacio Samaniego

摘要: 城市流动性,社会网络与社会经济地位之间的关系非常复杂,难以理解,这主要是由于缺乏数据所致。在这里,我们使用手机数据来分析智利城市系统中空间和社会互动的社会经济结构。基于地理和社会事件的概念,我们开发了一种方法,可以根据位置之间的社会经济状况来评估位置之间的空间和社会互动水平。我们证明,具有相同社会经济地位的人会优先与地理位置和具有相似社会经济地位的人进行互动。我们还显示,在一周的过程中,空间和社交互动的相似度也有相似的变化。最后,我们强调指出,在考虑城市与城市之间的互动时,这些优先互动似乎仍然存在。

捕捉多语言社会的多样性

原文标题: Capturing the diversity of multilingual societies

地址: http://arxiv.org/abs/2105.02570

作者: Thomas Louf, David Sanchez, Jose J. Ramasco

摘要: 世界语言所编码的文化多样性正处于危险之中,因为在过去的几十年中,随着全球化的不断发展,许多语言已受到威胁。为了保持这种多样性,首先必须理解是什么导致语言消失,以及哪些机制可以实现共存。在这里,我们结合理论和数据驱动的观点来考虑语言转换中的工作过程。使用推特和人口普查数据对多语言社会中语言的空间模式进行大规模的实证研究,得出了广泛的多样性。它的范围从几乎完全讲语言的人(包括多语种)混合到隔离,将语言领域巧妙地分隔开来,并且主要是在他们的边界处使用多语种。为了理解这些不同状态如何出现,尤其是变得稳定,我们提出了一种模型,在该模型中,当学习另一种语言时以及双语者偏爱使用濒临灭绝的语言时,可以达到语言的共存。在元种群框架中进行的模拟突出了由人员流动引起的空间相互作用对解释混合状态的稳定性或两个语言区域之间的边界存在的重要性。调节语言之间关系的参数的更改会破坏系统的稳定性,该系统会经历全局转换。根据我们的模型,一旦经历过渡,系统的演化高度依赖于历史。更改现状很容易,但是回到以前的状态可能并不简单,甚至不可能。

蚁群算法启发的合作科研模型

原文标题: A model for cooperative scientific research inspired by the ant colony algorithm

地址: http://arxiv.org/abs/2105.02571

作者: Zhuoran He, Tingtao Zhou

摘要: 在互联网时代,现代科学研究已成为很大程度上的合作活动。我们建立了一个基于启发式蚁群算法的模拟模型,以理解人口水平的创造力。每个研究人员都有两个启发式参数,分别代表他自己的判断力和对文学的信任。在拥有各种研究人员的人群中,我们发现,随着问题规模的增加,贡献者的分布已从依赖于自己的判断的独立机制转变为更紧密地遵循文献的合作机制。分布也随着研究问题的阶段和可用的计算能力而变化。我们的工作为各个学科的合作科学研究的动态过程提供了一些初步的理解和指导。

CrossWalk:公平性增强的节点表示学习

原文标题: CrossWalk: Fairness-enhanced Node Representation Learning

地址: http://arxiv.org/abs/2105.02725

作者: Ahmad Khajehnejad, Moein Khajehnejad, Mahmoudreza Babaei, Krishna P. Gummadi, Adrian Weller, Baharan Mirzasoleiman

摘要: 机器学习系统扩大社会不平等和不公平的潜力正受到越来越多的大众和学术界的关注。最近的许多工作都集中在开发算法工具以评估和减轻这种不公平。但是,在提高图算法的公平性方面工作很少。在这里,我们开发了一种简单,有效且通用的方法CrossWalk,该方法可提高各种图算法的公平性,包括影响最大化,链路预测和节点分类,该算法适用于节点嵌入。 CrossWalk适用于任何基于随机游动的节点表示学习算法,例如DeepWalk和Node2Vec。关键思想是通过增加(1)靠近组外围的边或(2)连接网络中的不同组的边来偏重随机游走以跨越组边界。 CrossWalk将靠近组外围的节点从嵌入空间中的其他组拉向其邻居,同时保留图中的必要结构信息。大量的实验表明,我们的算法可有效提高各种图算法的公平性,包括影响力最大化,链路预测以及合成网络和实际网络中的节点分类,而性能却只有很小的下降。

您应该从WallStreetBets获得投资建议吗?数据驱动的方法

原文标题: Should You Take Investment Advice From WallStreetBets? A Data-Driven Approach

地址: http://arxiv.org/abs/2105.02728

作者: Tolga Buz, Gerard de Melo

摘要: 鉴于Reddit的WallStreetBets(WSB)社区在影响现在被称为“模因股票”的股票价格中的显著作用,该社区已变得举世瞩目。但是,关于在WSB上发布的高度投机性投资建议的可靠性知之甚少。本文分析了从2019年1月到2021年4月的WSB数据,以评估依赖社区建议的投资策略的成功程度。我们检测买入和卖出建议,并确定社区最受欢迎的股票,以此为基础定义WSB投资组合。我们的评估表明,该投资组合已经增长了大约。在过去三年中,大约200%去年为480%,明显优于标准普尔500指数。相比之下,未发现买入和卖出信号的平均短期准确性明显优于同一时间范围内随机或均等分布的购买决策。但是,我们提出了一种估算职位是否主动而不是被动的技术,并表明通过关注更有前途的购买信号的一个子集,交易者可以进行比整体市场或全部信任的策略产生更高收益的投资。购买信号。最后,为了排除2021年1月GameStop炒作的影响,还专门针对2021年之前的时期进行了分析-结果证实了结论,并暗示2021炒作只是放大了现有特征。

识别复杂网络中的关键高阶交互

原文标题: Identifying critical higher-order interactions in complex networks

地址: http://arxiv.org/abs/2105.02763

作者: Mehmet Emin Aktas, Thu Nguyen, Sidra Jawaid, Rakin Riza, Esra Akbas

摘要: 复杂网络中的高级交互是两个或多个节点之间(即,超出边)之间的交互。关键的高阶交互是在信息传播中起关键作用并且主要影响网络结构和功能的交互。识别关键的高阶交互是一个重要的研究问题,涉及广泛的应用程序,例如信息传播,市场广告和谣言控制。本文提出了两个新的拉普拉斯算子,它们可以重新定义用于高级交互的经典图中心性度量。然后,我们使用敏感感染恢复(SIR)模拟模型比较重新定义的集中度度量。实验结果表明,所提出的方法在识别关键的高阶相互作用中很有希望。

基于数据融合的交通流量缺失概率模型

原文标题: A probabilistic model for missing traffic volume reconstruction based on data fusion

地址: http://arxiv.org/abs/2105.02777

作者: Xintao Yan, Yan Zhao, Henry X. Liu

摘要: 交通量信息对于智能交通系统至关重要。它是交通规划,道路设计和交通信号控制的关键输入。但是,由固定位置传感器(例如环路检测器)收集的交通量数据通常会遭受数据丢失和覆盖率低的问题。丢失的数据问题可能是由硬件故障引起的。低覆盖率问题是由于交通网络中固定位置传感器的覆盖范围有限,这限制了我们对网络级别流量的理解。为理解决这些问题,我们提出了一种融合固定位置传感器数据和探测车辆数据的概率模型,用于交通量重建。我们应用概率主成分分析(PPCA)来刻画交通量数据中的相关性。这项工作的创新贡献在于,我们还将探测车辆数据集成到框架中,这使得模型可以解决上述两个问题。使用真实的交通量数据集,我们证明了针对广泛研究的缺失数据问题,该方法优于最新方法。此外,对于低覆盖率的问题(大多数现有方法无法解决),所提出的模型也可以实现高精度。实验还表明,即使丢失率达到80%,所提出的方法仍能够以仅10%的探查车辆穿透率来准确估计未知交通量。结果验证了所提出模型的有效性和鲁棒性,并证明了其在实际应用中的潜力。

带辅助信息的社区检测的半定规划

原文标题: Semidefinite Programming for Community Detection with Side Information

地址: http://arxiv.org/abs/2105.02816

作者: Mohammad Esmaeili, Hussein Metwaly Saad, Aria Nosratinia

摘要: 本文为社区检测提供了一种有效的半定性编程(SDP)解决方案,该解决方案结合了非图数据,在这种情况下,它被称为辅助信息。 SDP是图上标准社区检测的有效解决方案。我们在观察图和非图数据的前提下,针对节点标签的最大似然估计制定了半确定松弛。此公式与标准社区检测的SDP解决方案不同,但保留了其所需的属性。我们计算三种非图信息的准确恢复阈值,在本文中将其称为辅助信息:部分显示的标签,嘈杂的标签以及每个节点具有任意但有限基数的多个观测值(特征)。我们发现,在附带信息存在的情况下,SDP具有与附带信息的最大可能性相同的确切恢复阈值。因此,对于在存在辅助信息的情况下的社区检测的解决方案,本文开发的方法在计算效率和渐近精确性方面都是有效的。仿真表明,本文的渐近结果也可以为中等大小的图提供SDP的性能。

声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

推荐阅读更多精彩内容