Arxiv网络科学论文摘要24篇(2020-08-11)

基于不可靠数据的网络结构鲁棒贝叶斯推断;
加权模块化复杂网络中的主干提取;
从扩散模型的混合中推断网络以解决假新闻;
古典量化金融的倒抛物线世界：非均衡和非扰动金融视角;
MODEL：用于链路预测的基于Motif的深度特征学习;
大型网络：综述;
随机游走：算法与应用综述;
科学学中的预测方法及其应用：一项综述;
社会网络中的多元关系聚合学习;
对抗有向图嵌入;
分析网络的网络;
基于多种人口统计学特征的多样群体形成;
有向网络中社区检测的谱算法;
具有任意实际或理论度分布的随机增长模型;
流行病学监测与防范之间的差距;
联系人跟踪在缓解Covid-19传播方面的效率如何？数学建模方法;
通过基于社交媒体的交互对COVID-19进行机构级风险和响应交流的数据驱动推断;
墨尔本和悉尼的多中心动态：郊区的吸引力在房屋所有权层面划分了一个城市;
波斯Instagram用户检测机器人的行为建模;
ISTD-GCN：用于交通速度预测的迭代时空扩散图卷积网络;
集成和开放的COVID-19数据;
探索二部图中具有顶点参与度和连接强度的内聚子图;
故事情节可视化与无所不在的演员;
STAN：使用真实世界证据进行大流行预测的时空注意网络;

基于不可靠数据的网络结构鲁棒贝叶斯推断

原文标题： Robust Bayesian inference of network structure from unreliable data

地址： http://arxiv.org/abs/2008.03334

作者： Jean-Gabriel Young, George T. Cantwell, M. E. J. Newman

摘要：复杂网络的大多数经验研究都无法返回对网络结构的直接，无错误的度量。取而代之的是，它们通常依赖于经常容易出错且不可靠的间接测量。经验网络科学中的一个基本问题是在给定这种不可靠数据的情况下，如何对网络结构进行最佳估计。在本文中，我们描述了一种完全贝叶斯方法，用于从任何格式的观测数据中重建网络，即使该数据包含相当大的测量误差，并且该误差的性质和大小未知时。该方法是通过使用实际示例网络进行的教学案例研究引入的，并且经过专门调整以允许以最少的技术投入即可进行直接，计算有效的实施。实现该方法的计算机代码是公开可用的。

加权模块化复杂网络中的主干提取

原文标题： Extracting Backbones in Weighted Modular Complex Networks

地址： http://arxiv.org/abs/2008.03383

作者： Zakariya Ghalmane, Chantal Cherifi, Hocine Cherifi, Mohammed El Hassouni

摘要：网络科学提供了有效的工具来建模和分析复杂的系统。但是，为了了解网络的结构和拓扑特征，现实网络的规模不断扩大成为主要障碍。因此，在保留原始网络信息的同时将其映射到较小的网络是一个重要的问题。提取所谓的网络主干是一个非常具有挑战性的问题，通常可以通过粗粒度方法或基于过滤器的方法来处理。粗粒度方法通过对相似节点进行分组来减小网络大小，而基于过滤器的方法则通过基于统计属性丢弃节点或边来修剪网络。在本文中，我们提出并研究了两种基于过滤器的方法，它们利用重叠的社区结构来提取加权网络中的主干。确实，高度连接的节点（集线器）和重叠的节点是网络的核心。在第一种方法中，称为“重叠节点自我骨干”，该骨干仅由重叠节点及其邻居的集合构成。在第二种方法中，称为“重叠节点和集线器主干”，该主干由重叠节点和集线器的集合形成。对于这两种方法，只要保留具有单个连接组件的骨干网，就会从网络中删除权重最低的链接。已经对来自各个领域（社会，共同出现，协作，生物学和技术）和不同规模的真实世界加权网络进行了实验。结果表明，两种骨干提取方法都非常相似。此外，与最具影响力的替代过滤方法的比较表明，所提出的骨干网提取方法具有更大的能力来发现网络中最相关的部分。

从扩散模型的混合中推断网络以解决假新闻

原文标题： Network Inference from a Mixture of Diffusion Models for Fake News Mitigation

地址： http://arxiv.org/abs/2008.03450

作者： Karishma Sharma, Xinran He, Sungyong Seo, Yan Liu

摘要：旨在欺骗人们，影响公众舆论和操纵社会成果的虚假新闻的传播已经成为社交媒体上的紧迫问题。此外，社交媒体上的信息共享促进了病毒信息级联的传播。在这项工作中，我们专注于理解和利用虚假和合法内容的传播动态，以促进网络干预以减少虚假新闻。我们分析包含假新闻和真实新闻级联的真实世界Twitter数据集，以了解关于假新闻和真实内容的传播动态和用户行为的差异。基于分析，我们在社会网络图上将扩散建模为参数为 theta_T， theta_F 的独立级联模型（MIC）的混合；并从观察到的，未标记的级联推导用于监督扩散混合物模型的参数的无监督推理技术。使用推断的扩散动力学来确定影响真实和假内容传播的用户。所识别的有影响力的用户的特征揭示了为假新闻而识别的有影响力的用户与其在假新闻级联中的相对出现之间的正相关。识别出的有影响力的用户往往与病毒级联更多而不是病毒级联的主题有关。与真正的新闻有影响力的用户相比，确定的虚假新闻有影响力的用户的直接关注者数量相对较少。对节点和边的干预分析证明了推断的扩散动力学在支持缓解网络干预方面的能力。

古典量化金融的倒抛物线世界：非均衡和非扰动金融视角

原文标题： The Inverted Parabola World of Classical Quantitative Finance: Non-Equilibrium and Non-Perturbative Finance Perspective

地址： http://arxiv.org/abs/2008.03623

作者： Igor Halperin

摘要：从基于物理学的角度看，经典的定量金融模型（例如，几何布朗运动）或其后来的扩展（例如，局部或随机波动率模型）没有意义，因为它们都等效于带有噪声的负质量振荡器。本文提出了一种基于物理学的见解的替代方案。

MODEL：用于链路预测的基于Motif的深度特征学习

原文标题： MODEL: Motif-based Deep Feature Learning for Link Prediction

地址： http://arxiv.org/abs/2008.03637

作者： Lei Wang, Jing Ren, Bo Xu, Jianxin Li, Wei Luo, Feng Xia

摘要：链路预测在网络分析和应用中起着重要作用。最近，用于链路预测的方法已经从传统的基于相似度的算法发展为基于嵌入的算法。但是，大多数现有方法都无法利用现实世界网络与随机网络不同的事实。特别是，已知现实世界的网络包含主题，这些自然的网络构件反映了底层的网络生成过程。在本文中，我们提出了一种新颖的嵌入算法，该算法结合了网络模体来刻画网络中的高阶结构。为了评估其对链路预测的有效性，对三种类型的网络进行了实验：社会网络，生物网络和学术网络。结果表明，我们的算法比传统的基于相似度的算法要高20％，比基于嵌入技术的最新技术要高19％。

大型网络：综述

原文标题： Big Networks: A Survey

地址： http://arxiv.org/abs/2008.03638

作者： Hayat Dino Bedru, Shuo Yu, Xinru Xiao, Da Zhang, Liangtian Wan, He Guo, Feng Xia

摘要：网络是在顶点和链接方面表示复杂系统的典型表示形式，其中，网络组件之间的交互模式是复杂的。网络可以是不随时间变化的静态网络，也可以是随时间变化的动态网络。在网络规模爆炸性增长的新情况下，网络分析的复杂性有所不同。在本文中，我们介绍了一种称为大网络的新网络科学概念。大型网络通常是大规模的，具有复杂的高阶内部结构。本文提出了一个指导框架，从大网络的角度洞悉网络科学领域的主要主题。我们首先从微观，中观和宏观三个层次介绍大网络的结构特征。然后，我们讨论大型网络分析的一些最先进的高级主题。系统地介绍了大型网络模型和相关方法，包括排序方法，分区方法以及网络嵌入算法。然后回顾了大型网络中的一些典型应用，例如社区检测，链路预测，推荐等。此外，我们还指出了一些需要进一步研究的关键开放问题。

随机游走：算法与应用综述

原文标题： Random Walks: A Review of Algorithms and Applications

地址： http://arxiv.org/abs/2008.03639

作者： Feng Xia, Jiaying Liu, Hansong Nie, Yonghao Fu, Liangtian Wan, Xiangjie Kong

摘要：随机游走被称为随机过程，它描述了一条路径，该路径包括数学空间中的一系列随机步骤。它在数学和计算机科学等各个学科中越来越受欢迎。此外，在量子力学中，量子游走可以被视为经典随机游走的量子类似物。经典的随机游动和量子游动可用于计算节点之间的邻近度并提取网络中的拓扑。各种随机行走相关模型可以应用于不同领域，这对下游任务（如链路预测，推荐，计算机视觉，半监督学习和网络嵌入）具有重要意义。在本文中，我们旨在提供对经典随机游走和量子游走的全面综述。我们首先回顾经典随机游动和量子游动的知识，包括基本概念和一些典型算法。我们还从时间复杂度的角度比较了基于量子游走和经典随机游走的算法。然后我们介绍它们在计算机科学领域的应用。最后，我们从效率，主内存量和现有算法的计算时间的角度讨论未解决的问题。本研究旨在通过共同探索随机游走和量子游走，为这一不断发展的研究领域做出贡献。

科学学中的预测方法及其应用：一项综述

原文标题： Prediction Methods and Applications in the Science of Science: A Survey

地址： http://arxiv.org/abs/2008.03640

作者： Jie Hou, Hanxiao Pan, Teng Guo, Ivan Lee, Xiangjie Kong, Feng Xia

摘要：科学科学已成为热门话题，引起了研究界的极大关注。数据分析技术的发展和现成的学术数据使对数据驱动的预测的探索成为可能，这在发现科学影响趋势方面起着关键作用。在本文中，我们分析了科学中数据驱动的预测中的方法和应用，并讨论了它们的意义。首先，我们介绍了背景并回顾了科学科学的现状。其次，我们回顾基于论文引用计数的数据驱动的预测，并调查该领域的研究问题。然后，我们讨论了预测学者影响的方法，并分析了在协作网络中促进学术协作的不同方法。本文还讨论了未解决的问题和存在的挑战，并提出了潜在的研究方向。

社会网络中的多元关系聚合学习

原文标题： Multivariate Relations Aggregation Learning in Social Networks

地址： http://arxiv.org/abs/2008.03654

作者： Jin Xu, Shuo Yu, Ke Sun, Jing Ren, Ivan Lee, Shirui Pan, Feng Xia

摘要：多元关系普遍存在于各种类型的网络中，例如生物网络，社会网络，运输网络和学术网络。由于三元封闭的原理和群体形成的趋势，社会网络中的多元关系是复杂而丰富的。因此，在社会网络的图学习任务中，多元关系信息的识别和利用更为重要。现有的图学习方法是基于邻域信息扩散机制的，这往往导致部分遗漏甚至缺乏多元关系信息，最终影响任务的准确性和执行效率。为了应对这些挑战，本文提出了一种多元关系聚合学习（MORE）方法，该方法可以有效地刻画网络环境中的多元关系信息。通过聚合节点属性特征和结构特征，MORE可以实现更高的准确性和更快的收敛速度。我们在一个引文网络和五个社会网络上进行了实验。实验结果表明，在节点分类任务中，MORE模型具有比GCN（图卷积网络）模型更高的准确性，并且可以显著降低时间成本。

对抗有向图嵌入

原文标题： Adversarial Directed Graph Embedding

地址： http://arxiv.org/abs/2008.03667

作者： Shijie Zhu, Jianxin Li, Hao Peng, Senzhang Wang, Philip S. Yu, Lifang He

摘要：有向图的节点表示学习对于促进许多图挖掘任务至关重要。为了刻画节点之间的有向边，现有方法通常为每个节点学习两个嵌入向量，即源向量和目标向量。但是，这些方法分别学习源向量和目标向量。对于度数或度数非常低的节点，无法有效地学习相应的目标向量或源向量。在本文中，我们提出了一种基于生成对抗网络的新颖有向图嵌入框架，称为DGGAN。主要思想是使用对抗机制来部署鉴别器和两个生成器，以共同学习每个节点的源向量和目标向量。对于给定的节点，这两个生成器经过训练，可以从相同的基础分布中生成其伪造的目标节点和源邻居节点，而判别器的目的是区分邻居节点是真实的还是伪造的。这两个生成器被公式化为一个统一的框架，并且可以相互增强以学习更强大的源向量和目标向量。大量实验表明，在有向图上的多个图挖掘任务中，DGGAN始终显著优于现有的最新技术。

分析网络的网络

原文标题： Analysing Networks of Networks

地址： http://arxiv.org/abs/2008.03692

作者： Johan Koskinen, Pete Jones, Darkhan Medeuov, Artem Antonyuk, Kseniia Puzyreva, Nikita Basov

摘要：当这些网络本身通过某种形式的网络联系连接时，我们会考虑在网络上具有多个观察结果或报告的数据。我们可以以认知社会结构为例，在这种社会结构中，提供报告的参与者之间存在另一种纽带关系。或通过社交联系研究从一种文化领域到另一种文化领域的人际溢出效应。另一个例子是，个体语义结构被表示为一组参与者的语义网络，并通过这些参与者的社会纽带进行连接以构成一个社会群体的知识。如何联合表示两种类型的网络并非易事，因为所报告网络的层而不是层之间的节点是通过报告上的网络耦合的。我们建议使用线图来变换不同的多个网络，其中参与者与代表节点的联系相关，并将不同类型联系的总和表示为一个多级网络。这提供了研究社会网络与报告之间的关联以及将报告与标准图进行对齐的能力。我们将说明如何将该程序应用于研究当地防洪管理团体的知识社会建设。在这里，我们使用多级指数随机图模型，但表示形式也适用于面向随机参与者的模型，多级块模型以及任何能够处理多级网络的模型。

基于多种人口统计学特征的多样群体形成

原文标题： Diverse Group Formation Based on Multiple Demographic Features

地址： http://arxiv.org/abs/2008.03808

作者： Mohammed Alqahtani, Susan Gauch, Omar Salman, Mohammed Ibrahim, Reem Al-Saffar

摘要：组建团队的目标是组建一支团队来完成特定任务。使用算法来提高如此组建的团队的效率以及小组选择过程的效率。但是，由于算法本身或对其进行训练的数据，有可能使团队形成算法偏向少数群体。因此，建立公平的团队组成系统至关重要，该系统将人口统计信息纳入组建团队的过程中。尽管在建模个人专家以进行专家推荐和/或团队组建方面已开展了大量工作，但是在建模人口统计并将人口统计纳入组建过程中的工作相对较少。我们提出了一种新颖的方法来表示基于多维人口统计特征的专家人口统计资料。此外，我们介绍了两种多样性排序算法，这些算法通过考虑人口统计特征以及所需的最低技能来组成一个组。与许多考虑一种布尔人口统计特征（例如性别或种族）的排名算法不同，我们的多样性排名算法会同时考虑多个多值人口统计属性。我们使用基于计算机科学计划委员会成员的真实数据集评估提出的算法。结果表明，我们的算法构成了一个程序委员会，该委员会的功能更加多样化，实用性可以接受。

有向网络中社区检测的谱算法

原文标题： Spectral Algorithms for Community Detection in Directed Networks

地址： http://arxiv.org/abs/2008.03820

作者： Zhe Wang, Yingbin Liang, Pengsheng Ji

摘要：大型社会网络中的社区检测受到节点程度异质性的影响。引入了有向网络的D-SCORE算法，以通过在聚类之前采用邻接矩阵奇异矢量的元素比例来减少这种影响。统计学家引用网络获得了有意义的结果，但是缺少对其性能的严格分析。首先，本文为有向度校正块模型（Directed-DCBM）建立了该算法及其变体的理论保证。其次，本文通过使用原始网络的信息（而不是奇异矢量）将节点附加到社区核心之外，从而对原始D-SCORE算法进行了重大改进。

具有任意实际或理论度分布的随机增长模型

原文标题： A Random Growth Model with any Real or Theoretical Degree Distribution

地址： http://arxiv.org/abs/2008.03831

作者： Frédéric Giroire, Stéphane Pérennes, Thibaud Trolliet

摘要：复杂网络的度分布通常被认为是幂律。但是，对于大多数而言并非如此。因此，我们提出了一种新模型，该模型能够构建具有（几乎）任何所需程度分布的随机增长网络。学位分布可以是理论上的，也可以是从实际网络中提取的。主要思想是将通常用于计算度数分布的递归方程式求逆，以便找到用于节点连接的便捷附加函数-通常选择为线性。我们为一些经典分布计算此附加函数，如幂定律，折断幂定律，几何分布和泊松分布。我们还在Twitter网络的无向版本上使用该模型，其度数分布具有不寻常的形状。

流行病学监测与防范之间的差距

原文标题： On the Gap between Epidemiological Surveillance and Preparedness

地址： http://arxiv.org/abs/2008.03845

作者： Svetlana Yanushkevich, Vlad Shmerko

摘要：当代流行病学监测（ES）严重依赖数据分析。这些分析是流行病防范网络的关键输入；但是，此输入未集成到适合决策者或防备专家的形式。需要使用具有计算智能（CI）工具的决策支持系统（DSS）来弥合证据的流行病学模型与专家组决策之间的差距。我们认为，这样的DSS应该是一种认知动态系统，使CI和人类专家可以一起工作。这种DSS的核心必须基于机器推理技术，例如概率推理，并且应能够估计风险，可靠性和决策偏差。

联系人跟踪在缓解Covid-19传播方面的效率如何？数学建模方法

原文标题： How Efficient is Contact Tracing in Mitigating the Spread of Covid-19? A Mathematical Modeling Approach

地址： http://arxiv.org/abs/2008.03859

作者： T. A. Biala, Y. O. Afolabi, A. Q. M. Khaliq

摘要：接触追踪（CT）是政府和卫生官员为减轻新型冠状病毒传播而采取的措施之一。在本文中，我们通过建立一个隔室模型来评估其对减轻病毒传播的影响，从而研究其功效。我们描述了对Covid-19的繁殖数量 mathcal R _c 的影响。特别是，我们讨论了模型参数的重要性和相关性，例如报告的案例数，跟踪和监视策略的有效性以及联系跟踪的传输速率。我们描述了完美跟踪''，完美监视''和``完美报告''这两个术语，以表示在孵化过程中将跟踪被跟踪的联系人，对被跟踪的联系人进行有效的监视以免引起继发性感染，并且分别报告所有感染者。我们考虑了三种特殊情况：（1）完美监视和完美跟踪已报告案件的联系人；（2）完美报告和完美监视已跟踪报告的案件；（3）完美报告和完美跟踪已报告案件的联系人。此外，我们对要追踪的联系比例下限，以确保有效复制 mathcal R _c 低于1，并以可观察到的数量描述 mathcal R _c 作为已报告和已跟踪案例的比例。使用从约翰·霍普金斯大学获得的美国某些州的Covid-19数据进行的模型模拟表明，即使CT的晚期干预也可以合理地减少Covid-19的传播，并减少住院高峰期和死亡人数。特别是，我们的研究结果表明，在孵化过程中有效跟踪病例追踪策略和跟踪追踪联系人比追踪更多联系人更为关键。

通过基于社交媒体的交互对COVID-19进行机构级风险和响应交流的数据驱动推断

原文标题： Data-driven Inferences of Agency-level Risk and Response Communication on COVID-19 through Social Media based Interactions

地址： http://arxiv.org/abs/2008.03866

作者： Md Ashraf Ahmed, Arif Mohaimin Sadri, M. Hadi Amini

摘要：公共机构通过社交媒体进行的风险和响应交流在新型冠状病毒（COVID-19）的出现和传播中发挥了重要作用，这种相互作用在其他信息渠道中也得到了回应。这项研究收集了对时间敏感的在线社交媒体数据，并使用数据驱动的方法分析了来自公共卫生（WHO，CDC），紧急情况（FEMA）和交通运输（FDOT）机构的这种沟通方式。工作范围包括详细了解机构在大流行期间如何通过社交媒体传达风险信息并影响社区响应（即锁定时间，重新开放时间）和疾病爆发指标（即确诊病例数，死亡人数）。数据包括来自不同机构的Twitter交互（平均每个机构2150万条推文）以及关于COVID-19病例和死亡的众包数据（即Worldometer），并在2020年2月21日至2020年6月6日之间观察到死亡。几种机器学习技术，例如（即主题挖掘和情感评级随时间变化）在此处用于识别在此空前时间里出现的主题的动态。结果的时间信息图表记录了机构级别随时间传播的有关面部遮盖，家庭隔离，社交距离和联系追踪的重要性的信息。此外，各机构在有关社区传播，缺乏个人防护设备，测试和医疗用品，烟草使用，疫苗，精神健康问题，住院，飓风季节，机场，建筑工程等方面的讨论中也存在分歧。随着社区转移到新的常态以及未来的大流行中，调查结果可以支持更有效地转移风险和响应信息。

墨尔本和悉尼的多中心动态：郊区的吸引力在房屋所有权层面划分了一个城市

原文标题： The Polycentric Dynamics of Melbourne and Sydney: Suburb attractiveness divides a city at the home ownership level

地址： http://arxiv.org/abs/2008.03884

作者： Emanuele Crosato, Mikhail Prokopenko, Michael S. Harré

摘要：大城市地区的城市动态是由社会，经济和政治因素（包括人口分布，财富流动和基础设施要求）之间复杂的相互作用导致的。我们针对2011年和2016年针对大悉尼和墨尔本地区的城市动态开发了经人口普查校准的模型，从抵押贷款和租金分布的角度突出了这两个城市的人口分布变化和住房市场结构。我们表明，在房客和抵押持有人之间存在同质化的趋势：房客倾向于聚集在更靠近商业中心的地方，而抵押人则倾向于在这些中心的郊区居住。我们还确定了一个临界阈值，这两个城市的长期演变将在“蔓延”和“多中心”的构型之间分叉，这表明从长远来看，这两个城市都位于临界点的多中心一侧。重要的是，在房客和抵押持有人之间，这些中心趋势存在差异。表征抵押人的多中心模式集中在商业中心附近，我们证明了新兴的住房模式遵循穿过城市的主要运输路线。

波斯Instagram用户检测机器人的行为建模

原文标题： Behavioral Modeling of Persian Instagram Users to detect Bots

地址： http://arxiv.org/abs/2008.03951

作者： Muhammad Bazm, Masoud Asadpour

摘要：僵尸程序是社交媒体中的用户帐户，由计算机程序控制。与许多其他事物类似，它们用于善恶目的。对他们来说，一个邪恶的用例是在网络中散布错误信息或有偏见的数据。基于社交媒体数据进行的研究很多，其结果的有效性受到有害数据僵尸程序传播的极大威胁。因此，需要有效的方法和工具来检测僵尸程序，然后删除由僵尸程序传播的误导性数据。在本研究中，提出了一种检测Instagram僵尸程序的方法。没有数据集，包括Instagram僵尸程序样本和真实帐户，因此，当前的研究始于针对普遍性问题收集此类数据集，以便每个组中包含1,000个数据点。主要方法是有监督的机器学习，并且与深度神经网络相比，经典模型更为可取。使用多种方法（从10倍交叉验证开始）评估最终模型。之后，对分类研究充满信心，然后进行特征重要性分析和针对模型计算的目标概率的特征行为。最后，设计了一个实验来衡量模型在操作环境中的有效性。最后，强烈得出结论，该模型在所有评估实验中均表现出色。

ISTD-GCN：用于交通速度预测的迭代时空扩散图卷积网络

原文标题： ISTD-GCN: Iterative Spatial-Temporal Diffusion Graph Convolutional Network for Traffic Speed Forecasting

地址： http://arxiv.org/abs/2008.03970

作者： Yi Xie, Yun Xiong, Yangyong Zhu

摘要：现有的大多数用于交通速度预测的算法将空间特征和时间特征划分为独立的模块，然后将这两个维度的信息相关联。但是，来自空间和时间维度的要素会相互影响，分开的提取会隔离此类依赖性，并可能导致结果不准确。在本文中，我们结合了信息传播的观点来同步地建模空间特征和时间特征。直观上，顶点不仅将信息扩散到附近，而且还扩散到随后的状态以及时间维度。因此，我们可以将这种异构的时空结构建模为均匀的扩散过程。在此基础上，我们提出了一种时空扩散图卷积网络（ISTD-GCN）来同步提取时空特征，从而可以更好地建模这两个维度之间的依存关系。在两个交通数据集上进行的实验表明，我们的ISTD-GCN在交通速度预测任务中的性能优于10个基线。源代码可从https://github.com/Anonymous获得。

集成和开放的COVID-19数据

原文标题： Towards Integrated and Open COVID-19 Data

地址： http://arxiv.org/abs/2008.04045

作者： Georgios M. Santipantakis, George A. Vouros, Christos Doulkeridis

摘要：受与COVID-19大流行相关的全球动荡的激励，我们提出了一个基于本体的，整合来自各个国家的国家数据的系统原型。来自COVID的相关数据是从不同的机构以不同的时空粒度以不规则的格式以不同的格式发布的。因此，这阻碍了联合数据的探索和利用，这可能导致科学家获得重要的见解，而不必处理繁琐的数据采集和集成任务。出于这一缺点，我们提出了一种数据采集，基于本体的数据表示以及将数据转换为RDF的方法，该方法还可以与其他公共可用数据源进行互连。目前，已经成功整合了来自以下欧洲国家/地区的数据：奥地利，比利时，法国，德国，希腊，意大利和瑞典。知识库将自动更新，并且可以通过SPARQL端点和直接下载链接向公众公开。此外，我们展示了数据集成如何通过有意义的查询来实现时空数据分析和知识发现，而这些查询在其他情况下是不可行的。

探索二部图中具有顶点参与度和连接强度的内聚子图

原文标题： Exploring Cohesive Subgraphs with Vertex Engagement and Tie Strength in Bipartite Graphs

地址： http://arxiv.org/abs/2008.04054

作者： Yizhang He, Kai Wang, Wenjie Zhang, Xuemin Lin, Ying Zhang

摘要：我们提出了一个新颖的内聚子图模型，称为 tau -加强的（ alpha， beta）-core（表示为（ alpha， beta）_ tau -core），这是第一个同时考虑二部图中的连接强度和顶点接合。如果包含在至少 tau 的蝴蝶中（ 2 times2 -bicliques），则边是一条牢固的领带。（ alpha， beta）_ tau 核心要求在给定强度级别 tau 的情况下，较高或较低级别的每个顶点至少具有 alpha 或 beta 牢固的关系。为了最佳地检索（ alpha， beta）_ tau -core的顶点，我们构造索引 I _ alpha， beta， tau 来存储所有（ alpha， beta） _ tau 核。提出了有效的优化技术来改善指标构建。为了使我们的想法在大图上可行，我们建议使用二维索引 I _ alpha， beta，I _ beta， tau 和 I _ alpha， tau 选择性地存储顶点（ alpha， beta）_ tau -core中的某些 alpha， beta 和 tau 。 2D索引更节省空间，并且需要更少的构建时间，每个索引都可以支持（ alpha， beta）_ tau 核心查询。由于查询效率取决于输入参数和2D索引的选择，因此我们通过训练前馈神经网络来预测2D索引的最佳选择以最小化查询时间，从而提出一种基于学习的混合计算范式。大量实验表明，（ 1 ）（ alpha， beta）_ tau -core是刻画唯一且重要的内聚子图的有效模型。（ 2 ）的拟议技术可以显著提高索引构建和查询处理的效率。

故事情节可视化与无所不在的演员

原文标题： Storyline Visualizations with Ubiquitous Actors

地址： http://arxiv.org/abs/2008.04125

作者： Emilio Di Giacomo, Walter Didimo, Giuseppe Liotta, Fabrizio Montecchiani, Alessandra Tappini

摘要：故事情节的可视化描绘了社交互动的时间动态，因为它们描述了参与者（个人或组织）群体随时间变化的方式。故事情节可视化中的一个常见约束是演员不能同时属于两个不同的组。但是，此约束在某些应用场景中可能太过严格，因此我们通过允许参与者在任何时间点同时属于不同的组来推广模型。我们称此模型为无所不在的演员（SUA）的故事情节。对于我们的模型而言，至关重要的是，演员被表示为一棵树，而不是一条直线。我们描述了一种算法管道来计算SUA模型中的故事情节可视化效果，并讨论了有关发布数据的案例研究。

STAN：使用真实世界证据进行大流行预测的时空注意网络

原文标题： STAN: Spatio-Temporal Attention Network for Pandemic Prediction Using Real World Evidence

地址： http://arxiv.org/abs/2008.04215

作者： Junyi Gao, Rakshith Sharma, Cheng Qian, Lucas M. Glass, Jeffrey Spaeder, Justin Romberg, Jimeng Sun, Cao Xiao

摘要：目标：COVID-19大流行带来了许多挑战，需要立即引起注意。已经开发了各种流行病学和深度学习模型来预测COVID-19的爆发，但是所有模型都有局限性，会影响预测的准确性和鲁棒性。我们的方法旨在解决这些局限性，并通过以下方式做出更早，更准确的大流行爆发预测：（1）使用来自不同县和州的患者EHR数据来编码当地疾病状况和医疗资源利用状况；（2）考虑人口统计学上的相似性和地理位置之间的地理位置接近性；（3）将大流行传播动力学整合到深度学习模型中。材料和方法：我们提出了时空注意力网络（STAN）用于大流行的预测。它使用基于注意力的图卷积网络来刻画地理和时间趋势，并预测未来固定天数内的病例数。我们还设计了基于物理定律的损失项，以增强长期预测。约翰·霍普金斯大学（Johns Hopkins University）在美国所有县/市提供的大量真实患者数据和开源COVID-19统计数据均对STAN进行了测试。结果：在长期和短期预测上，STAN均优于SIR和SEIR和深度学习模型等流行病学建模方法，与最佳基准预测模型相比，均方根误差降低了多达87％。结论：通过使用来自现实世界患者数据和地理数据的信息，STAN可以更好地刻画疾病状况和医疗资源利用信息，从而提供更准确的大流行模型。借助基于大流行传播规律的正则化，STAN还可以获得良好的长期预测性能。

声明：Arxiv文章摘要版权归论文原作者所有，机器翻译后由本人进行校正整理，未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”（微信号netsci）和个人博客 https://www.complexly.cn （提供RSS订阅）进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。