Arxiv网络科学论文摘要12篇(2018-04-09)

  • 双向流中的行人旋转测量;
  • 寻找社区族谱:新社区如何从旧社区涌现;
  • 适用于规模化图学习的自适应扩散;
  • 使用递归神经网络在异步社交媒体流中建模流行性;
  • 使用链接的开放数据识别来自Micropost集合的主题;
  • 外汇交易和Twitter:垃圾邮件,机器人和信誉操纵;
  • 基于维基百科的社交媒体活动分析方法;
  • 一个破坏数字社区的简单招数;
  • 莫兰过程的相变和算法结果;
  • 字符限制如何影响Microposts的风格和成功:Twitter从140字切换到280字的情况;
  • 从比特币到比特币现金:网络分析;
  • 面向复杂系统的信息几何表征/分类:II. 来自(c,d)流形的临界参数值;

双向流中的行人旋转测量

原文标题: Pedestrians rotation measurement in bidirectional streams

地址: http://arxiv.org/abs/1610.07185

作者: Claudio Feliciani, Katsuhiro Nishinari

摘要: 这项研究提出了一个实验测量行人在双向流动中的身体旋转。使用放置在方位角位置的摄像头监控模型走廊,用于研究行人在单向和双向流动中的行为。此外,商用平板电脑被固定在样本行人的胸部,以检查他们的身体旋转(或偏航),这是单独使用位置跟踪无法获得的。记录角速度并同时使用无线网络存储在中央位置,从而以高采样率和有限的延迟分析身体运动。为了研究主要/次要流量比(流量比)对双向流的影响,测试了两种不同的情况:平衡配置(两个方向上流量相等)和不平衡配置(不同主要和次要流量)。结果清楚地表明,与双向情况相比,单向流动更稳定,需要更少的时间穿过实验部分并且在整个实验期间显示非常少量的旋转。两种双向配置均显示身体旋转的高值,特别是在车道形成和溶解过程中。最后,通过分析行人的轨迹,直接测量行人身体的旋转角度与间接获得的旋转角度进行比较。比较表明,至少从定性的角度来看,两种方法是一致的,因此表明甚至只能通过运动感测来测量的性质可以通过轨迹分析间接获得。总而言之,有人认为,尽管巷道有助于平滑双向流动,但与单向情况相比,可观察到更大的不稳定性。因此需要泳道分离和/或适当的指导。

寻找社区族谱:新社区如何从旧社区涌现

原文标题: Tracing Community Genealogy: How New Communities Emerge from the Old

地址: http://arxiv.org/abs/1804.01990

作者: Chenhao Tan

摘要: 新社区出现的过程是社会科学中的一个中心研究问题。虽然越来越多的研究通过研究个人之间的社会网络来分析单个社区的形成,但我们引入了一种以社区为中心的新视角。我们强调一个事实,即新社区出现的背景包含了许多现有的社区。我们通过追踪其早期成员以前的社区成员来揭示社区的新兴过程。我们的测试平台是Reddit,一个由数万个用户创建的社区组成的网站。我们分析一个跨越十年的数据集,其中包括从Reddit开始到2017年4月的Reddit上用户的发布历史。我们首先提出了一个用于在社区之间构建族谱图的计算框架。我们介绍这样的谱系图的第一次大规模描述。令人惊讶的是,尽管社区数量随着时间的推移迅速增加,但基本图属性(如父母数量和父母最大权重)会很快收敛。此外,我们调查了社区的起源与未来增长之间的关系。我们的研究结果表明,强大的父母关系与未来的社区发展息息相关,这证实了现有社区结构对新社区的重要性。最后,我们转向个人层面,考察早期成员的特征。我们发现,现有社区的多元化投资组合是成为新社区早期成员的最重要的预测指标。

适用于规模化图学习的自适应扩散

原文标题: Adaptive Diffusions for Scalable Learning over Graphs

地址: http://arxiv.org/abs/1804.02081

作者: Dimitris Berberidis, Athanasios N. Nikolakopoulos, Georgios B. Giannakis

摘要: 基于扩散的分类器(例如那些依赖个性化PageRank和Heat内核的分类器)在适度的计算要求下享有卓越的分类准确性。然而,它们的性能受所选扩散捕获通常未知的标签传播机制的程度的影响,其可能特定于底层图,并且对于每个类可能不同。目前的工作引入了一种训练有素,数据有效的方法来学习适用于底层网络拓扑的特定于类的扩散函数。这种新颖的学习方法利用了类特定的随机游走的“着陆概率”概念,可以有效地计算这些概念,从而确保大图的可伸缩性。严格分析模型的属性以及所提出的算法可以支持这一点。此外,即使在嘈杂的环境中,分类器的强大版本也有助于学习。真实网络上的分类测试表明,将扩散函数与给定图表和观察标签相匹配,显著改善了固定扩散的性能;达到 - 并且多次超越 - 依赖于节点嵌入和深度神经网络的计算量更大的现代竞争方法的分类准确性。

使用递归神经网络在异步社交媒体流中建模流行性

原文标题: Modeling Popularity in Asynchronous Social Media Streams with Recurrent Neural Networks

地址: http://arxiv.org/abs/1804.02101

作者: Swapnil Mishra, Marian-Andrei Rizoiu, Lexing Xie

摘要: 了解和预测在线项目的受欢迎程度是社交媒体分析中一个重要的公开问题。最近在数据驱动预测方面取得了很大进展,并将人气与外部促销联系起来。然而,现有方法通常关注单一来源的外部影响,而对于YouTube视频或新闻文章等多种类型的在线内容,注意力是由多个不同来源同时驱动的 - 例如,微博或传统媒体报道。在这里,我们提出RNN-MAS,一种用于建模异步流的递归神经网络。它是一个序列发生器,通过联合推理连接多个不同粒度的流。我们展示RNN-MAS不仅要超过目前最先进的Youtube流行预测系统17%,还要捕捉复杂的动态,如季节性的未知影响趋势。我们定义了两个新指标:促销评分量化Youtube视频的一个促销单元的受欢迎程度;响度级别捕捉特定用户对视频进行推特的效果。我们使用响度水平来比较一个受到高度关注的用户(前1%的最受关注用户)推动的视频的效果,而不是由一群中期关注的用户推广。我们发现结果取决于正在推广的内容类型:超级用户在推广Howto和Gaming视频方面更为成功,而常规用户队列对Activism视频更具影响力。这项工作提供了更准确和可解释的流行预测,以及内容制作商和营销商为促销活动分配资源的计算工具。

使用链接的开放数据识别来自Micropost集合的主题

原文标题: Identifying Topics from Micropost Collections using Linked Open Data

地址: http://arxiv.org/abs/1804.02158

作者: Ahmet Yıldırım, Suzan Uskudarli

摘要: 社交媒体广泛用于分享和获取信息,导致主题检测模型的发展,以促进理解大量的短期和分布式职位。概率主题模型(如潜在狄利克雷分配)将主题表示为对许多自动过程有用的术语集。然而,确定一个话题是关于什么是留给进一步的任务。或者,产生摘要的技术是人类可以理解的,但不太适合自动化处理。本工作提出了一种利用链接开放数据(LOD)资源从微博集合中提取语义表示主题的方法。所提出的方法利用实体链接从微博识别主题的元素。这些元素通过共现图相关联,这些图被处理以产生主题。这些主题使用为此目的而引入的本体来表示。该方法的原型用于确定11个数据集中的主题,包括在各种事件期间从Twitter收集的超过100万个帖子,如2016年美国大选辩论和Carrie Fisher的死亡。该方法的特点和超过5000个生成的主题进行了详细描述。从30个随机选择的时间间隔对人物进行评估,结果精度为81.0%,F1得分为93.3%。此外,它们与具有两种不同主题模型的相同数据集生成的主题进行比较。揭示信息的语义主题的潜力,这是不容易观察到的,用各种复杂性的语义查询来证明。

外汇交易和Twitter:垃圾邮件,机器人和信誉操纵

原文标题: Forex trading and Twitter: Spam, bots, and reputation manipulation

地址: http://arxiv.org/abs/1804.02233

作者: Igor Mozetič, Peter Gabrovšek, Petra Kralj Novak

摘要: 货币交易(外汇)是成交量最大的世界市场。我们分析三年期间欧元兑美元货币对的交易和推特。首先,手动标记大量推文,并构建推特姿态分类模型。然后,模型根据交易立场信号对所有推文进行分类:买入,持有或卖出(欧元兑美元)。通过应用金融经济学中众所周知的事件研究方法,Twitter的立场与实际货币汇率进行比较。事实证明,Twitter用户群体分布和潜在交易收益存在很大差异:交易机器人,垃圾邮件发送者,贸易公司和个人交易者。此外,我们观察到通过post ttstum删除具有较差预测的推文来消除名誉操作的尝试,以及删除/重新发布相同的推文,以增加可见性而不会污染Twitter的时间表。

基于维基百科的社交媒体活动分析方法

原文标题: A Wikipedia-based approach to profiling activities on social media

地址: http://arxiv.org/abs/1804.02245

作者: Christian Torrero, Carlo Caprini, Daniele Miorandi

摘要: 在线用户分析是一个非常活跃的研究领域,催化科学家和从业者的极大兴趣。在本文中,我们特别关注能够挖掘用户的社交媒体活动以创建丰富的用户配置文件的方法。我们看一下这样的情况,其中分析旨在沿着一组预定义的维度(我们称之为分类)表征用户的兴趣。传统的方式是使用语义分析技术来(i)从用户的在线对话中提取相关实体(ii)将所述实体映射到预定义的感兴趣类别。虽然实体提取是一个很好理解的主题,但映射部分缺少参考标准化方法。在本文中,我们建议在维基百科树上使用图导航技术来实现这样的映射。提供了一个原型实现,并报告了一些初步结果。

一个破坏数字社区的简单招数

原文标题: This One Simple Trick Disrupts Digital Communities

地址: http://arxiv.org/abs/1804.02251

作者: Philip Feldman, Aaron Dant, Wayne Lutters

摘要: 本文描述了一个基于智能体的仿真,用于模拟信念空间中的人类活动,信念空间是与意见相关的信息空间的高维子集。利用动物集体行为的见解,我们能够模拟和识别类似于游牧,群集和动物群体的动物模式的行为模式。这些行为在人际交往中具有类似的表现形式,作为孤独的探索者,时尚意识和极化回声室的成员出现。我们证明,广泛遍历信仰空间的一小部分游牧代理可以破坏更多的踩踏代理人。扩展模型,我们引入敌对行动的概念,不良行为者可以利用技术媒介沟通的属性来人为地创造自我维持的失控极化。我们称这种情况为皮什金效应,因为它回想起美国原住民猎人可能创造的大规模水牛踩踏事件。然后,我们讨论系统设计的机会,可以利用识别这些消极模式的能力,并讨论可能会破坏自然和故意回声室形成的可供性。

莫兰过程的相变和算法结果

原文标题: Phase Transitions of the Moran Process and Algorithmic Consequences

地址: http://arxiv.org/abs/1804.02293

作者: Leslie Ann Goldberg, John Lapinskas, David Richerby

摘要: 莫兰过程是一个随机算法,通过图来模拟基因突变的扩散。如果图连接,过程最终达到“固定”,其中每个顶点都是突变体,或“消失”,其中没有顶点是突变体。我们的主要结果是算法的预期运行时间几乎很紧。对于所有epsilon> 0,我们表明在n个顶点图上的预期运行时间是o(n ^(3 + epsilon))。事实上,我们证明它至多是n ^ 3 * exp(O((log log n)^ 3)),并且存在一个图表族,它是Omega(n ^ 3)。在证明我们的主要结果的过程中,我们还建立了固定概率的相变,取决于突变的适应度参数r。我们表明,对于有向图,没有类似的相变发生,其中已知预期的运行时间也可以是指数的。最后,我们给出了一个改进的FPRAS来逼近固定概率。当最大度数有界时,其运行时间与图的大小无关。

字符限制如何影响Microposts的风格和成功:Twitter从140字切换到280字的情况

原文标题: How Character Limits Affect the Style and Success of Microposts: The Case of Twitter's Switch from 140 to 280

地址: http://arxiv.org/abs/1804.02318

作者: Kristina Gligorić, Ashton Anderson, Robert West

摘要: 人们经常认为,制约因素在形式和质量方面都会影响创意生产。在线社交媒体平台经常对用户可以制作的内容施加限制,限制了可能的贡献范围。这些限制是否会促使创作者生产更多或更少的成功内容?创作者如何调整自己的贡献以适应社交媒体平台所施加的限制?在这项工作中,我们进行了匹配的观察研究来回答这些问题。 2017年11月7日,Twitter将推文的最大允许长度从140改为280,大大改变了它的签名限制。在我们的研究中,我们比较了在更改后发布相同长度的推文之前,近似或刚好有140个字符的推文。这种设置使我们能够描述用户如何改变他们的推文以适应约束,以及这会如何影响他们的推文成功。我们发现,为了响应长度限制,用户写得更简洁,使用更多的缩写和缩略形式,并使用更少的定冠词。此外,尽管总体推文成功率随着长度的增加而增加,但我们发现最初的证据表明,推荐符合140个字符约束的推文比删除约束时编写的类似长度的推文更为成功,这表明长度约束提高了推文质量。

从比特币到比特币现金:网络分析

原文标题: From Bitcoin to Bitcoin Cash: a network analysis

地址: http://arxiv.org/abs/1804.02350

作者: Marco Alberto Javarone, Craig Steven Wright

摘要: 在过去的几年里,比特币和区块链技术受到了不同科学界的广泛关注。值得注意的是,由于广泛的工业应用和加密货币的不断推出,即使是舆论也越来越关注这一领域。这些技术的基本结构构成了他们的核心概念之一。特别是,它们基于对等网络。因此,所有节点都处于同一水平,因此没有特权参与者的地位,例如传统金融网络中的银行机构。在这项工作中,我们对两个网络进行了初步调查,比如比特币网络和比特币现金网络。值得注意的是,我们的目标是分析其全球结构,并评估它们是否提供了小世界的行为。结果表明,被称为“适者生存”的原则,加上连接的不断增加,可能构成了导致这些网络达到目前结构的机制。此外,进一步的观察为通向这个方向的新调查打开了通路。

面向复杂系统的信息几何表征/分类:II. 来自(c,d)流形的临界参数值

原文标题: Towards an Information Geometric characterization/classification of Complex Systems. II. Critical Parameter values from the (c,d)-manifold

地址: http://arxiv.org/abs/1804.02384

作者: Demetris P.K. Ghikas, Fotios D. Oikonomou

摘要: 在我们先前的论文(I)中,我们用Hanel和Thurner(2011)的两个参数广义熵导出了信息几何对象,使用c,d参数作为相应流形的标签。在这里,我们采用完全不同的方法,将这些参数作为我们信息流形的坐标。这提供了一个易于操作的易于管理的二维流形,但最重要的是它提供了一对c,d值对的复杂系统的直接表征。因此,我们可以从标量曲线中获得某些特征值,我们可以推测它们代表具有特定行为的复杂系统。进一步观察到,表征Hanel-Thurner分类的c,d参数的边界值在某种意义上是单一的。这就要求我们试图建立一个正规化计划。

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 151,511评论 1 330
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 64,495评论 1 273
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 101,595评论 0 225
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 42,558评论 0 190
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 50,715评论 3 270
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 39,672评论 1 192
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,112评论 2 291
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 29,837评论 0 181
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 33,417评论 0 228
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 29,928评论 2 232
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,316评论 1 242
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 27,773评论 2 234
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,253评论 3 220
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 25,827评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,440评论 0 180
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 34,523评论 2 249
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 34,583评论 2 249

推荐阅读更多精彩内容