Arxiv网络科学论文摘要24篇(2018-03-28)

  • 焦虑,酒精和学术:学生Facebook自白的大规模文本分析;
  • 推测潜在位置估计同质社会网络中的因果同伴影响;
  • 熟悉的陌生人:人类行为的集体规律;
  • 在Twitter上表征和检测心怀仇恨的用户;
  • 社会空间自组织映射:利用社交媒体评估相关地理位置对社会过程的暴露;
  • 在边和顶点验证各种三角形统计的大规模图生成;
  • 由人口景观辐射模型解释的引力模型;
  • 通过引用网络的PageRank来衡量学术声誉;
  • 组织的社会媒体分析:美国东北部公共和州图书馆案例研究;
  • 表征同性恋用户的推文中的疾病和障碍;
  • 具有度规则社区的网络的复制方程;
  • 网络考古学:网络历史可恢复性的相变;
  • 二维意见动态:领域粗化导致稳定的双极化和异常尺度指数;
  • 图关联矩阵的稀疏恢复:多项式时间保证和位置相关性能;
  • 未来高度可再生的欧洲电力系统的成本最优情景:探索天气数据,成本参数和政策约束的影响;
  • 在书和推文中的英文动词规则化;
  • 基于人群的多元谓词筛选文献综述;
  • 科学网络中的整合;
  • 网络科学方法模拟供应网络的出现和拓扑稳健性:回顾与展望;
  • 相关无序外扰下网络的意见动力学;
  • AgeGuess数据库:一个关于年龄在3-100岁之间的实际年龄和感知年龄的在线资源;
  • 热力学极限下合作的涌现;
  • Facebook的广告平台:新的攻击媒介和干预需求;
  • 你是你的元数据:使用元数据信息识别和混淆社交媒体用户;

焦虑,酒精和学术:学生Facebook自白的大规模文本分析

原文标题: Anxiety, Alcohol, and Academics: A Large-scale Textual Analysis of Student Facebook Confessions

地址: http://arxiv.org/abs/1506.05193

作者: Soubhik Barari

摘要: 自白网页在Facebook上很受欢迎,特别是在美国本科社区。这些页面允许用户匿名提交有关大学经验的招供信息,随后在公共论坛上播放。在本文中,我们分析了在线学生忏悔行为的几个解释性因素。总结近3万年的近20万份供稿信息,我们通过Mechanical Turk将潜在狄利克雷分配(LDA)与人体验证结合起来,从而可扩展地识别我们口供中的主题。在可能的情况下,我们还会将帖子与从Twitter分析的真实世界新闻事件进行匹配。我们发现,提供社会经济学和精神/身体健康的口供更常见于顶级,昂贵的私立本科院校,然而在学费和社会经济话语程度之间没有明显的趋势。虽然大学生最喜欢与学校相关的时间事件,但学生的确有意义地发布美国/世界新闻和政治事件。我们的研究结果表明,来自不同校园的本科生对不同的专题有不同的披露,而总体而言,随着时间的推移会以相似的模式发布,并获得关于精神健康和社会经济地位等限制性话题的口供支持。

推测潜在位置估计同质社会网络中的因果同伴影响

原文标题: Estimating Causal Peer Influence in Homophilous Social Networks by Inferring Latent Locations

地址: http://arxiv.org/abs/1607.06565

作者: Cosma Rohilla Shalizi, Edward McFowland III

摘要: 社会影响无法从纯粹的社会网络观测数据中识别出来,因为这种影响一般与同质潜伏相混淆,即节点的网络伙伴对节点的属性及其行为都有信息。我们表明,如果网络根据社区(随机块)模型或连续的潜在空间模型增长,那么潜在的同质性属性可以从全球社会关系模式中持续估计。此外,这些估计信息足够丰富,控制它们可以对加性模型中的社会影响效应进行无偏且一致的估计。对于社区模型,我们还提供了有限样本偏差的界限。这些是在存在潜在同质性的情况下一致估计社会影响效应的第一个结果,我们讨论推广它们的前景。

熟悉的陌生人:人类行为的集体规律

原文标题: Familiar Strangers: the Collective Regularity in Human Behaviors

地址: http://arxiv.org/abs/1803.08955

作者: Yan Leng, Dominiquo Santistevan, Alex Pentland

摘要: 1972年斯坦利·米尔格拉姆通过小规模实验确定了熟悉陌生人的社会现象。然而,关于在社会范围内揭示这一现象并同时调查熟悉的陌生人之间的社会关系的研究有限。在大型手机记录的帮助下,我们凭经验显示了安道尔在该国的关系。建立在时间和空间分布上,我们调查机制,尤其是引发这种现象的集体时间规律和空间结构。此外,我们探讨了通信网络上的社交距离与遭遇次数之间的关系,并且表明,较大数量的遭遇表示社会网络中较短的社交距离。对物理相遇网络的理解可能对理解流行传播和信息传播等现象具有重要意义。

在Twitter上表征和检测心怀仇恨的用户

原文标题: Characterizing and Detecting Hateful Users on Twitter

地址: http://arxiv.org/abs/1803.08977

作者: Manoel Horta Ribeiro, Pedro H. Calais, Yuri A. Santos, Virgílio A. F. Almeida, Wagner Meira Jr

摘要: 表征和检测仇恨言论的大多数方法都集中在在线社会网络中发布的\ textit {content}。由于OSN文本的不完整性和喧嚣以及仇恨言论的主观性,他们面临收集和诠释仇恨言论的缺陷。这些限制通常是以过分简化问题的约束为限,例如仅考虑包含仇恨相关单词的推文。在这项工作中,我们通过将重点转向\ textit {users}来部分解决这些问题。我们开发并采用了一种强大的方法来收集和注释仇恨用户,这些用户不直接依赖词典,而且用户在整个个人档案中注释了用户。这导致Twitter的转推图样本包含$ 100,386 $用户,其中$ 4,972 $被注释。我们还收集在数据收集之后的三个月内被禁止的用户。我们表明,可恨的用户在其活动模式,用词以及网络结构方面与普通用户不同。我们获得了类似的结果,比较了邻居的正常用户的仇恨和邻居,并暂停用户与活跃用户,增加了我们分析的稳健性。我们观察到可恨用户是密集连接的,因此将仇恨言语检测问题作为半监督学习的图表任务,利用Twitter上的连接网络。我们发现利用图结构的节点嵌入算法优于基于内容的方法来检测可恶($ 95 \%$ AUC vs $ 88 \%$ AUC)和暂停用户($ 93 \%$ AUC vs $ 88 \ %$ AUC)。总而言之,我们提出了一个以用户为中心的仇恨言论观点,为更好地发现和理解这一相关且具有挑战性的问题铺平了道路。

社会空间自组织映射:利用社交媒体评估相关地理位置对社会过程的暴露

原文标题: Socio-spatial Self-organizing Maps: Using Social Media to Assess Relevant Geographies for Exposure to Social Processes

地址: http://arxiv.org/abs/1803.09002

作者: Kunal Relia, Mohammad Akbari, Dustin Duncan, Rumi Chunara

摘要: 社交媒体为衡量种族主义和恐同症等态度提供了一个独特的窗口,这可能是人体免疫缺陷病毒(HIV)风险的相关社会决定因素。然而,单独的推文可能会很嘈杂,并且测量的风险暴露的现有地区,例如邮政编码,在管理上定义的边界的平均值,限制使用与社交媒体相关的精确地理信息。因此,我们需要一种方法来确定相关的,同质的社会态度。为了解决这个问题,我们增加传统的自组织映射(SOMs),拓扑约束聚类,并返回受控数量的非重叠聚类。我们的方法(称为社会空间SOMs,“SS-SOMs”)使用神经嵌入来进行文本分类和神经网络聚类,从而在语义和地理上最好地识别一致的社会态度区域。我们发现与传统的SOM和Zip代码相比,SS-SOM产生了均匀的,明确定义的和更加局部相似的区域,并且对缺失数据很有效。我们证明了这种新方法的空间代表社会态度的影响,它使用来自HIV高危人群的流动性数据,发现他们使用SS-SOM测量的种族主义和同性恋恐惧症的暴露程度相差高达42%使用基于邮编的措施。

在边和顶点验证各种三角形统计的大规模图生成

原文标题: On Large-Scale Graph Generation with Validation of Diverse Triangle Statistics at Edges and Vertices

地址: http://arxiv.org/abs/1803.09021

作者: Geoffrey Sanders, Roger Pearce, Timothy La Fond, Jeremy Kepner

摘要: 开发分布式图分析算法实现的研究人员需要图发生器,该图发生器通过有效地计算所需输出的地面真值解来生成图,以分享真实世界图(小世界,无标度,重拖尾分布)的具有挑战性的特性。基准测试中使用的电流发生器的重复性在这方面有些欠缺,因为它们具有随机性:所需图分析的输出只能与预期值进行比较,而不是确切的基本事实。非随机Kronecker产品图满足这些设计标准以进行多个图分析。在这里,我们展示了在生成Kronecker产品图时,可以便宜地计算出许多三角形参与的风味。给定两个具有邻接矩阵$ A $和$ B $的中等规模无标度图,它们的Kronecker产品图具有邻接矩阵$ C = A \ otimes B $。这样的图是高度可压缩的:$ | {\ cal E} | $边被表示在$ {\ cal O}(| {\ cal E} | ^ {1/2})$内存中,并且可以在分布式设置从小数据结构,使它们容易以压缩形式共享。许多有趣的图计算具有最坏情况下的复杂性界限$ {\ cal 0}(| {\ cal E} | ^ p)$,并且通常这些被减少到$ {\ cal O}对于Kronecker乘积图,当可以推导克罗内克公式时,根据$ A $和$ B $的相关计算得出对$ C $的寻求计算。我们重点推导三角形参与顶点的公式,$ {\ bf t} _C $,一个存储每个顶点参与的三角形数量的向量,以及三角形边参与量$ \ Delta_C $,一个稀疏矩阵存储每边的三角形数量。

由人口景观辐射模型解释的引力模型

原文标题: Gravity model explained by the radiation model on a population landscape

地址: http://arxiv.org/abs/1803.09067

作者: Inho Hong, Woo-Sung Jung, Hang-Hyun Jo

摘要: 了解人员流动模式背后的机制对于提高我们优化和预测流量的能力至关重要。两种代表性的流动模型,即辐射模型和引力模型,已经被广泛地相互比较,并与各种经验数据集进行了比较,但其基本关系远未得到充分理解。为了研究这种关系,我们首先通过生成场地的分形几何模型来对异质人口景观进行建模,然后通过为每个场地分配一个独立于幂律分布的人口。然后,将该人口景观的辐射模型与引力模型进行比较,根据人口景观的特性推导出引力模型中的距离指数,这通过数值模拟得到了证实。因此,我们根据异质人口景观的特性为距离指数的起源提供了可能的解释,使我们能够更好地理解受旅行距离约束的移动模式。

通过引用网络的PageRank来衡量学术声誉

原文标题: Measuring the academic reputation through citation networks via PageRank

地址: http://arxiv.org/abs/1803.09104

作者: Francesco Alessandro Massucci, Domingo Docampo

摘要: 对学术机构威望的客观评估是一项困难而激烈的辩论任务。在过去几年中,不同类型的大学排名被提出来量化世界上不同研究机构的卓越性。尽管在某些情况下遇到了批评,但大学排名的相关性正在得到越来越多的认可:事实上,排名对机构和政府层面的研究政策设计产生了重大影响。然而,对什么排名进行衡量的争论是持久的。在这里,我们通过衡量一个给定机构学术声誉的定量和可靠代理并评估其与不同大学排名的相关性来解决这个问题。具体而言,我们在五个不同科学Web科目类别中研究大学之间的引文模式,并在所得到的五个引文网络上使用\ pr_算法。我们工作背后的基本原理是,科学引用是由参考文献的声誉驱动的,因此预计PageRank算法的排名可以反映学术机构在特定领域的声誉。我们的研究结果允许仅基于硬文献计量数据来量化某一研究领域中一组机构的威望。鉴于所分析数据的数量,我们的调查结果具有统计上的稳健性,并且不易出现偏差,与排名机构经常采用的特别调查不相符,以获得类似的结果。因为我们的发现与ARWU学科排名非常相关,所以我们在论文中提出的方法可能会打开新的“学术排名”方法论的大门,这种方法超越了目前的方法,通过调整Academic Prestige的定性评估与其定量测量出版物影响。

组织的社会媒体分析:美国东北部公共和州图书馆案例研究

原文标题: Social Media Analysis For Organizations: Us Northeastern Public And State Libraries Case Study

地址: http://arxiv.org/abs/1803.09133

作者: Matthew Collins, Amir Karami

摘要: 像Twitter这样的社交网站为公共图书馆等组织提供了一个很好的机会来传播用于公共关系目的的信息。但是,有必要分析大量的社交媒体数据。这项研究提出了一种计算方法,以探索由美国东北部9个公共图书馆发布的推文内容。 2017年12月,这项研究从7个州图书馆和两个城市公共图书馆的Twitter账户中提取了超过19,000条推文。应用计算方法收集推文并发现有意义的主题。本文展示了图书馆如何使用Twitter代表他们的服务,并为不同组织提供评估其公共推文主题的起点。

表征同性恋用户的推文中的疾病和障碍

原文标题: Characterizing Diseases and disorders in Gay Users' tweets

地址: http://arxiv.org/abs/1803.09134

作者: Frank Webb, Amir Karami, Vanessa Kitzie

摘要: 缺乏关于经常被排除在国家人口统计学评估,健康研究和临床试验之外的女同性恋,双性恋,变性人和酷儿(LGBTQ)人群的健康问题的信息。因此,医学专家和研究人员对这些人群面临的健康差距缺乏全面的了解。幸运的是,公共可用的社交媒体数据(如Twitter数据)可用于支持公共卫生决策者和管理人员就LGBTQ人员做出的决策。本研究采用计算方法从同性恋用户那里收集有关健康相关主题的推文,并对这些主题进行建模。为了确定Twitter上男男性接触者与健康相关信息的性质,我们收集了来自177个活跃用户的数千条推文。我们使用可在未来研究中应用于其他LGBTQ子群体的框架对这些推文进行采样。我们根据ICD 10发现了7种类型的11种疾病,这些与已发表的研究和官方报告一致。

具有度规则社区的网络的复制方程

原文标题: Replicator equation on networks with degree regular communities

地址: http://arxiv.org/abs/1803.09146

作者: Daniele Cassese

摘要: 复制子方程是研究混合种群中演化动力学的基本工具之一。本文对演化图论的文献做出了贡献,为具有社区的连通网络家族提供了一个复制方程式的版本,同一社区中的节点具有相同的程度。这个复制方程适用于不同类型博弈的研究,探索图结构对演化动力学平衡的影响。

网络考古学:网络历史可恢复性的相变

原文标题: Network archaeology: phase transition in the recoverability of network history

地址: http://arxiv.org/abs/1803.09191

作者: Jean-Gabriel Young, Laurent Hébert-Dufresne, Edward Laurence, Charles Murphy, Guillaume St-Onge, Patrick Desrosiers

摘要: 网络增长过程可以理解为复杂网络结构和历史的生成模型。这种观点自然会导致网络考古学的问题:从网络结构中重构网络的所有过去状态---一个困难的排列推理问题。在本文中,我们引入了贝叶斯网络考古学的表述,并将优先依恋的概括作为我们的生成机制。我们开发了一个顺序重要性抽样算法来评估这个模型的后验平均值,以及一个在线性时间内揭示网络历史的高效启发式算法。当这些方法应用于模型本身生成的人工网络时,我们使用这些方法来识别和描述重建历史质量的相变。尽管存在一个没有恢复的阶段,但我们发现在参数空间的大部分以及经验数据中可能存在非平凡推论。

二维意见动态:领域粗化导致稳定的双极化和异常尺度指数

原文标题: Opinion dynamics in two dimensions: domain coarsening leads to stable bi-polarization and anomalous scaling exponents

地址: http://arxiv.org/abs/1803.09363

作者: Fátima Velásquez-Rojas, Federico Vazquez

摘要: 我们研究了一个观点动态模型,该模型探讨了在二维正方点阵上的最近邻居相互作用试剂群体中说服与妥协之间的竞争。每个代理人可以持有积极或消极的意见导向,并可以有两个级别的强度 - 中等和极端主义。当两个相互作用的代理人具有相同的方向时,会成为说服概率为$ p $的极端主义者,而如果他们具有相反的方向,则会变为温和的,折中概率为$ q $。这些更新规则导致形成具有粗糙动态的相同意见域,其取决于比率$ r = p / q $。人口最初演变为一个小$ r $的中央集权国家,其中领土由中等代理人组成,粗化不存在表面张力,并且形成一个双极化状态的大$ r $,其中领域由极端主义代理人和粗化由曲率驱动。极端意见上的共识最终在人口规模为$ N $和$ r $为$ \ t $ \ simeq r ^ { - 1} \ ln N $的小型$ r $和$ \ tau \ sim r ^ 2 N ^ {1.64} $大$ r $。当系统落入条纹状态时,双极化可能非常稳定,其中药剂组成单一水平,垂直或对角线条带。分析条纹动态趋向一致性可以获得$ \ tau $的近似表达式,这表明$ 1.64 $指数是条纹界面扩散和粗糙度属性的结果。

图关联矩阵的稀疏恢复:多项式时间保证和位置相关性能

原文标题: Sparse Recovery over Graph Incidence Matrices: Polynomial Time Guarantees and Location Dependent Performance

地址: http://arxiv.org/abs/1803.09631

作者: Mengnan Zhao, M. Devrim Kaba, René Vidal, Daniel P. Robinson, Enrique Mallada

摘要: 稀疏恢复中的经典结果保证了在字典上假设太强或NP难以检查的假设下精确重构稀疏信号。而且,这种结果在实践中可能过于悲观,因为它们是基于最坏情况的分析。在本文中,我们考虑在图上定义的信号的稀疏恢复,字典采用关联矩阵的形式。我们证明在这种情况下,可以根据图的循环的属性导出必要和充分的条件,这可以在多项式时间中检查。我们的分析进一步使我们能够得出与恢复有关的位置相关条件,而这些条件仅取决于与此支持相交的图表循环。最后,我们利用测量上的稀疏性属性来实现一种超越标准$ \ ell_1 $最小化的专门的基于子图的恢复算法。

未来高度可再生的欧洲电力系统的成本最优情景:探索天气数据,成本参数和政策约束的影响

原文标题: Cost optimal scenarios of a future highly renewable European electricity system: Exploring the influence of weather data, cost parameters and policy constraints

地址: http://arxiv.org/abs/1803.09711

作者: David P. Schlachtberger, Tom Brown, Mirko Schäfer, Stefan Schramm, Martin Greiner

摘要: 从高度可再生的电力系统模型导出的成本最优情景取决于具体的输入数据,成本假设和系统约束条件。考虑到风能,太阳能,水力发电,天然气发电,输电和不同储能选项的容量投资和运营,我们使用技术经济优化模型为30个欧洲国家的联网系统研究这种影响。我们观察到总体系统成本相对于输入天气数据具有相当的稳健性,并且适中地改变了成本假设。我们表明,围绕成本最优化配置的优化环境中的平坦方向经常允许系统规划者在不增加总成本的情况下在不同技术选项之间进行选择,例如在公共接受问题的情况下通过在海上替换海上风力发电能力。探索一系列二氧化碳排放限值表明,对于传输扩展适度的情景,与1990年的水平相比,减少约57%已经是成本最优的。对于更严格的CO 2 _2 $限制,燃气轮机产生的电力首先由增加的可再生能力所代替。非水力发电能力仅适用于低排放情景,以便提供必要的灵活性以满足剩余负荷峰值。

在书和推文中的英文动词规则化

原文标题: English verb regularization in books and tweets

地址: http://arxiv.org/abs/1803.09745

作者: Tyler J. Gray, Andrew J. Reagan, Peter Sheridan Dodds, Christopher M. Danforth

摘要: 英语在其整个生命周期中都发生了戏剧性的演变,现代演讲者的古英语在没有翻译的情况下会变得无法理解。这个过程的一个具体指标是从动词过去式不规则到规则(-ed)的形式。在这项研究中,我们使用两个截然不同的数据集来量化动词正则化的程度:(1)谷歌(2003--2008)扫描六年出版的书籍;(2)发布到Twitter的十年社交媒体消息(2008- -2017)。我们发现,在整个推特上,动词正规化的程度要大于英文小说书籍。对于美国相对于美国英语书籍的地理标记来说,规则化也更大,但对于英国相对于英国英语书籍的地理标记而言,情况正好相反。我们还发现美国各县在正规化方面有意义的区域差异。但是,一旦解释了人口差异,我们就没有发现与社会人口学变量(如教育或收入)之间的强相关性。

基于人群的多元谓词筛选文献综述

原文标题: Crowd-based Multi-Predicate Screening of Papers in Literature Reviews

地址: http://arxiv.org/abs/1803.09814

作者: Evgeny Krivosheev, Fabio Casati, Boualem Benatallah

摘要: 系统文献评论(SLR)是最常见和最有用的科学研究和出版形式之一。每年发布数以万计的单反,并且这个速度在所有科学领域都在增长。然而,执行一个准确,完整和公正的单反是一项艰巨和昂贵的努力。对于文献综述的所有阶段,特别是在纸质筛选阶段,通常都是如此,其中作者根据一些排除标准筛选了一组潜在的范围内的论文。为了解决这个问题,近年来,研究界开始探索人群的使用,以便更快,更准确,更廉价和无偏见地筛选论文。初步结果表明,即使对于相对复杂的评论,众包也是有效的。在本文中,我们推导和分析了一套基于人群筛选的策略,并且显示了一种自适应策略,该策略不断重新评估问题的统计特性,以最小化为每篇论文作出决策所需的投票数量,在成本和准确性方面胜过了一些非适应性方法。我们通过一系列众包实验验证了方法的适用性和结果,并讨论了我们认为通常对分类问题感兴趣的问题和算法的性质,其中物品通过一系列连续测试进行分类(因为它经常发生在医学上)。

科学网络中的整合

原文标题: Conformity in Scientific Networks

地址: http://arxiv.org/abs/1803.09905

作者: James Owen Weatherall, Cailin O'Connor

摘要: 科学家一般都会受到社会压力,包括与社区中其他人相一致的压力,这些压力会影响其认知目标的实现。在这里,我们分析一个网络认识论模型,在这个模型中,代理人,其他所有人都是平等的,更愿意采取符合他们邻居的行动。这种符合性偏好与代理人关于两种可能行为中的哪一种产生更好结果的信念相互作用。我们发现了一系列可能的结果,包括信念和行动中的稳定极化。模型结果对网络结构高度敏感。但总的来说,一致性对社区达成关于世界的准确一致的能力有负面影响。

网络科学方法模拟供应网络的出现和拓扑稳健性:回顾与展望

原文标题: Network Science approach to Modelling Emergence and Topological Robustness of Supply Networks: A Review and Perspective

地址: http://arxiv.org/abs/1803.09913

作者: Supun Perera, Michael Bell, Michiel Bliemer

摘要: 由于全球供应链网络(SCN)的日益复杂和相互关联的性质,最近的一系列研究已经将网络科学方法应用于SCN增长建模,并随后分析了各种拓扑特征,如鲁棒性。本文提供了:(1)全面回顾了文献中用于建模SCN的拓扑结构和鲁棒性的方法; (2)各种数据驱动研究中报告的现实世界SCN的拓扑特征总结; (3)讨论现有网络增长模型的局限性,以实际表示所观察到的SCN的拓扑特征。最后,通过基于适应度的生成网络模型,提出了一种新颖的观点来模拟实证研究中报告的SCN拓扑结构。

相关无序外扰下网络的意见动力学

原文标题: Opinion Dynamics on Networks under Correlated Disordered External Perturbations

地址: http://arxiv.org/abs/1803.10041

作者: Marlon Ramos, Marcus A. M. de Aguiar, Dan Braha

摘要: 我们研究了受到相关无序外部扰动影响的选民影响网络,并为完全连通的网络准确求解动态方程。该模型在无序单峰和有序双峰分布状态之间存在临界相变,其特征在于均衡分布的投票共享变率增加。显示外部扰动中的随机异质性会影响网络相对于无障碍网络的关键行为。关键行为转变的规模基本上取决于外部影响障碍的总体波动。此外,外部扰动障碍也具有放大对已经有偏见的意见的预期支持的惊人效果。我们通过分析显示投票共享变率与外部影响波动直接相关。我们通过考虑肥尾多变量对数正态无序来扩展我们的分析,并提出证实我们分析结果的数值模拟。其他网络拓扑的仿真证明了我们研究结果的普遍性。了解复杂系统对无序外部扰动的动态响应可以解释各种网络系统,从社会网络和金融市场到无定形磁旋转和群体遗传学。

AgeGuess数据库:一个关于年龄在3-100岁之间的实际年龄和感知年龄的在线资源

原文标题: The AgeGuess database: an open online resource on chronological and perceived ages of people aged 3-100

地址: http://arxiv.org/abs/1803.10063

作者: J. A. Barthold Jones, U. W. Nash, J. Vieillefont, K. Christensen, D. Misevic, U. K. Steiner

摘要: 在许多发达国家,人类预期寿命在过去的180年中从40年增加到80年左右。这一巨大进步的基础是改变我们的年龄,但我们对这一改变的理解仍然有限。在这里,我们提供了一个独特的数据库,丰富了研究人类衰老过程的可能性:AgeGuess.org数据库关于人们的感知和时间年龄。感知年龄(即人们对其他人看起来有多大)与生物年龄相关,这是衡量一个人健康状况的指标,与同龄同龄人的平均值相比较。确定生物学年龄通常涉及复杂的分子和细胞生物标志物。相反,将感知年龄作为生物学年龄的生物标志物,使我们能够通过公民科学项目收集大量有关生物学年龄的数据,人们可以通过这个http URL上传他们自己的图片并猜测其他人的年龄,并且还可以收集数据回顾性的,因为人们可以上传他们年轻时的照片或他们的父母和祖父母的照片。因此,我们可以研究感知年龄与年龄之间差距的时间变化,以解决问题,比如我们现在是否变老,或者是否延缓老龄化。这里介绍的感知年龄数据涵盖了从1877年到2014年的出生队列。自2012年以来,该数据库增长到现在包含大约20万个认知年龄猜测。来自120多个国家的4000多名公民科学家上传了约5000张面部照片。我们详细介绍了如何收集数据,可以免费下载数据的位置以及所包含的变量。除了老化研究之外,数据还提供了大量可能性来研究人类如何猜测年龄,并将这些知识用于推进和测试新兴的人工智能和深度学习算法应用。

热力学极限下合作的涌现

原文标题: Emergence of Cooperation in the thermodynamic limit

地址: http://arxiv.org/abs/1803.10083

作者: Shubhayan Sarkar, Colin Benjamin

摘要: 预测合作行为如何在热力学极限中出现是演化博弈论中的一个突出问题。对于双人博弈,合作很少是纳什均衡。然而,在热力学极限合作中,无论我们是处理人类还是动物,合作都是自然的追求。在这项工作中,我们使用与Ising模型的类比来预测热力学极限中的合作是如何产生的。

Facebook的广告平台:新的攻击媒介和干预需求

原文标题: Facebook's Advertising Platform: New Attack Vectors and the Need for Interventions

地址: http://arxiv.org/abs/1803.10099

作者: Irfan Faizullabhoy, Aleksandra Korolova

摘要: 通过引入新工具(如自定义受众群体,行为定位和Audience Insights),广告定位功能变得越来越强大。虽然这对企业有利,因为它可以让人们接收更多相关的广告,但这些工具的力量有其不足之处。在本文中,我们着重讨论三个缺点:隐私侵犯,微小目标(即,能够在没有明确知识的情况下触及特定个人或个人,他们是广告唯一达到的人),并容易接近边化群体。使用Facebook的广告系统作为案例研究,我们证明了这些缺点的可行性。然后,我们讨论Facebook对调查结果负责任披露的回应,并呼吁开展额外的政策,科学和工程工作,以保护消费者适应快速发展的广告定位生态系统。

你是你的元数据:使用元数据信息识别和混淆社交媒体用户

原文标题: You are your Metadata: Identification and Obfuscation of Social Media Users using Metadata Information

地址: http://arxiv.org/abs/1803.10133

作者: Beatrice Perez, Mirco Musolesi, Gianluca Stringhini

摘要: 元数据与我们在数字世界的日常互动和交流中产生的大部分信息相关联。然而,令人惊讶的是,元数据通常仍然是非敏感的。事实上,过去,研究人员和从业人员主要关注从消息内容中识别用户的问题。在本文中,我们使用Twitter作为案例研究来量化元数据与用户身份之间关联的唯一性,并了解潜在混淆策略的有效性。更具体地说,我们分析元数据中的原子字段,并系统地将它们组合起来,努力将新推文归类为属于使用不断增加的复杂性的不同机器学习算法的账户。我们证明,通过监督学习算法的应用,我们能够以大约96.7%的准确度识别10,000组中的任何用户。而且,如果我们扩大搜索范围并考虑10个最有可能的候选者,那么我们将模型的准确性提高到99.22%。我们还发现,对于这种类型的数据,数据混淆是困难的和无效的:即使在扰乱了60%的训练数据之后,仍然有可能以高于95%的准确度对用户进行分类。这些结果对于元数据混淆策略的设计具有强烈的影响,例如对于数据集发布而言,不仅对Twitter而言,而且对于大多数社交媒体平台来说更普遍。

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,458评论 4 363
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,454评论 1 294
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,171评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,062评论 0 207
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,440评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,661评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,906评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,609评论 0 200
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,379评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,600评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,085评论 1 261
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,409评论 2 254
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,072评论 3 237
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,088评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,860评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,704评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,608评论 2 270

推荐阅读更多精彩内容