Arxiv网络科学论文摘要9篇(2017-03-30)

西蒙的富者越富模式需要占主导地位的先发优势;
衡量大量书面表达的幸福：歌曲，博客和总统;
可靠性或可持续性：智能水网络中的最佳数据流估计和调度;
评估疫情预测的框架;
基于ArduSiPM的教育分布式宇宙射线探测器网络;
将工资透明度带入世界：通过LinkedIn计算强大的薪酬洞察力薪资;
气候变化有争议吗？利用人群中的争议建立争议模型;
宣传如何影响人口的意见动态？;
社区检测和随机块模型：近期发展;

西蒙的富者越富模式需要占主导地位的先发优势

作者： Peter Sheridan Dodds, David Rushing Dewhurst, Fletcher F. Hazlehurst, Colin M. Van Oort, Lewis Mitchell, Andrew J. Reagan, Jake Ryland Williams, Christopher M. Danforth

摘要：赫伯特·西蒙（Herbert Simon）经典的富者越富模型是能够为复杂系统产生重尾尺寸分布的最简单的经验支持机制之一。西蒙分析地认为，通过添加新元素或随机复制现有元素而增长的风味元素群体将通过幂律尾部分配群体大小。在这里，我们表明，事实上，西蒙的模型不会产生简单的幂律规模分布，因为初始元素具有主导先发优势，并且将被与创新概率的倒数成正比的因子超表示。第一组的尺寸差异不能被解释为模型的瞬态，因此可能比预期的要大很多数量级。我们展示了Simon的分析是否正确但不完整，并扩展了我们的备选分析，以量化所有群体的长期排名的变异性。我们发现，第一次复制的预期时间是无限的，并且显示了初级组织如何破坏机制以提高其成功的几率。我们提供一个特定领域的引用数量的例子，展示了一个先发优势，符合我们对丰富机制的修订观点。我们的研究结果要求重新审视以前的工作，引用西蒙的模式，并提供更广泛的理解。

衡量大量书面表达的幸福：歌曲，博客和总统

地址： http://arxiv.org/abs/1703.09774

作者： Peter Sheridan Dodds, Christopher M. Danforth

摘要：在人口水平上量化情感状态的性质和强度的重要性是显而易见的：我们想知道如何，何时以及为什么如果我们希望更好地建立公共政策，建立更多的公共政策成功的组织，从科学的角度，更全面地了解经济和社会现象。在这里，通过引入人们对单词的直接评估，我们对不同大小的文本进行了不断扩大的量词：歌曲名称和歌词，网络日志以及国情咨文。我们的方法是透明，可改进的，能够快速处理Web规模的文本，并超越基于粗略分类的方法。在一些观察中，我们发现歌词的幸福从20世纪60年代到90年代中期趋于下降，而在类型之间保持稳定，博客的幸福从2005年到2009年稳步增长，呈现惊人的上升和下降博客年龄和赤道的距离。

可靠性或可持续性：智能水网络中的最佳数据流估计和调度

地址： http://arxiv.org/abs/1703.09781

作者： Sokratis Kartakis, Shusen Yang, Julie A. McCann

摘要：作为典型的网络物理系统（CPS），智能配水网络要求对采样率高的地下水管进行监测，以进行精确的数据分析和水网控制。由于地下无线信道质量差和远距离通信要求，通常采用高传输功率来传送高速传感器数据流;对长期可持续监测构成挑战。在本文中，我们开发了第一个可持续水资源传感系统，利用水流的能量收集机会。我们的系统通过调度数据流的子集的传输来实现，而基于水网内的压力信号的声速传播，使用自回归模型来估计其他相关流。为了计算最优调度策略，我们形成随机优化问题，以最大化估计可靠性，同时确保系统在动态条件下的可持续运行。我们开发数据传输调度（DTS），一种渐近最优方案;和FAST-DTS，一种可以适应任意能量和相关动力学的轻量级在线算法。使用我们智能水系统部署170天的实际数据，并对我们的小型测试台进行体外实验;我们的评估表明，考虑到数据可靠性，能源利用和可持续运营，Fast-DTS显着优于三种替代方案。

评估疫情预测的框架

地址： http://arxiv.org/abs/1703.09828

作者： Farzaneh Sadat Tabataba, Prithwish Chakraborty, Naren Ramakrishnan, Srinivasan Venkatramanan, Jiangzhuo Chen, Bryan Lewis, Madhav Marathe

摘要：背景：近几十年来，在流行病预报领域提出了许多预测方法。这种方法可以分为不同的类别，如确定性与概率，比较方法与生成方法等。在一些比较流行的比较方法中，研究人员比较了疫情早期发现的流行病学数据与拟议模型的产出，以预测未来大流行趋势和流行率。在这一领域的一个重大问题是缺乏标准的明确的评估措施来选择不同的最佳算法，以及为特定算法选择最佳配置。结果：在本文中，我们提出了一个评估框架，允许结合不同的特征，误差度量和排名模式来评估预测。我们描述了包含的各种流行特征（Epi特征），以表征预测方法的输出，并提供可用于评估方法相对于这些Epi特征的准确性的适当的误差度量。我们专注于长期预测而不是短期预测，并通过评估在美国预测流行性感冒的六种预测方法来证明该框架的效用。我们的研究结果表明，即使对于单个Epi功能，不同的误差措施也会导致不同的排名。此外，我们的实验分析显示，当通过误差测量进行评估时，没有一种方法可以预测所有Epi特征。作为替代方案，我们提供各种共同排名模式，总结个人排名，从而考虑不同的错误措施。我们认为，本文提出的综合评估框架将为计算流行病学界增添价值。

基于ArduSiPM的教育分布式宇宙射线探测器网络

地址： http://arxiv.org/abs/1703.09843

作者： V Bocci, G Chiodi, P Fresch, F Iacoangeli, L Recchia

摘要：具有足够CPU功率的微控制器以及模拟和数字外围设备的出现使得可以在一个微控制器芯片周围设计具有相对采集系统的完整的粒子检测器。随着互联网的存在，世界各地的数据基础设施允许设计能够精心制作和发送数据或响应设置命令的廉价检测器的分布式网络。互联网基础设施能够将绝对时间（精确度为几毫秒）分配到距离几米到几千公里的几毫秒精确的简单设备。因此，可以创建一个公民科学的众包实验，使用小型基于闪烁的粒子检测器来监测高能宇宙射线和辐射环境。

将工资透明度带入世界：通过LinkedIn计算强大的薪酬洞察力薪资

地址： http://arxiv.org/abs/1703.09845

作者： Krishnaram Kenthapadi, Stuart Ambler, Liang Zhang, Deepak Agarwal

摘要：最近推出的LinkedIn薪资产品旨在实现通过薪酬透明度帮助世界专业人士优化盈利潜力的愿景。我们描述了本产品底层薪资建模系统的整体设计和架构。我们专注于设计和实施系统中的独特数据挖掘挑战，并描述了异常值检测和贝叶斯分层平滑等建模组件，有助于计算并向用户提供强大的补偿见解。我们报告了广泛的评估，近一年来从超过一百万的LinkedIn用户收集的匿名补偿数据，从而证明了统计模型的有效性。我们还通过在LinkedIn部署我们的系统，突出了经验教训。

气候变化有争议吗？利用人群中的争议建立争议模型

地址： http://arxiv.org/abs/1703.10111

作者： Shiri Dori-Hacohen, Myungha Jang, James Allan

摘要：越来越多的研究集中在计算上检测有争议的话题，并了解人们对此的看法。然而，我们对如何界定争议，如何表现和如何衡量它们的理论和实际理解仍然存在差距。在本文中，我们引入了一个我们称之为“争用”的新颖的措施，就一个话题和一个人而言。我们从数学角度来论证争议。我们通过检查多种来源来验证我们的模型：真实世界的投票数据集，实际的选民数据和Twitter覆盖的几个主题。在我们公开发布的Twitter数据集近100万个推文中，我们研究了诸如Brexit，2016年美国选举和“The Dress”等几个主题，并与其他来源进行了交叉引用。我们表明，争议措施对各种观察现象具有解释力，如对气候变化的争议和科学共识的其他议题。最后，我们重新审视争议的概念，提出一个在人口方面定义的理论框架。我们提出初步证据，表明争议是与其他诸如“重要性”的争议的一个方面。我们的新争议措施，以及假设的争议模式，提出了在这个新兴的跨学科研究领域未来工作的几个途径。

宣传如何影响人口的意见动态？

地址： http://arxiv.org/abs/1703.10138

作者： Jithender J. Timothy

摘要：我们分析使用计算机模拟，在一个人群中不断地与用户生成的内容（即互联网）的共同来源进行交互的人群中的观点的演变，并且也受到宣传。该模型基于有限置信度方法。在没有宣传的情况下，电脑模拟显示，在某些问题或意识形态上，整体在线人口是分散的，两极分化的或完全和谐的，这取决于个人接受不接近的意见的不确定性。将模型应用于模拟激进化，我们观察到，一部分在线人口，受到极端主义宣传激进化，取决于其预先设想的意见和意见不确定性。我们观察到，防止激进化的最佳反宣传不一定是中间派。

社区检测和随机块模型：近期发展

地址： http://arxiv.org/abs/1703.10146

作者： Emmanuel Abbe

摘要：随机块模型（SBM）是具有种群的随机图模型。它被广泛用作研究聚类和社区检测的典型模型，并且通常提供了研究网络和数据科学中出现的统计和计算权衡的沃土。本说明调查了关于信息理论和计算门槛以及各种恢复要求（如准确，部分和弱恢复（a.k.a，检测））在SBM中确定社区检测的基本限制的最新进展。讨论的主要结果是Chernoff-Hellinger阈值精确恢复的相变，Kesten-Stigum阈值的弱恢复的相变，部分恢复的最佳失真SNR折衷，SBM参数的学习和间隙信息理论和计算阈值之间。本说明还介绍了通过图形分割，半定义编程，线性化信念传播，经典和非追溯谱方法来实现极限的一些算法，特别是两轮算法。还讨论了一些开放性问题。

声明：Arxiv文章摘要版权归论文原作者所有，由本人进行翻译整理，未经同意请勿随意转载。本系列在个人博客网络科学研究速递进行同步更新，并提供RSS订阅。

最后编辑于：2017.12.06 06:36:36

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 159,290评论 4赞 363
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 67,399评论 1赞 294
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 109,021评论 0赞 243
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 44,034评论 0赞 207
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 52,412评论 3赞 287
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 40,651评论 1赞 219
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 31,902评论 2赞 313
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 30,605评论 0赞 199
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 34,339评论 1赞 246
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 30,586评论 2赞 246
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 32,076评论 1赞 261
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 28,400评论 2赞 253
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 33,060评论 3赞 236
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 26,083评论 0赞 8
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 26,851评论 0赞 195
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 35,685评论 2赞 274
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 35,595评论 2赞 270