《自动报告| 信息过载时代的效率助手》

前言:如何处理金融信息过载的状况?自动化报告是解决海量金融信息的一种思路吗?未来的自动化报告又能承载哪些使命?本文是文因投研系统系列文章之二,欢迎大家一起探讨。

金融海量信息处理的智能增强

互联网时代,每个人都被信息的汪洋包围着,而作为金融从业者的我们,却是这种信息过载的受害者。我们要看国际新闻、宏观数据、政策变动、研报公告,我们要打开各种新闻门户、数据终端、行情软件。一切的有用的、没用的海量金融信息充斥在我们的周围,我们厌恶这种现状却又不能改变,因为我们害怕错过重要信息,哪怕有价值的信息只占你一天接触到的信息的百分之一。

这信息爆炸的时代,我们该改变了,我们迫切的需要借助技术的力量来让我们做个高效的信息捕食者。

在我们上一篇关于文因投研系统的文章《知识的共同体:重新定义投研系统》中曾提到——人与机器在智能的比较优势上有着明显差异,在信息处理速度、工作记忆、执行功能方面,不知疲倦的人工智能秒杀人类。机器更能胜任一些耐心,精准,庞杂工作,所以文因认为借助自然语言理解(NLU)及自然语言生成(NLG)等技术,我们将通过自动报告的形式来帮助金融人士做提高信息获取的智能助手。

自动报告的核心不在于报告,而是如何在海量的信息中提取关键要素并通过逻辑关联的方式,将最重要的信息推送给你。

金融自动化报告的现状

在中国,除去那些服务于各大媒体的“自动写稿机器人”之外,我们看到市场上出现以金融从业人士为服务中心的自动报告服务商寥寥无几,而望向大洋彼岸,我们在美国看到有这样的一家公司。
Automated Insights是一家提供资讯和报告生成服务的公司,他们主打产品是——Wordsmith自动化报告生成平台,主要用户包括美联社,yahoo等公司。

下图中的例子,当用户选择了一个财务数据表格时,Wordsmith根据这段数据生成了财务数据的描述信息,同时还关联到了Zack Investment Research对这个公司的财务报表的分析。这里我们可以看到,Wordsmith可以根据用户输入,不仅能自动生成报告,还能通过关联数据从而进一步丰富报告的内容。

image
那些“写稿机器人们”的底层技术相对来说比较直接,是基于模版的自然语言生成,整个叙述性文档的语法与结构等都是由模版定义好的,然后会根据具体的数据内容再做一些输出的局部调整。而我们相信自动化报告再向前进一步,就是引入更多的外部资源和数据来辅助文档的生成,演化成像Wordsmith那样的基于知识库或者知识图谱的数据关联和聚合。

文因互联在金融自动化报告的尝试

众所周知,文因互联致力于为新三板市场提供智能投研分析工具,而我们发现,当有新人踏入新三板投资研究领域的时候,他面临的最大一个困境就是对于这8000家新三板公司的信息缺失。不同于主板有无数的分析师、投资人、财经媒体在为这2000多家公司分析报道做信息增量,新三板8000家公司连研报覆盖率都只有区区7%的比例,所以唯一的线上信息来源就变成了每家公司厚厚200余页的股转书。可是阅读这8000份枯燥的股转书花费的时间实在令人难以忍受,而更甚的是未来三板的公司数量增加的势头还在保持。
所以文因决定帮你做这样一件事——基于股转书核心要素提取,我们基于一些投资人的经验,提取了10个关键要素点:

251560046883311118

我们将关于这个10个核心要素的内容从股转书中提取出来,再通过我们内部的清洗过的数据库自动完成行业对标及财务水平比较的工作,最终基于我们的NLG技术制作成带有信息图表的精美PPT。之前你需要花费半个小时、一个小时阅读完的文字版股转书,现在变成了一份只需5分钟就能看完的PPT,且信息依然保持着较高的含金量。我们相信通过这样的方式帮助你加速时间,做你信息获取的效率助手。

金融自动化报告——未来已来

关于未来的金融自动化报告,我们相信还可以基于知识图谱的技术走的更远。不仅仅于现有股转书、公告及研报的的数据抽取,我们会收集泛金融领域的海量信息,将结构化数据与领域知识图谱进行匹配和对比、建立关联;对结构化数据进行补充,筛选出真正有价值和值得关注的信息。

image (1)

关于未来自动化报告的表现层面,我们则相信有以下三个要点

  • 以分析为中心:金融自动化报告的未来不再是以描述性信息罗列为主,而是以产出带有分析价值的文档为主
  • 字段可自定义:功能模块化,用户可自定义选择他关心的要素点和信息源
  • 可重复的输出:报告的动态自动变化,变化数据自动更新。

在这里我们举个汽车行业的例子,试想有这样一位关注一家以汽车电泳涂料生产为主营的用户,TA基于自己的经验有了这样一个判断逻辑,即全国汽车销量的数据变化会影响到这家公司的主营业务,随后TA定义了一个【主营业务影响因子】的标签,将该公司主营业务的增长与全国汽车销量数据勾选关联起来,那么在TA的个性化报告文档中就能保持这一标签数据源的动态更新,随后,通过我们的技术联合全网的数据得到汽车行业的销售量在下降,再加上推理机的作用就可以得到公司的主营收入会下降的这样一个观点, 那么该自动报告文档就能将它的预警结果及时的提醒和推送给用户。
image (2)

上文中举例的自动化报告站在人的角度来说逻辑和操作也并不复杂,一个高级的投资经理甚至会有好几个助手来帮助TA去做这些收集和整理信息关联工作。但是作为地球上最高等的生物智能,我们完全应该从这种低价值劳动中解放出来,让机器来辅助我们完成这样的信息关联,而且机器通常比人完成的更好、更多和更快,这样我们才能有更多的时间去探索和思考形成自己的投资洞见。

金融自动化报告——未来已来,你是否期待见证这一过程,欢迎联系文因互联进行深入的探讨。


PS:这是基于本人的工作单位发表的文章,知识产权属于文因互联。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,458评论 4 363
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,454评论 1 294
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,171评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,062评论 0 207
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,440评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,661评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,906评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,609评论 0 200
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,379评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,600评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,085评论 1 261
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,409评论 2 254
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,072评论 3 237
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,088评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,860评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,704评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,608评论 2 270

推荐阅读更多精彩内容