机构大数据建设全景

大数据是近几年出现的热词,现在已经是人人知道大数据,人人离不开大数据,任何机构都想搞大数据,任何行业也搞大数据,实际上大数据技术在上世纪八十年代就已经很成熟,而且早就开始应用在航天、水利等大型数据产生的场景,现在开始热炒只不过是由于随着信息化深入人的生活,获取信息的手段、获取到的范围都大幅度增长而进入了老百姓的生活,这一点在人口量巨大、世界持有手机数量最多,互联网用户最多、迫切需要互联网来进行行业洗牌的中国尤为明显,经过几年的发展,一些机构个人已经在大数据方面积累了经验,一批应用也已经开始落地,探索后完成了“初体验”,但我们还是看到,很多机构的应用停留在初步阶段,观望阶段,好看不实用阶段,今天我们来看看一个机构做大数据需要哪些必要或者可选的条件:

一、确实够“大”的数据。大数据之所以称之为大数据是因为很“大”的数据,这是起因,这也是能够实现有质量有深度挖掘的必要条件,大数据要有来源较广的数据,要有丰富的数据格式,要有大频率的数据产生节奏,数据量小了只能停留在统计,无法实现深度的挖掘,得不到真正想要的信息或者想要的规律很容易被人轻易发现而失去大数据的建设必要。

二、适量的部门数据整合且尽可能保证数据质量。数据量不光需要本部门产生的常见的业务数据,而且还需要整合本部门整个数据产生阶段的其他数据,整合其他协同业务部门的数据,规律甚至可能隐藏在非主要业务数据当中。当然,数据整合很可能涉及到行业数据壁垒的问题,关键的数据你能否拿到,如果拿不到能不能抓取到或者是用其他数据替代就是部门能力的问题。但数据量并非越大越好,大量数据的存储必然是大问题,造成成本不说甚至影响到性能负载。所以需要在数据量和自身信息化能力之间做一个平衡。光有量不行,数据质量是数据库的生命线,需要在数据产生阶段进行质量控制,其中,标准统一且属地控制、强化考核、源头控制防范、数据对比是解决数据质量的有效途径。 

三、有适合本行业的知识库积累。大数据需要行业只是积累来挖掘,否则只能是停留在算法层次,无法应用,更别提指导业务。数据挖掘人员或者大数据业务提供商必须对该行业业务进行深挖,甚至比业务使用人员更懂业务才行,因为就统计分析来讲,一类是预设性结果,一类是非预设性结果,预设性结果一般是常识性或者业务人员熟知的,只需要挖掘技术进行量化的分析,在程度上,比例上得到掌握。比如我们都知道共享单车出现后普通自行车销售的商家都大幅减少了,减少的程度怎么样?分析经营范围含有自行车销售的企业退出情况就知道了;如果知道一个企业的纳税、金融、注册、股东的状况,了解这个企业就很容易,以往做到这点几乎不可能,但现在整合了各个部门的数据后变得很轻松,方便了监管人员和社会大众监督。而另一类挖掘技术是非预设性结果,这类知识并非传统知识,如:地区工商注册资金和地区GDP之间存在关系吗?通过地区所有经济体的注册资本加和和GDP统计结果分析后发现存在一个线性关系,还有有人在欧洲杯期间发现比赛时女性购物的量大幅增加,从而在比赛开始前提高女性必需品的供货量和针对女性的促销活动而大赚。。。。类似这些都需要技术人员对业务的熟悉,对社会痛点、问题的感知才能得到有意义的结果。

四、建设内容及系统定位问题。大数据建设不可能一蹴而就,往往是初期先上一些简单的,好实现的分析内容,或者围绕目前的机构业务痛点先做,比如做销售的需要精准找出自己的目标客户,企业监管部门急需要找出疑似问题企业。

其次,大数据收集不同来源的数据,不可避免的涉及面广,肯定带来挖掘的信息不可避免的面宽,甚至得到宏观的挖掘内容,涉及其他部门的结论甚至是其核心业务,一方面这些挖掘内容是否能够用上,另一方面甚至会触及有些部门的“隐私”和利益。如舆情大数据很容易从微博和核心网站的词条点击量中得出群众关心的某些话题,这些话题是不适合公开讨论的。

五、展示及使用问题。挖掘是里子,展示是面子。有好的挖掘结果,同样合理的展示也很关键,选择什么样的展示图?饼图?云图?祖谱图?都需要下一番功夫或者根据不同的情景进行调整,展示的平台也是关键的,这让别人了解你的工作,是在大数据展示中心的大屏幕还是结论在网站的公开或者在其他媒体进行静态公开展示,这些都依照现实进行选择,也可以动态进行展示,一些简单的展示可以在网站及展示中心进行互动化展示,让使用者自己选择项目。

使用方面。大数据有时候很精准,有时候结论和现实是互相补充的,如:某时间段有多少人使用共享单车骑行距离超过10km以上,这很精准,但违法企业的疑似信息挖掘出后有时候不能立即判定企业违法,需要现实里的跟进,这时候大数据是辅助,单凭传统的企业检查或者企业信息监督很难实现企业监督有效,大数据对企业监督有很好的效果,迅速锁定疑似违规企业,然后跟进关注就有很好的效果,挖掘和现实里的证据找寻相得益彰。由于大数据的挖掘结论不好在法律层面定论,所以只是辅助手段。

六、立项及成本问题。大数据项目像其他的信息化项目一样,立项和资金来源等都需要关注,关于立项,要看是哪个部门要求建设:

如果是上级部门,那很有可能是有专项的资金支持,甚至还有专用的硬件设备支持,或者是专项资金,这类方式会得到支持关注还减轻资金压力。

如果是自身需要建设,自身提出,那建设的具体项目上就需要下点功夫,先紧着叫得响的、能实际应用的立马能见效的、或者本级领导感兴趣的分析项先提出来,形成报告,这样容易批准,这类可能需要自身单位掏的钱多,还需要尽可能争取。

如果还是不批准,那可以把这个项目以另外一个必建项目打包在一起,作为其中的一个模块功能来进行申报,等到实现后请上级领导来看或者产生效应后再进行下一步的建设申报就有大的可能性会批准。

七、最后,分享一些大数据硬软件技术方面的心得:

(一)尽量使用“云平台”。可购买一体化负载均衡的云平台,实现资源池的有效弹性伸缩,业务稳定性更好。而且云平台可以实时展现各系统当前的运行情况,做到一目了然。同时,网络安全方面使用云防护服务,而不是仅仅停留在硬件设备的单一购买叠加。

(二)如果可行,尽量不要使用ORACLE等集中性的结构化数据库,使用国产数据库,虽然性能不比国外高水平数据库,但可以搭建分布式集群,一方面大幅度降低成本,另一方面这种方式实现了国产化,国产化对于数据安全起到很好的作用。

------------------------

以上是本人在大数据建设过程中的一点经验,从数据到内容再到开发展示甚至还有系统硬软件等方面的一些知识,进行总结提炼,但限于个人水平和篇幅,很多方面并不全面深入,一些其他领域本人并不很了解,难免有些偏颇,不过还是希望给大家带来一些帮助,整理思路的同时少走弯路。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 156,907评论 4 360
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 66,546评论 1 289
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 106,705评论 0 238
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,624评论 0 203
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 51,940评论 3 285
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,371评论 1 210
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,672评论 2 310
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,396评论 0 195
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,069评论 1 238
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,350评论 2 242
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,876评论 1 256
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,243评论 2 251
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,847评论 3 231
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,004评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,755评论 0 192
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,378评论 2 269
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,266评论 2 259

推荐阅读更多精彩内容