【DTalk专访】网易郑栋:BI、可视化数据产品和大数据的几个核心问题

郑栋,网易互联网分析产品、可视化 BI 产品负责人。

多年从事大数据技术相关工作,目前在网易杭州研究院负责管理互联网分析、敏捷BI两个数据分析产品线,在大数据技术、互联网业务数据体系建设、团队管理方面有丰富的经验。 负责过网易旗下多款产品如考拉海购、云音乐、云课堂、Lofter 等产品的数据体系建设,也有面向亿级用户打造应用分析、营销监测、用户行为分析、可视化分析产品的实战经验。

今天,我们就邀请郑栋先生聊一聊数据的实战观感。

问题1、传统bi和现在流行的可视化产品,有什么区别?

传统 BI,如 Oracle BIEE等,往往实施比较重,需要 IT 人员事先根据需求来进行建模,提前汇总数据。这样,报表会相对静态,如果需要对维度或度量进行更改,甚至需求发生变化,需要 IT 人员做模型修改,往往响应慢、耗时较长。

新型的敏捷 BI 则采用轻量建模的方式,数据直接连进来进行分析,业务人员可以实时方便快捷的进行维度、度量调整,真正做到和数据对话,进行数据探索。

当数据量大的时候,直连会有性能问题,敏捷 BI 会充分和大数据技术栈进行对接,以及自建 MPP 来响应大数量下的实时多维查询。当然,针对非常复杂的业务,也需要 IT 人员进行数据仓库建设,但只集中在基础数据建模,真正业务人员分析的数据,会尽可能多的开放给业务人员来自助进行数据分析和探索。

问题2、近几年来,Tableau,PowerBI, 网易有数 这些产品的发展,可以看到BI朝着越来越敏捷的方向去发展。在未来,这些工具,是不是能够让用户花更少的时间在数据分析的实现上(比如 代码的实现,侧重于技术层面)?对于用户而言,更重要的,是数据分析,数据解读的能力(也就是思维层面的,非技术层面的)?

这些工具主要目的就是为了把用户从数据处理等技术工作中解放出来,让人和数据随心沟通,通过数据分析、数据探索来推动业务决策。当然,技术层面的工作也不能完全没有,比如数据开发人员还是需要进行数据仓库的建设,但工作的重心会在对业务的理解和数据建模上面。

问题3、作为一个数据产品经理来说,您觉得如果给他三个能力标签,会是哪三个呢?

既懂产品设计、又懂数据分析、还要有较强的业务理解和用户沟通能力。

问题4、怎么设计数据产品能更节省开发资源与时间?

数据产品要能抓住用户痛点,从用户的诸多业务诉求中找寻共性,确定核心需求就可用小步快跑进行产品的迭代。尤其对于一些业务强依赖的数据产品,如果不进行需求控制,一味求大而全,或者完全按照用户的要求来,可能花了很多时间用了很多资源做出了很少人用的功能。另外,数据产品也要能做到数据驱动,如果有翔实的用户行为分析数据,知道用户是如何使用产品,对产品方向和产品功能的把控,会更高效和敏捷。

问题5、数据分析团队,目前的现状是底层的etl可能没有做好,需要从底层去取数据,如何提高代码使用的效率,能更好的满足业务人员的需求呢?

如果所有的取数都需要从底层去取,业务人员的需求可能会让数据分析团队疲于奔命,真实业务场景下,很难用一套共用代码来解决业务人员多变的需求。要解决这个问题,关键还是要把底层 ETL 做好,分层分业务进行数据仓库的建设,这样,一些业务人员的需求,甚至自己就可以通过 Adhoc 或者 BI 工具去取数和分析,数据分析师也可以有更多时间进行数据探索和发现的工作,数据开发人员从枯燥取数任务中解放出来,主力进行数据体系建设,进一步完善数据仓库。

问题6、算法,前端,后端,平台,数据,产品经理,商务,业务架构这些分工,他们是什么沟通协作的?

以我们团队来说,算法团队会负责智能图表推荐、智能问答查询方面的工作,前端主要负责产品前端和数据可视化,后端、平台等服务端团队,负责产品后台、数据源对接、多维查询方面的工作,数据团队负责实时计算、数据处理和建模工作,产品经理作为产品需求 owner 来进行产品功能规划、调研、设计和需求迭代。沟通协作大部分还是通过会议和 f2f 沟通来解决,当然,我们也有项目管理同事负责项目推进及各团队工作协调。

问题7、BI、数据分析和大数据之间的关系你怎么看,将来的BI会怎么样?

从字面来看,BI 可以理解为通过数据分析得出的结论(智能),而数据分析的对象是或大或小的数据集。对于我们自己的 BI 产品,我们定了这样两个产品阶段:现在是可视化、自助式分析,未来是智能化、探索式分析。

干货专访和文章

【DTalk精华】网易郑栋:前端数据采集与分析的那些事第一弹: 从数据埋点到AB测试

【DTalk精华】滴滴出行谯洪敏:前端数据采集与分析的那些事第二弹:企业如何选择自动埋点和可视化埋点

【DTalk精华】滴滴出行谯洪敏:前端数据采集与分析的那些事第三弹:埋点需求整理原则于埋点流程规范

【DTalk专访】滴滴谯洪敏:百家争鸣的前端技术时代

【DTalk思考】顾青:互联网团队的数据驱动能力从哪里来?

【DTalk专访】彭圣才:AI超越人类大脑,是一场「別有用心者」的骗局吗?

【DTalk专访】翁嘉颀:AI行业现阶段最需要什么样的人才?

【DTalk专访】赵华:携程怎么把机器学习与实际业务相结合?

【DTalk专访】网易郑栋:BI、可视化数据产品和大数据的几个核心问题

【DTalk回顾】美团点评沈国阳:我们在谈用户画像的时候到底在谈什么?

【DTalk专访】王晔:谷歌数据如何用于决策?