【DTalk精华】滴滴出行谯洪敏:前端数据采集与分析的那些事第三弹:埋点需求整理原则与埋点流程规范

4月14日晚,DTalk邀请到了谯洪敏老师,他是滴滴上海前端团队负责人,前陆金所移动前端团队负责人,进行了一次关于《前端数据采集与分析的那些事第二弹:前端篇》的微信群线上主题分享。
活动分享了埋点需求的整理原则,埋点的命名规范,埋点流程规范,埋点上报的解决方案,以及一些实际场景中的注意事项。谯洪敏老师会在4月21日的 DTalk上海数据驱动实战案例研讨Workshop中深入帮助参会团队解决数据埋点方面的问题。

一、埋点需求整理原则

其实就是整理一系列问题,并基于这些问题确定埋点需求,我作为FE的RD,针对这些原则,我们至今也没有真正全面的做到,但是如果遵循这些原则,将会受益良多(也欢迎大家补充问题内容):

HOW LONG:

  • 埋点可用周期是多久,持续几个版本可以?

  • 生命周期结束后是否可以考虑下掉?

HOW MUCH:

  • 现有的埋点哪些可以满足我的部分埋点需求?

  • 哪些现有的埋点可以替代我要的部分埋点?

  • 新的埋点有多少?这些埋点是否是最必要的?

HOW:

  • 怎样证明新功能效果?

  • 需要哪些埋点?

  • 我该怎么埋这些点?

  • 部分埋点的计算逻辑是什么?

  • 数据结果怎么看?漏斗?同环比?

WHO:

  • 我的产品设计面对的用户群里是谁?

  • 用户特征是什么?

  • 这部分特征用户对功能预期的数据结果是什么?

  • 用户习惯是什么?

WHAT:

  • 我的新产品是什么?

  • 新产品包含哪几个模块?

WHY:

  • 涉及新产品的目的是什么,为了解决什么问题?

WHERE:

  • 新功能展示在产品端的哪个位置?

  • 在哪些版本生效?

  • 哪些功能的展示或作用在哪里需要跟服务端等交互?

WHEN:

  • 功能是在用户场景什么时候调用产生?

  • 调用过程中什么时候和服务端交互?

  • 功能调用正常情况下需要大概需要多长时间?

  • 什么情况会影响调用结果?

  • 调用有风险的时候,是否需要加监测?

二、埋点命名规范

我们当前的做法是埋点名称只能是由字母、数字、下划线组成,并保证在应用内唯一,sw是展示,ck是点击。

常用规则的举例如下:

  • 比如行为埋点: {团队|业务|角色}{组件|页面}{具体元素}_{动作} 示例:yourteam_fc_all_msg_ck

  • autoplatform_flowtab_sw : autoplatform代表业务线,flowtab 代表功能,sw代表页面操作,sw是展示,ck是点击

  • uber_comt_share_ck :uber业务线,comt评价组件,share分享按钮,ck点击

三、埋点流程规范

埋点作为重要的资产,是数据生产的第一步,那为什么制定规范占首要位置?

因为30%用户反馈找不到埋点,根本无法进行数据分析,造成这个问题的原因包括:

  1. 埋点语义不明确,同一个按钮存在多种描述,不易检索;

  2. 无用/重复埋点太多,干扰了正常埋点数据,一个公司可能已经包括上千个埋点信息,而且还在按照很高的速度迭代增长;

  3. 大量存量埋点Owner离职或者转岗,导致大量僵尸埋点信息,找不到归属方和解释方;

如果你发现每天有大量埋点错误反馈,并导致很多错误的分析结论,一个错误的分析结果还不如没有数据分析结果。造成这个问题的原因包括:

  1. 前端埋点涉及复杂的交互,难以找准埋点位置;

  2. 埋点的验收流程不完善,没有经过测试和产品经理的测试和验收,验证不完备;

好的埋点需求应该和业务功能需求同等重要,也需要经历软件开发的整个生命周期,如果能严格按照一个规范的流程处理埋点,以上问题会得到更好的解决:

规范内容:

1、需求阶段:

确定埋点信息,核心包括五方面信息:事件ID、埋点名称、埋点描述、埋点属性以及截图。

举例:

  • 快车页面打车的埋点信息为:

  • 埋点ID为:gulf_p_f_home_order_ck

  • 埋点名称为:呼叫快车

  • 埋点描述:在快车首页点击呼叫快车按钮。

如何落地:

如果不按照规则和流程埋点将不会上报相关数据,制定强制规定。

开发什么功能:

埋点全文检索能力、自动找到重复埋点(语义相近或者数据相近)功能。

2、开发阶段:

务必和开发沟通,并让开发在完全理解业务语义的情况下,在前端按照埋点代码规范进行埋点。

举例:

比如针对商品购买按钮,在前端点击方法的第一行调用SDK,最好也传入文本字面描述。

如何落地:

静态代码检查。

开发什么功能:

开发探测每个埋点对应到的代码文件和代码行,开发根据人均事件量级进行监控报警功能。

3、测试阶段:

务必和测试沟通,并让测试在完全理解业务语义的情况下,通过CodeReview和埋点测试两种方式对埋点正确性进行验证。

举例:

比如针对商品购买按钮埋点,需要检查埋点测试中上传数据中事件ID、属性是否符合定义,另外触发时机是否正确。

如何落地:

规定如果未经测试的埋点不允许上报埋点数据。

开发什么功能:

提供所见即所得的埋点测试平台。

4、验收阶段:

确保相关人员在完全理解业务语义的情况下,可以通过与自比较和他比较的方式来进行验证。

举例:

自比较验证:同一APP某一个业务线的购买冒泡数量一定要小于所有业务线的冒泡数合计;

他比较验证:前端某业务点数量和对应服务端数据应该基本相当。

如何落地:

规定如果未经验证的埋点不允许上报埋点数据。

开发什么功能:

提供埋点实时数据查询。

5、清理阶段:

确认完全理解语义的情况下,可对业务发生巨大变化或者不在维护的埋点进行废弃。

举例:

百度糯米合并饿了么后,埋点在经历产品大改版后已经和其他业务线合并,需要废弃之前的遗留埋点。

如何落地:

3个月以上未被使用的埋点、1个月以上数据为0的埋点自动废弃。3个月后使用次日会自动开启采集。

开发什么功能:

根据规则提供针对未使用埋点的计算、并自动废弃。

可以做一个表用来记录:

四、关于埋点上报的解决方案

一般会实现上个模块,Event收集器,Event缓存器,和Event上报器。

1、Event上报模式

除了用户个人不希望耗费流量以外,也可能会因为弱网及断网情况,如果确保数据不丢失,基于这些问题而诞生的上传策略,来设计如何上报已收集的所有事件数据。上报一般包括针对内存实时数据的上报和本地持久化数据上报两个部分,分别介绍一下它们的上报策略与实现方式。

2、内存埋点数据的实时上报

针对内存埋点数据的上报策略一般如下:

  • 基于时间间隔:每隔 n秒(时间间隔可以根据公司的业务情况自定义)

  • 基于数据条数:每累积 n条数据(条数可以自定义)

  • 不间断实时上报,如果是低频率,数据量小,实时性要求高的数据可以不设限制

上述条件满足时,便会触发从内存中读取数据,并执行上传操作。Native可以创建了一个并发队列,H5会基于浏览器并发发送。

3、本地持久化数据的延迟上报

为了尽早的上传本地持久化埋点数据,以防用户卸载 App或者关闭浏览器造成本地数据的丢失,针对本地持久化数据的上传策略如下:

Native相关:

(1)App 冷启动

(2)App 进入前台

(3)App入后台

HTML5、Hybrid相关:

(1)localstorage,浏览器关闭埋点数据并不会被删除,如果用户再次访问,会启动上报

(2)基于Native提供的bridge,让Native帮忙持久化数据,并在再次进入时,启动上报

这里也可以创建一个单独的串行队列,来实现对本地持久化数据的逐个上报。

另外我们在前端埋点中也遇到过一些注意事项,整理如下,希望对大家有所帮助。

注意事项

1、一些埋点安全性问题:

如果你使用普通的http 协议,在数据传输的过程存在被劫持(包括不限于:JS代码注入等)的可能性,造成H5页面中出现诸如:未知的广告或者原网页被重定向等问题。为了降低此类事件发生的可能性,建议最好使用https 协议(倡导全站https),以确保数据传输过程的完整性,安全性。

2、版本迭代的时候埋点需要注意什么?

  • 如果是公用模块,可以非常放心安全的全量迁移埋点;

  • 如果是新增模块,那就需要注意是否遵循了最新的埋点规范,有没有重复的埋点命名存在,埋点是否符合业务逻辑;

  • 如果是下线模块,那就需要评估下线后对数据的影响范围,而且要第一时间充分周知相关方,让各方参与评估;

  • 如果是更新模块,需要评估在原有埋点上需要修改的埋点内容,是否需要重新埋点,删除不需要的埋点,而且要修改功能的数据承接。

本文作者:

谯洪敏老师,DTalk核心专家组成员,滴滴上海海浪前端团队负责人,前陆金所移动前端团队负责人,主要专注与前端工程化、前端Web安全及前端性能优化,有丰富的前端埋点技术工程、数据处理和数据质量的经验。


干货专访和文章

【DTalk分享】黄一能:互联网产品运营决策中用户画像的核心作用直播回顾
【DTalk分享】陈抒:产品设计中的用户画像直播回顾
【DTalk分享】吆喝科技王晔:A/B测试最佳实践直播回顾
【DTalk精华】网易郑栋:前端数据采集与分析的那些事第一弹: 从数据埋点到AB测试
【DTalk精华】滴滴出行谯洪敏:前端数据采集与分析的那些事第二弹:企业如何选择自动埋点和可视化埋点
【DTalk精华】滴滴出行谯洪敏:前端数据采集与分析的那些事第三弹:埋点需求整理原则于埋点流程规范
【DTalk专访】滴滴谯洪敏:百家争鸣的前端技术时代
【DTalk思考】顾青:互联网团队的数据驱动能力从哪里来?
【DTalk专访】彭圣才:AI超越人类大脑,是一场「別有用心者」的骗局吗?
【DTalk专访】翁嘉颀:AI行业现阶段最需要什么样的人才?
【DTalk专访】赵华:携程怎么把机器学习与实际业务相结合?
【DTalk专访】网易郑栋:BI、可视化数据产品和大数据的几个核心问题
【DTalk回顾】美团点评沈国阳:我们在谈用户画像的时候到底在谈什么?
【DTalk专访】王晔:谷歌数据如何用于决策?

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,736评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,167评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,442评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,902评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,302评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,573评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,847评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,562评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,260评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,531评论 2 245
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,021评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,367评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,016评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,068评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,827评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,610评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,514评论 2 269

推荐阅读更多精彩内容