埋点事件模型-数据产品视角

上一篇文章写了埋点以及基础技术,本篇介绍埋点时常使用的事件模型。

一、事件模型

在传统的web时代,我们经使用pv、uv来统计某个页面/没有按键的使用情况(如umeng)。但随着数据精细化,数据分析&产品迭代更期望深度分析用户行为(新老用户的行为差异、各渠道用户转化率)、推荐需要用户粒度的行为数据,但这些基于pv、uv无法得到,因而事件模型由此出现。

简单来说,事件模型非常像5w2h,它通过(who,when,where,how,what) 记录了谁在某个时间点、某个地方、用某种方式、做了某一件事情(某个行为)。who,when,where,how,what即是事件模型的五个要素。

Who:即谁参与了这个事件,唯一标识(设备/用户id),可以是 匿名的设备id(idfa\idfv\android_id\imei\cookie)、也可以是后台生成的账户id(user_id,uid)、也可以是其他【唯一标识】。现在很多公司都有自己的唯一设备id,e.g.阿里有OneId。

When:即这个事件发生的实际时间。该时间点尽可能精确,有利于行为路径分析行为排序,像神策会精确到毫秒。

Where:即事件发生的地点。可以通过ip地址解析国家、省份、城市;如果期望更细致的数据,如果住宅、商业区等,需要额外地理信息数据库来做匹配。

How:即用户用某种方式做了这个事件,也可以理解为事件发生时的状态。这个包括的就比较多,可以是进入的渠道、跳转进来的上级页面、网络状态(wifi\4g\3g)、摄像头信息、屏幕信息(长x宽)等。而如使用的浏览器/使用的App,版本、操作系统类型、操作系统版本、进入的渠道等 经常设置为“预设字段”。

What:即用户做了什么,也是event模型的主题。这里应该尽可能详细的描述清楚行为,如搜索(搜索关键字、搜索类型)、观看(观看类型、观看时长/进度、观看对象(视频id))、购买(商品名称、商品类型、购买数量、购买金额、 付款方式)等等。


二、事件模型对应埋点文档

事件模型反映在埋点上报,即触发一个事件时上报对应日志,记录who,when,where,how,what。对应的统计文档,即埋点文档,在小型创业公司通常是excel来传递,有数据平台部门的公司通常会有专门的维护后台--埋点管理后台,以同步埋点的增/删/改。

上述所说的事件模型的埋点文档通常会包括

1.事件类型,像“停/启动”、“退出app”这种常规事件会设置为预设事件,将自动采集;而非预设事件则可以支持各种业务需求。

2.事件名称(英文/中文),能够准确描述事件,区别与其他事件,中文名可以用户数据后台显示。

3.事件参数(英文/中文),能够准确定义参数,区别与其他事件,不同事件的相同参数尽量保持一致,中文名可以用户数据后台显示。

4.参数值,备注合理参数的范围,例举参数的值。

5.类型,参数值记录的类型。由于不同类型支持数据分析后台查询方式不同,比如文本类型可以选择单个值,数值类型使用区间(大于、小于等),定义参数类型时切记考虑通用性、以及分析后台的便利性。

6.新增时间(版本),新增该埋点的时间点。

7.删除时间(版本),删除该埋点的时间点。


埋点文档

三、日志上报。

刚有提到“事件模型反映在埋点上报,即触发一个事件时上报对应日志,记录who,when,where,how,what。” 相比行为打包上报(非实时数据),有效减少数据延迟/丢失比例。

非实时的日志上报sdk中,因上报策略不同,即使是同一指标,基于不同的sdk统计到的数据会有差异,常见问题:(1)延迟上报;(2)数据丢失。上报策略将会影响数据展示,使业务方怀疑数据可信度:如延迟上报的数据,再次处理后会引起数据回流(e.g.第一天上报90%的行为,相应报表则会基于这90%统计展示;第二天再次上报5%前一天的数据,相应报表则会基于95%统计展示;引起两个时间点看到的数据不一样。)

实时:用户行为发生后立即上报;

非实时:当一系列的行为都发生后,打包上报、最常见的app退出/下次启动时上报当次/上一次用户行为。

当前的事件模型上报日志示例:

事件模型上报日志


三、事件模型的分析应用

事件模型结合其主体(用户/设备)的属性信息可以支持各种分析模型(漏斗分析模型、留存分析模型、路径分析模型、用户分群模型)。

用户属性常记录年龄、性别、职业、喜好等不易发生变化的。

1.事件分析&用户分群模型:任一事件可以结合预设字段和用户属性来统计分析,如 18岁以下的女生在这个事件上的表现;反之也可以得到任一时间在 属性维度上的分布,如 这个事件触发用户的年龄分布、地域分布、机型分布等。

2.漏斗分析模型&用户分群模型:分析一个多步骤过程中每一步的转化与流失情况。结合用户属性,可以分析各维度的漏斗,以找到转化低的瓶颈。例如.不同渠道的注册漏斗,是否存在某个渠道在某个转化过程中表现异常。

3.留存分析模型&用户分群模型:进行初始行为的用户中,有多少人还会进行该行为。结合用户属性,可以细分群体优化增长、精细化运营活动。

新用户留存:第一次访问后继续访问的用户占比。

xxx行为留存率:进行xxx行为的用户中,有多少人还会进行xxx行为,通常来衡量某个功能的用户粘度

xxx行为后,做yyy行为:进行xxx行为的用户中,有多少人会进行yyy行为。eg.第一天加入购物车的用户中,在第二天付款的占比。

4.路径分析模型&用户分群模型:则可以清晰的看到访问当前页面的所有用户中,紧接着有多少进入了详情页、有多大比例使用了xx/yy功能、有多大比例进入了分类页面。结合不同属性的用户在路径分析模型上的差异点、待优化点。

四、事件模型的其他应用

1.可视化/报表展示

2.数据分析

3.实时推荐

4.ab测试

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,458评论 4 363
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,454评论 1 294
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,171评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,062评论 0 207
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,440评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,661评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,906评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,609评论 0 200
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,379评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,600评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,085评论 1 261
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,409评论 2 254
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,072评论 3 237
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,088评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,860评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,704评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,608评论 2 270

推荐阅读更多精彩内容