数据埋点四部曲之——埋点质量控制

本次续上篇《初始数据埋点——方案设计》篇,搞定了埋点方案,下一步进入埋点工作的实施阶段,作为一名产品经理,要做的是要评估埋点的开发工作是否满足需求,埋点采集的数据是否达到业务的预期和数据分析目标?也就是说,我们要评估本次工作的成效,该如何进行那?

下面我们就来聊聊埋点质量评价的那些事~~~

埋点的目的什么,这是评价埋点工作效果的关键因素,达成目的就是埋点工作成功的直接反馈。埋点的核心目的是要采集用户行为数据,并对数据结果进行分析,进一步优化产品或指导产品运营工作,用数据驱动产品迭代和业务增长。so数据是用来分析的,在数据分析过程中发现的数据质量是埋点质量的直接量尺。

常见的数据质量问题

通过埋点方式进行数据采集,系统实现数据上报流程如下图所示。数据质量问题可能发生在数据上报流程的每一个环节。


埋点数据上报链路

(1)数据错误:在数据库中,经常会看到明显的数据错误,如出现:“必传而未传”、“非空而为空”、“值类型不对”、“值内容不对”等情况。

(2)数据字段缺失:采集到的数据中存在数据字段“undefined”、“null”,等情况,数据使用者在拿到数据之后,发现字段缺失,若为关键字段缺失,则数据无效,对数据分析和业务指导没有任何价值。

(3)数据重复:采集到的数据出现大量的重复,导致数据使用者看到数据犹如一团乱麻,无从下手,需要花费大量的时间进行数据结构梳理,去重等数据处理,耗时耗力。

(4)数据丢失:在查看采集到的数据集时,发现要采集的数据没有采集到,或者数据不连续性,某段时间内的数据丢失或中断,这样的数据对于依赖时间连续性的分析指标来说无疑是个悲剧,中断就是重头再来。

(5)数据缺失:基于业务需求以及数据需求分析,在需求梳理阶段未挖掘完整,存在遗漏,或埋点开发过程中代码缺失,未实现数据采集等,都会造成数据缺失,当需要数据分析时发现缺失,此时悔恨已晚。

造成数据质量问题的原因

(1)由于SDK自身或者前端开发疏忽的问题,导致相同事件重复发送,或数据字缺失、丢失等情况。

(2)设备、网络原因,或技术开发人员大意,升级改造时修改了代码或手误下线,导致事件上报不规范等也有可能造成数据丢失、缺失、出错。

(3)使用不同的数据采集平台也容易造成同一个属性值口径不一,出现数据错误,还有在数据埋点时对同一事件的定义不一致,导致收集的数据出现错误。

(4)数据采集方式不一样,同样也会带来数据丢失。

如何控制埋点质量?

埋点的质量决定着数据的质量和完备性,提升埋点质量确保采集到的数据准确、完整、可用性高,这样的埋点工作才不枉费我们的辛苦付出。

首先,要明确埋点的目标,及通过埋点要解决的核心问题,清晰的目标,以目标为导向进行埋点设计。

其次,做好埋点需求分析。需求分析要有全局意识,针对业务需求做出整体的规划,在大的整体鬼规划的前提下,结合本次项目的目标进行不同层面的需求挖掘,建立较为完整的数据分析指标体系。

再次,埋点方案设计。埋点方案设计中需要按照不同的业务场景,做好事件及属性设计,并选择合适的事件触发类型和埋点方式。方案设计是关键,在这个过程中梳理产品逻辑关系,对事件进行唯一的属性设计,同一时间属性设计口径要一致,避免出现数据错误;且事件定义要通俗易懂,做好注释,方便使用者查看使用数据。

最后,做好埋点测试验证,以及数据指标字典管理。埋点结束后,要对埋点效果进行测试,并进行数据监测和评价。测试有返回值是确定埋点事件可以触发,对数据准确性的评价,需要一定时间内的数据监测和分析进行评价,是否数据准确,数据质量是否满足业务需求。数据指标字典是数据的标准化管理资产,完备的数据字典管理制度,可有效的维护数据资源的规范性、统一性和准确性。


进步是一个过程,学习不是一个人在努力,  fighting~~~

推荐阅读更多精彩内容