读书笔记: <<数据驱动 从方法到实践>>

看到 caoz 推荐了这本书, 赶紧买来读一读, 写一写笔记.

数据驱动的两个价值

我猜大家还是驱动决策方面做得多

痛苦: 埋点混乱, 常规埋错, 漏埋

看来大家都需要一个完善的埋点需求管理工具, 在英语流利说,我们这样管理数据采集需求 拿走不谢

无奈: 数据团队和业务工程团队配合困难

首先, 求"快", 数据分析让路产品升级
其次, KPI 驱动, 数据团队需求得不到重视

关于 数据分析让路产品升级, 书中给出的回答也足够日后拿来怼类似场景了: 没有数据支撑, 如何衡量产品做得是否合理?

关于 KPI 驱动, 数据团队需求得不到重视, 我觉得还是看老板: 老板的风格就是数据驱动, 天天跟业务方要数据, 你说数据团队的需求业务方配合不配合? 相反, 靠业务方主动根据数据反馈优化功能, 你怎么保证你找来的产品经理不是凭借自身感觉做事的"艺术家"? 数据团队作为业务支持部门, 还是要尽力避免"皇上不急太监急"的尴尬.

数据采集遵循法则

让数据驱动落地企业, 数据采集的质量将决定数据分析的深度. 其中, 数据源是最重要的.

这一点深有同感, Garbage In, Garage Out 法则. 在数据质量上我们也走了一些弯路, 花费了很多功夫. 还是很好奇 SensorData 自己的 SDK 是如何保障数据质量的.

数据采集的四个法则: 大, 全, 细, 时

  • "大"强调的是宏观的大, 这不只需要海量数据, 还要从系统的角度去考虑
  • "全"强调多种数据源. 对于用户行为分析来说, 不但要采集客户端数据, 还要采集服务端日志, 业务数据库, 以及第三方数据, 全面覆盖, 而且是全量数据.
  • "细"要求把不同的维度都采集下来. 对于用户行为来说, 我们要采集 Who, When, Where, How, What 等信息. 如果缺失会导致重新采集, 延长迭代周期
  • "时" 则强调时效性

实际工作中, "大"可作为宏观考量, 重点关注"全"和"细", 而"时"可以根据业务场景灵活把控, 毕竟数据的时效性是有成本的.

这个四个原则中, 我非常赞同, 并且也是这样实践的, 尤其后续总结毕竟数据的时效性是有成本的这一语道破真谛.
而关于的描述, 我看着有些虚, 或许是境界不够吧.

无埋点优劣势分析

总结一句话: 一旦企业有复杂的分析需求, 就必须进行代码埋点, 否则数据无法进行灵活下钻.

前端埋点 vs 后端埋点

使用后端埋点会有一个问题: 维度采集的问题. 上文也提到数据采集要尽量: Who, When, Where, How, What 都要带着, 但后端请求可能在当次请求时能拿到的维度信息不够(例如没有设备相关的信息等), 解决的办法也无外乎这几种:

  1. 后续 ETL 的时候补数据, 靠 ETL 计算出用户 session 期间的设备信息, 然后补全到后端埋点数据中.
  2. 在用户首次请求时保存设备 Context 信息到缓存中, 后续埋点通过缓存将数据补齐.

导致数据不准确的几个原因

  1. 网络异常
  2. 统计口径不同
  3. 代码质量问题
  4. 无效请求

关于 网络异常 代码适量问题, 我想解决的办法只有一个: 让最靠谱的工程师来开发这个 SDK, 并给充足的时间和耐心进行测试.

关于统计口径不同, 我的看法是统一口径是一个方面, 另一个方面就是方便阅读数据计算逻辑, 例如如果用 SQL 开发, 那么这个结果使用了哪些数据, 这些数据的来源是如何, 如何方便的看到代码, 开发过程是否有 code review, 这后面其实是整个数据开发平台工具链的建设, 非一日之功.

今天暂时写到这里, 改天继续.
-- EOF --

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 115,262评论 1 230
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 49,625评论 1 197
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 70,059评论 0 162
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 34,527评论 0 123
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 41,293评论 0 204
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 34,196评论 1 121
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 26,219评论 2 204
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 25,388评论 0 116
  • 想象着我的养父在大火中拼命挣扎,窒息,最后皮肤化为焦炭。我心中就已经是抑制不住地欢快,这就叫做以其人之道,还治其人...
    爱写小说的胖达阅读 24,343评论 5 168
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 28,349评论 0 176
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 25,648评论 1 165
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 26,900评论 1 173
  • 白月光回国,霸总把我这个替身辞退。还一脸阴沉的警告我。[不要出现在思思面前, 不然我有一百种方法让你生不如死。]我...
    爱写小说的胖达阅读 21,257评论 0 24
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 23,894评论 2 162
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 27,611评论 3 168
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 22,604评论 0 4
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 22,784评论 0 111
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 28,799评论 2 183
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 29,218评论 2 184

推荐阅读更多精彩内容