大数据杀熟背后 -- 浅谈用户画像

同事A有一天在某电商平台搜了“连衣裙”,惊呼:“xx上的裙子好贵啊,怎么都要四五百?”。同事B接话:“不能吧,我看看,哎?我这就两百多啊”。我默默地打开了手机,用事实证明自己是最穷的,“这用户画像用的666啊,你们看我,我这前6个商品最低48,最高才128,看来还是你们比较有钱啊!”

​想到之前看过一篇大数据杀熟相关的文章,当时还有点庆幸自己还好比较穷(哈哈哈哈),大数据杀熟的背后是什么?借此,就自己所学谈谈对用户画像的理解。

本文主要从三部分讲起,包括:什么是用户画像?为什么要使用用户画像?如何使用用户画像?

一、什么是用户画像?

用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。我们在实际操作的过程中往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待的数据转化联结起来。                         -- 源于百度百科

其实用户画像(User Persona)这一概念最早是由交互设计之父Alan Cooper提出的,指建立在一系列属性数据上的目标用户模型。

Personas are a concrete representation of target users.

不过随着互联网的发展,人们对于用户画像又扩充了新的含义,现在的用户画像意为User Profile,指根据用户的人口学特征、网络浏览内容、网络社交活动及消费行为等信息抽象得到的一个标签化的用户模型。

User Persona和User Profile两者有什么区别呢?

User Persona 其实叫做用户角色会更加合适,现实中产品、运营人员用的比较多,可以作为一种用户调研的方法。在进行产品、需求、场景、用户体验等讨论的时候,可以采用用户角色这一抽象方法(通过调查问卷、电话访谈等手段获取用户特征),将焦点聚集在某一类人群上,作为目标用户的集合,以此来描述使用产品的用户。

通过User Persona能够帮助产品、运营人员等更好地了解用户,理解用户需求和使用场景,不再盲目地为所有用户解决问题、做产品,而是针对目标用户做产品。

因此User Persona多用于产品发展初期,通过此种方法可以找到产品的典型用户有哪些,他们使用产品的场景是什么,他们的需求是什么(遇到了什么需要解决的问题)。这样就可以找到使用产品的不同类别的用户,每一类别的用户都有其对应的画像,这些画像描绘了这类用户的典型特征,使用这些典型特征就可以针对性地进行产品功能迭代、用户体验优化。

举个用户角色的例子:一位27岁的程序员,top2高校毕业,从事互联网算法工作,居住在上海,有女朋友,平时喜欢看动漫、玩游戏,收入较高。

其实这位程序员并非单指某一位程序员,而是多位具有上述描述(特征)的人,他们具有这些方面的共性,是符合某一产品的目标用户群体。找到目标用户群体,就可以有针对性、目的性地了解用户需求及使用场景,更好地进行产品开发及更新迭代。

例子讲完了,不知道你有没有发现,上述标签都是用户的定性特征,虽能用于评估用户属性,但无法进行量化,且通过调查访问等手段得到的信息不一定真实,务必能正确定位和区分目标用户群体。此外随着时间的推移,用户群体可能会发生一些变化,随之而来的,原先定义的用户角色也需要不断进行修改,这算是用户角色的一个缺点。

User Profile称为用户画像,是从大量信息中抽象得到的一个标签化用户模型,可以理解为对存储在服务器及数据库中的海量数据进行挖掘和分析,给用户“贴标签”,这种“标签”可以作为用户某一维度特征的标识,用来辅助业务运营和数据分析。

白话一点。比如在电商平台,User Profile指的就不止是你的性别、年龄、地区等信息,还包括通过对你在平台上填写的信息以及你的购买行为数据进行“高度提炼”得到的特征标识,这些标识也就是你的标签,只不过是通过挖掘分析得来的。

更有体感一点,比如可以根据你经常购买的商品类型判断你是学生还是上班族,是有孩子还是没孩子;通过你经常购买的商品的价格判断你的购买力;通过你购买的商品判断你对哪些商品类目具有品牌倾向等。

其他例子就不举了,相信有过电商购物经历的你们应该会有所体验。

二、为什么要使用用户画像?

其实在讲述什么是用户画像的时候,也有提及用户画像的一些使用意义,大致离不开产品优化迭代、用户体验的优化、业务的运营等方面。

其一,用户画像可以帮助聚焦产品的服务对象。除一些必须性的通讯软件外,一个产品期望其用户范围涵盖所有人群是非常不容易的,目标人群基数越大,服务标准相对就越低,要么会做的很成功,要么就会走向失败。而一个产品如果能清晰明确自己的产品定位及目标用户,就可以在产品上做到专注、极致,比如虎扑、豆瓣,目标用户就相对比较明确。

其二,用户画像可以在一定程度上规避“伪”需求。在进行产品设计时,如果不能很好地利用用户画像,单凭产品设计人员、测试人员等个人产品体验假以用户体验之名进行产品优化测试,可能会导致自以为的优质体验变成用户口中的吐槽点。使用用户画像能更好地理解用户真实需求,从用户角度出发,解决用户痛点。

其三四五六就不说了,以电商平台为例,列举几个用户画像的使用意义。

1. 精准营销

记不清是哪些年前了,那时候电商平台外部竞争性不太大,多的是某平台上各个店铺自己促销来吸引用户、提高复购。那时候基本上啥都不管,只要有用户的联系方式,逢什么节日、活动,手机、邮箱就可能会收到一些活动信息,也不在乎是不是适合用户,符合用户当下购买意图。

有了用户画像之后呢?

以前那种粗放式的“关怀”就可以做到精细化了,同样也是促销活动,通过用户画像就能将用户进行划分,对不同类别的用户采用不同的激励策略和方法,更有针对性,效果可能也会更好。

2. 用户分析

一大把用户信息和行为数据摆在你面前,怎么办?当然是用起来!以大家熟知的用户生命周期为例,用户生命周期可以分为引入期、成长期、成熟期、衰退期、流失期(不同大佬对于用户生命周期的详细定义可能有所区别,但大致都包括从新到中到老到死这些阶段),处于生命周期不同阶段的用户都具有这一阶段的特征。

我们可以利用用户画像对不同阶段用户的特征进行描述,不仅可以对不同阶段的用户进行针对性地优化,也可以采取某些手段或方法促进用户向我们期望的用户群体(不同阶段)转化。

比如一阅读类app以广告收入盈利,那用户的平均阅读时长、留存等数据就会影响到收入。假设此app处于引入期的新用户平均每天阅读时长为10分钟,次留率为7%,周活跃天数为2天。而处于成长期的用户平均每天阅读时长为30分钟,次留率为15%,周活跃天数为4天。

在了解到这些信息后,可以采取某种激励方式提高用户每天的阅读时长或活跃天数,以期引入期用户能更好地向成长期甚至成熟期的用户转化,从而实现更好地收益。当然也可以对处于衰退期的用户根据用户画像做分析,采取针对性的策略降低流失用户衰退速度。(此处假设成熟期的用户相关指标表现最好)

3. 智能推荐

个性化推荐相信大家也并不陌生。在电商平台,你的浏览、点击、加购、收藏、下单记录,以及基于以上各种数据挖掘分析得到的用户偏好、购买力等信息(用户画像)可以很好地作为平台为你推荐商品(店铺、浏览内容)的依据。相比于无针对性地推荐,有依据、有目的、有针对性的推荐带来的转化效果会更好。

除了电商平台,像某些短视频app也是做了很好的推荐流,当然我个人体感有限,毕竟“过于精准”的推荐也是有些影响用户体验的。

4. 数据分析

用户行为数据经过清洗、处理存储在数据仓库中,有一些被拿出来作为指标,指导业务。还有一些被数据挖掘、算法的同学拿来进行某些分析,或沉淀得到存储标签集合的底层表。这些标签可以在遇到问题或预先分析的时候起到指明方向、辅助决策的作用。

比如在进行产品某项功能优化的时候发现ios用户和android用户对此功能有不同的反应,且不同手机机型反应也有所不同。这时,手机机型、机型价值、屏幕大小等信息就可以拿来做进一步的分析,起到发现问题或辅助决策的作用。

除上述用户画像的使用意义外,基于不同性别、年龄、偏好、手机等标签进行的广告投放,根据用户画像进行产品(服务)的私人订制(个性化服务)等也能体现出用户画像的价值所在。

当然,大数据杀熟也不得不提,当然这是个不好甚至不法的应用。

三、如何构建用户画像?

想要构建用户画像,首先需要了解下用户画像包括哪些内容。用户画像多按照业务属性进行划分,如基本属性(性别、年龄、地区、籍贯、婚姻情况、学历等),社会属性(手机平台类型,机型,机型价值,是否有小孩、是否有车、是否有房),消费属性(购买力水平、消费频次),行为属性(浏览、加购、收藏、下单),偏好属性(商品类目偏好、品牌偏好),此处列举多为电商场景,不同行业、场景、商品可能会有不同的属性需求,但上述所列属性算是一些较通用的属性。

在此做一下区分,我将用户画像分为定性和定量两种,定性用户画像指之前提及的产品、运营人员善用类访谈形式得到的,定量用户画像指除了基础信息,通过数据挖掘分析等得到的,此处讲一下个人对定量用户画像构建的理解(此处的定量用户画像中也包括了一部分定性的特征)。

按我个人的理解,用户画像的构建包括明确分析目标、收集和处理数据、构建用户画像。

1. 明确分析目标

看到别家公司有用户画像,我们也要搞用户画像,不管是为了什么,先构建了再说!这用户画像能合理吗?能有用吗?

不同的业务场景、业务需求可能有不同的目标,针对这些目标就会有不同的用户画像构建。有的是为了提高产品销量,有的是为了留住用户,目标不一样,关注的特征标签也不一样。切记,不要噼里啪啦一顿操作构建了用户画像妄想拿这些个用户标签去驱动和提高业务,而应该是在业务中遇到了问题,为驱动和提高业务,才选择使用用户画像。

比如为了降低某产品的用户流失,首先需要分析其中可能导致用户流失的原因,如外部竞争,商品吸引力、价格、用户体验等方面的原因,在此基础上挑选对应的特征如用户使用时长、使用频次等进行后续用户画像的构建分析。

2. 数据收集和处理

就是字面意思,细看的话......

收集首先要有目的性,在业务的基础上进行对应所需数据的收集(如果大量数据本身就存储在数仓中,此处的收集就只有目的性地对其中的数据进行选择)。

数据可以分为静态和动态数据。所谓静态就是一些不(怎么)变化的标签,比如性别、年龄、地区、职业等(从当下看不变,你要非说人的年龄会涨,职业会变,那我也没办法)。动态多指用户的行为数据,比如电商平台上用户的浏览、点击、加购、收藏、下单等行为数据;再比如阅读类app上用户的访问时长、访问频次等。

数据处理,此处指简单的预处理,包括数据清洗、去冗余、空缺值处理等。此处有一点要提,对于空缺值的处理,比如性别,可以通过用户的身份证信息进行补足或可通过姓名使用算法模型进行性别概率的推断。其他的必需且不愿舍弃的空缺值也同样可以使用算法模型解决问题。

3. 构建用户画像

打标签,或称用户行为数据标签化,此处需要注意的是标签粒度问题,太粗会导致没有区分度,太细有可能使得整个标签体系太过复杂。

明确了分析目标并获得相关数据后,就可以进行模型的构建了(用户标签+标签权重)。根据用户的基础行为数据就可得到事实标签(可直接获取,如登录、注册信息,也可通过简单地统计得到,如购买次数、活跃天数),在此基础上基于机器学习和NLP技术也可得到一些模型标签(如用户对的商品类目偏好、品牌偏好)。

不过单纯的标签罗列似乎并无很大意义,就像一个Excel表格或某张存储标签的底层表,从中可能根本无法看出什么重要的信息。需要做的是结合业务信息、形态,找出隐含在标签背后的意义,基于此对不同的标签赋予不同的权重,方便最后通过计算得到总标签权重,形成一个完整的用户模型。

可通过事件分析进行标签权重模型的建立,包括who,where,when,what,什么样的用户在何时何地做了什么?

举个例子,胖里两天前在某电商平台浏览了一款价值600元的飞利浦电动牙刷。用户标签飞利浦,电动牙刷。

由于是先前时间的行为,所以在时间标签上可能权重会略为低一些,假设为0.75,浏览行为可记某个权重,比如1(假设加购、收藏行为权重更高),地点为推荐场景,此权重可根据具体规则再设定,假设为0.5。

那胖里对于此标签的总标签权重为飞利浦电动牙刷:0.75*1*0.5=0.375,胖里对另一品牌的电动牙刷可能总标签权重为0.45(此处的权重全为个人假设,现实场景中应该需要通过建模分析得到)。

详细的构建用户画像的小例子就不给大家举了,在某乎上看过一篇写的比较生动的文章,推荐给大家看看https://zhuanlan.zhihu.com/p/30447211。

后记

其实还读了不少大佬们对于用户画像错用、乱用的文章,批判的是那些制作了超多标签,看似分析地得到了一些表面现象,实际p用没有。

其实有很多行为数据是滞后的,已经发生的并不代表以后也会这样,过去买了以后不一定还买。对于以后的行为是需要预测的,而不可单单只凭以前的数据来作为以后行为的凭据。

同时我也有对先前的一些分析进行思考,在本文第二部分讲用户分析的时候有提到过一个例子,阅读类app促转化或防流失的问题。阅读时长长或活跃天数高的用户留存率高,采取某种激励手段提高阅读时长或活跃天数是否真的能促进低留存用户向高留存用户转化?当时没能赶上落地效果的检验,对此略存疑。用户画像准确不准确不知道,效果好不好才重要。

考虑业务场景、形态的用户画像才有意义,不仅关注表面数据而且注重预测分析与沉淀的用户画像才有意义。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,233评论 4 360
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,013评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,030评论 0 241
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,827评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,221评论 3 286
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,542评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,814评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,513评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,225评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,497评论 2 244
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,998评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,342评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,986评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,055评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,812评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,560评论 2 271
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,461评论 2 266