用Python分析用户消费行为

这是一份用户在一家CD网站上的消费记录

1、导入数据

-- 对数据进行描述性统计

可知用户平均每笔订单购买2.4个商品,中位数为2,75分位数为3,说明绝大部分订单的购买量都不多。

但是最大值为99个,数字偏高。

一般来说,根据二八法则,20%的用户贡献的收入会占总收入的80%。


-- 将order_dt改为可计算的时间字符类型并将消费频次按月计算

查看更改以后的数据

2、进行用户消费趋势的分析(按月)

(1)每月的消费总金额

(2)每月的用户消费次数

(3)每月的产品购买量

(4)每月的消费人数

(1)对每月的消费总金额绘制折线图分析

每月的消费总金额
每月的消费总金额(折线图)

由图可知,用户发生购买行为多在1-3月,从四月份以后,消费较为稳定呈轻微下降趋势

(2)对每月消费人数绘制折线图分析

每月的用户消费次数
每月的用户消费次数 (折线图)

前三个月消费订单次数在10000次接近12000次,后续每月消费次数则在2500次

(3)对每月产品购买量绘制折线图分析

每月产品购买量
每月产品购买量(折线图)

前三个月物品购买量约为25000元,后续月份则保持在7000元左右

(4)对每月的消费人数绘制折线图分析

每月消费人数(折线图)

前三个月每月的消费人数在8000-10000之间,后续月份,平均消费人数在2000不到

3、用户个体消费分析

(1)用户消费金额,消费次数的秒速统计

(2)用户消费金额和消费次数的散点图

(3)用户消费金额的分布图

(4)用户累计消费金额占比(百分之多少的用户占了百分之多少的消费额)

(1)对用户金额及消费次数绘制散点图分析

用户金额及消费次数(散点图)

过滤掉极值

用户金额及消费次数(散点图)

(3)对用户消费金额作直方图分析

用户消费金额(直方图)

由图可知用户消费金额,绝大部分呈现集中趋势,小部分异常值干扰了判断,可以使用过滤操作排除异常值

过滤后的用户消费金额( 直方图 )

(4)对用户累计消费金额占比作折线图分析

用户累计消费金额占比(折线图)

由图可知50%的用户仅贡献了15%的消费额度,而排名前5000的用户就贡献了40%的消费额度


3、用户消费行为

(1)用户第一次消费(首购)

(2)用户最后一次消费

(3)新老客户消费比

        ①多少用户仅消费一次

        ②每月新客占比

(4)用户分层

        ① RFM模型

        ②新、老、活跃、回流、流失

(5)用户购买周期(按订单)

        ①用户消费周期描述

        ②用户消费周期分布

(6)用户生命周期(按第一次和最后一次消费) -用户生命周期描述

        ①用户生命周期分布

(7)复购率和回购率分析

(1)(2)对用户第一次及最后一次消费进行分析

用户第一次消费
用户最后一次消费

大多数人最后一次购买时间都在1-3月份,说明他们购买了一次就不再进行购买,随着时间的递增,最后一次购买数量也在递增,消费呈现流失上升的状况。用户流失比例基本一致,一开始用户迅猛增长数量比较多流失的也比较多。

(3)对新老客消费比进行分析

取每个用户首次和最后一次购买时间

用户首次和最后一次购买时间

查询只进行过一次购买的用户人数

一次购买的用户人数

由图可知,将近一半的用户仅仅消费了一次,新老客户占比接近1:1

(4)RFM模型

RFM模型的三个指标为最近一次消费时间、消费频率 、消费金额 

绘制透视图表进行分析

RFM模型

要将order_dt里面具体的日期变成R中的天数

再将order_amount和order_products重命名为F、M

RFM模型

对用户进行分群(8个)

将RFM中的数值换为容易理解的文字

对重要价值客户及非重要价值客户的消费时间、消费频率绘制散点图

(4)对用户生命周期 新客,活跃,回流,流失进行分析

从上图中可以看到,表中数据有0,1,2···,要将有消费的变为1,没有消费变为0

这里由于进行数据透视,填充了一些 null 值为0,而实际可能用户在当月根本就没有注册,这样会误导第一次消费数据的统计。

自定义函数

将自定义函数运用到数据中

将未注册的替换为空值,这样 count 计算时不会计算到,从而得到每个月的用户分布

对这些用户做面积图分析

(5)用户购买周期 对用户消费周期进行分析

计算相邻两个订单的时间间隔,用shift 函数,shift函数是对数据进行错位,所有数据会往下平移一下,可以计算

以用户分组,对两个订单的间隔进行计算

NaT表示只有一次购买

对时间间隔进行描述性统计分析

去除days并绘制直方图

时间间隔(直方图)

用户的平均购买周期是68天,绝大部分用户的购买周期都低于100天

(6)对用户生命周期(按第一次和最后一次消费)

描述性分析

去除days并绘制直方图

用户生命周期(直方图)

用户的生命周期受只购买一次的用户影响比较厉害,所以要对用户进行筛选

(7)复购率和回购率分析

复购率:自然月内,购买多次的用户占比(即,购买了两次以上)

回购率:曾经购买过的用户在某一时期的再次购买的占比(可能是在三个月内)

复购率折线图

复购率稳定在20%所有,前一个月因为有大量新用户涌入,而这批用户只购买了一次,所以导致复购率降低

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,716评论 4 364
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,558评论 1 294
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,431评论 0 244
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,127评论 0 209
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,511评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,692评论 1 222
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,915评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,664评论 0 202
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,412评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,616评论 2 245
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,105评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,424评论 2 254
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,098评论 3 238
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,096评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,869评论 0 197
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,748评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,641评论 2 271

推荐阅读更多精彩内容