数据分析思维之分类分析法

一:分类分析的定义

分类是一种基本的数据分析方式,根据其特点,可将数据对象划分为不同的部分和类型,再进一步分析,能够进一步挖掘事物的本质

二:分组分析法的分类

根据指标的性质,分组分析法分为属性指标分组数量指标分组
1.属性指标分组分析法

按属性指标分组一般较简单,分组指标一旦确定,组数、组名、组与组之间的界限也就确定。例如,人口按性别分为男、女两组,具体到每一个人应该分在哪一组是一目了然的。

2.数量指标分组分析法

数量指标分组分析法是指选择数量指标作为分组依据,将数据总体划分为若干个性质不同的部分,分析数据的分布特征和内部联系。根据数据的性质(离散数据或者连续数据),它分为单项式分组和组距式分组。

  • 单项式分组

单项式分组一般适用于离散型数据*,而且数据值不多、变动范围较小的情况。每个指标值就是一个组,有多少个指标值就分成多少个组。如按产品产量、技术级别、员工工龄等指标分组。例如按照技术级别来分,有A、B、C三个组

  • 组距式分组

组距式分组,这是个是适用在连续数据上,指数据的变化幅度较大的条件下,将数据总体划分为若干个区间,每个区间作为一组,组内数据性质相同,组与组之间的性质相异。这里的组距式分组,也会分为两种的,一个是等距分组,这种方法适用在连续数据分布相对均匀的;另一个是不等距分组,适用在连续数据分布不均匀的状态。具体使用见下文:

a.等距分组:
第一步:确定维度、组数;
第二步:确定各组的组距;组距=(最大值-最小值)/组数;
第三步:根据组距,将数据划归至对应组内

b.不等距分组
第一步:确定维度、组数;
第二步:根据需求确定各小组的上限与下限
第三步:依据小组上下限进行分组
第四步:评估分组后数据结构是否满足需求
第五步:若满足,则停止;若不满足,则调整,从第一步循环

三:分组分析的应用

1.一维分类
定义一个维度(标准)将数据分析,常用一维分类
性别:男、女
年龄分段:青年、中年、老年
客户价值:低价值、中价值、高价值
用户状态:沉默用户、活跃用户
一维分类常用柱形图来做统计,比如下面的某小学各年级向灾区的捐款情况

2.二维分类
数据按两个维度分类时所列出的表,是由两个的变量进行交叉分类的分布表,也称为交叉分析。这里是常用表格来做展示,如下图某产品12月用户年龄与价值分布,从图中能够清楚看出青少年并且高价值的用户分布最多,所以在后面做营销策略的时候,可以做重点关注。

2.多维分类

但是有时一维和二维并不能满足我们的需求,需要多维分类(和二维分类一样都是称为交叉分析)满足需要。如下图(Excel中的透视表):


左边包含了以天为单位时间维和产品维,可以使用展开按钮进行汇总和展开,就像是细分的操作;上面的表头部分分两层罗列了地域维和指标维,这样我们就可以用“总-分”的角度观察数据,这对数据分析非常有用。

比如说某一天的销售额或转化率出现了大幅的下滑,我们就可以结合各种维度寻找问题的原因,就是基于各种维度的细节数据,展开产品维观察当天的哪类产品销售出现了问题,然后结合地域维的交叉数据,可以定位哪类商品在哪个省份的销售出现了问题,这样就有效地将问题定位到了细节的层面,能够更好地发现问题,进而解决问题。所以交叉分析其实正是体现了分析“分而析之”的本意。

推荐阅读更多精彩内容

  • 分组分析法是将总体数据按照某一特征划分成若干个部分再加以分析的一种方法。 分组分析法的含义 分组分析法是根据目标数...
    小明学数据阅读 2,872评论 0 6
  • 专业考题类型管理运行工作负责人一般作业考题内容选项A选项B选项C选项D选项E选项F正确答案 变电单选GYSZ本规程...
    小白兔去钓鱼阅读 7,743评论 0 13
  • 之前文章,讨论过数据分析方法论,以及其和数据分析法的区别,但并未对数据分析法做进一步的讨论,本文就做个补充。 先说...
    辰智阅读 720评论 0 4
  • 不知道大家是不是跟我一样,新年伊始,正月初便开始发愁假期没剩几天了,怎么办、怎么办?与亲戚朋友还没聚够呢,想去的地...
    黎璃晓阅读 158评论 0 0
  • 今年娘八十岁了,八十个春秋,八十年的风雨。一直有种想法,写一文作为生日礼物献给我娘,然却又是无从下笔,不知道该记...
    约之以礼阅读 27评论 0 0