数据分析基础—5.3 平均分析法

96
小明学数据
0.1 2018.07.17 11:54* 字数 1681

平均分析法是利用平均数指标来反映某一特征数据总体的一般水平。

平均分析法的含义

它是通过特征数据的平均指标,反映事物目前所处的位置和发展水平。再对不同时期、不同类型单位的平均指标进行对比,说明事物的发展趋势和变化规律。

平均分析法的分类

在运用平均分析法时,对不同的特征数据所采用的平均指标有所不同。常用的平均指标如图:

在数据集合中,所有数据都参与计算得到的平均数称为数值平均数,包括算术平均数、几何平均数等。

在数据集合中,按照数据的大小顺序或出现的频率,选出一个代表值,称为位置平均数,包括中位数和众数等。

数值平均数

是根据数据集合中全部数据计算出来的平均数,所以数值平均数更能体现数据集合的平均水平,包括算术平均数、几何平均数等。

1、算术平均数

算术平均数是利用平均数指标反应特征数据的一般水平,它分为简单算术平均数和加权算术平均数。

a、简单算术平均数

将数据集合中所有数据之和除以数据个数即为简单算术平均数。假设有一组包含n个数据的数据集合:

该数据集合的简单算术平均数公式为:

例如:某房产中介前六个月的二手房成交数量分别人28套、37套、26套、37套、44套、50套,那么上半年的月平均成交量为多少套:

b、加权算术平均数

加权算术平均数是计算具有不同权重的数据的算术平均数。

所谓数据的权重是反映一个数据在数据集合中的重要性,一般用权数来表示。

将数据集合中各数据乘以相应的权数,然后加总求和再除以所有权数之和,即为该数据集合的加权算术平均数。它适用于已分组数据集合。

假设有一组数据集合,包含k个数据组,各组的简单算术平均数分别为:

每组数据的数据个数分别为:

每组数据的个数就是该组数据的权数,那么加权算术平均数的公式为:

例如:某水果超市购入苹果200斤,每斤3.5元;香蕉180斤,每斤3.3元;葡萄260斤,每斤4.2元,那么所购入的水果平均每斤多少元,通过加权算术平均数公式可得:

算术平均数能更好地反映一组数据的平均水平,应用最为广泛,但也存在分析缺陷,当数据集合中存在极端值时,分析结果往往不能反映数据的真实特征,假设对一个数据集合{23、30、32、…、70、3000}取算术平均数,因为最后一个数据是极大值,其结果会发生偏离,这时可以考虑使用位置平均数进行分析。

2、几何平均数

在分析产品合格率、银行利率、平均发展速度等问题时,数据之间的关系不是加减关系,而是乘除关系,应运用几何平均数分析。

将数据集合中的n个数据连乘积的n次方根称为几何平均数。

假设一个数据集合的数据分别为:

且所有数值都大于0,那么该数据集合的几何平均数公式为:

例如:某工厂有一条生产线有三道工序,每道工序的产品合格率分别为93%、88%、94%,计算这条生产线的平均合格率。

由于只有合格品才能进入下一道生产工序,所以每道工序的合格率之间是乘积关系,利用几何平均数公式分析可得:

位置平均数

位置平均数是在数据集合中选取一个能够反映数据特征的代表值,不需要所有数据参与计算,包括中位数和众数。

1、中位数

将数据集合中所有数据按大小顺序进行排序,如果数据个数为奇数,最中间位置的数据称为该数据集合的中位数,如果数据个数为偶数,那么中间两个数据的算术平均数称为该数据集合的中位数。

例如:数据集合{2、3、6、8、9、11、13}的中位数为8;数据集合{8、9、12、15、16、18、20、22}的中位数为(15+16)/2 = 15.5。

当数据集合中存在极大值或极小值时,一般运用中位数来代表该数据集合的平均水平。

2、众数

数据集合中出现次数最多的数据称为该数据集合的众数。

如果有多个数值出现次数相同且最多,那么这几个数据都是该数据集合的众数。如果数据集合中所有数据出现次数相等,那么这个数据集合没有众数。

例如:数据集合{3、5、6、7、8、8}的众数8。数据集合{5、5、6、8、9、10、10}的众数是5和10。

当一个数据集合中数据分布比较大,且某个数据出现的频率较高时,适合运用众数来代表数据集合的平均水平。

综上所述、通过几种平均指标的介绍,了解平均分析法的应用。在数据分析中,平均分析法一般要结合分组和对比等分析方法,对不同时期、不同企业、不同区域等平均指标进行对比,说明事物的发展趋势和变化规律。


数据分析基础