单样本检验:引擎排放标准是否达达到要求

单样本检验 案例练习
根据政府要求新排放标准:引擎排放平均值<20ppm,才到达环保的要求。

有某家生产汽车引擎的公司,需要测试该公司的引擎排放是否达到标准。

现在有10台引擎供测试使用,每一台的引擎排放水平的数据分别为:15,6,16.2,22.5,20.5,16.4,19.4,16.6,17.9,12.7,13.9

如果知道该公司的引擎是否达到政府要求的排放标准呢?

一、求样本平均值和样本标准差

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

#样本数据集
dataSer=pd.Series([15.6,16.2,22.5,20.5,16.4,19.4,16.6,17.9,12.7,13.9])

#样本平均值
sample_mean=dataSer.mean()
#样本标准差
sample_std=dataSer.std()
print('样本平均值=',sample_mean, '单位:ppm',' 样本标准差=',sample_std,'单位:ppm')
样本平均值= 17.169999999999998 单位:ppm  样本标准差= 2.9814426038413018 单位:ppm

二、推论统计分析

1.问题是什么?

问题:公司引擎排放是否到达政府要求的标准?

零假设和备选假设

根据问题我们提出零假设和备选假设:

零假设:公司引擎排放不满足标准,也就是平均值u>=20

备选假设:公司引擎排放满足标准。也就是平均值u <20

其中零假设总是表述为研究没有改变,没有效果等,这里就是指不满足标准。

得出公司引擎排放满足标准,也就是平均值<20

检验类型

由于这里只有一个样本,所以是单样本检验

import seaborn as sns
sns.distplot(dataSer)
plt.title("数据集分布")
plt.show()

这里汽车引擎样本大小是10(小于30)是属于小样本,根据数据集可知样本分布近似正态分布,所以抽样分布属于t分布

检验方向

因为备选假设是引擎的排放量平均值u<20,所以该检验方向为单尾检验中的左尾检验。

2.证据是什么?

在零假设成立前提下,得到样本平均值的概率p是多少?

计算标准误差和 t的值

1)计算标准误差

标准误差=样本标准差除以样本大小n的开方。

2)计算t值

t=(样本平均值-总体平均值)/标准误差

3)根据t值,查找t表格,得到概率p值

#导入stats模块
from scipy import stats
#样本大小10 
n=10
#标准误差=样本标准差/(n的开方)
se=sample_std/(np.sqrt(n))

#总体平均值:就是政府发布的标准20
pop_mean=20
#t值
t=(sample_mean-pop_mean) / se
#计算出t值=-3
print('标准误差se=',se)
print('t=',t)
标准误差se= 0.9428149341201592
t= -3.001649525885985
#用python统计包scipy自动计算,用scipy计算出的是:双尾检验
pop_mean=20

t,p_twoTail =stats.ttest_1samp(dataSer,pop_mean)

print('t值=',t,'双尾检验的p值=',p_twoTail) 
t值= -3.001649525885985 双尾检验的p值= 0.014916414248897527

因为scipy计算出的是双尾检验的t值和p值,但是我们这里是左尾检验。
根据对称性,双尾的p值是对应单尾p值的2倍

#单尾检验的p值
p_oneTail=p_twoTail/2

print('单尾检验的p值=',p_oneTail)
单尾检验的p值= 0.0074582071244487635

3. 判断标准是什么?

# 判断标准这里设置alpha=5%
alpha=0.05

if(t<0 and p_oneTail<alpha):
    print('拒绝零假设,有统计显著,公司生产的引擎排放量符合标准')
else:
    print('接受零假设,没有统计显著,公司生产的引擎排放量不符合标准')
拒绝零假设,有统计显著,公司生产的引擎排放量符合标准

4.求置信区间

求置信区间的公式:

下限a=样本平均值-t_ci*标准误差

上限b=样本平均值+t_ci*标准误差

通过查找t表格,得出95%置信水平下的t_ci值 ,自由度是n-1对应的t值 t=2.262

t_ci=2.262
#标准误差
se=stats.sem(dataSer)
#求a和b的值
a=sample_mean-t_ci*se
b=sample_mean+t_ci*se

print('置信区间,95置信水平CI=[%f,%f]'%(a,b))
置信区间,95置信水平CI=[15.037353,19.302647]

5.效应量

效应量是指处理效应的大小

在判断某个调查研究的结果,是否有意义或者重要时,要考虑的另一项指标是效应量。效应量太小,意味着处理即使达到了显著水平,也缺乏实用价值

所以,在假设检验中,我们给出了有统计显著性和效应量,一起来判断在研究的这个结果是否有意义。

衡量效应量的指标有两个:

1.差异指标d值

Cohen's d = (样本平均值1-样本平均值2) / 标准差

2.相关度指标R平方

R2=t2/(t2+df) 其中r2是指r的平方,t2是t的平方

#样本大小
n=10
#自由度
df=n-1
d=(sample_mean - pop_mean) / sample_std
R2=(t*t)/(t*t+df)
print('d=',d,'R2=',R2)
d= -0.9492049239364257 R2= 0.5002748453994631

三、数据分析报告

1、描述统计分析

样本平均值17.17ppm,样本标准差2.98ppm

2、推论统计分析

1)假设检验

独立样本t(9)=-3.00,p=.0074(α=5%),单尾检验(左尾)

公司引擎排放满足标准

2)置信区间

平均值的置信区间,95% 置信水平 CI=[15.037353,19.302647]

3)效应量

d=-0.9492

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,847评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,208评论 1 292
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,587评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,942评论 0 205
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,332评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,587评论 1 218
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,853评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,568评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,273评论 1 242
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,542评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,033评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,373评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,031评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,073评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,830评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,628评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,537评论 2 269

推荐阅读更多精彩内容

  • 项目背景 公司为了提高生产效率、降低人力成本,决定研发一台机器用于自动化生产,其中这台机器生产的产品有一个关键的尺...
    陈容喜阅读 2,280评论 0 4
  • 1. 简述相关分析和回归分析的区别和联系。 回归分析和相关分析都是研究两个或两个以上变量之间关系的方法。 广义上说...
    安也也阅读 8,343评论 0 3
  • 从湘潭回来后,因为太过兴奋,没有好好休息,导致得了带状疱疹!晕死!作死,不睡觉,就这样的结果。所以,现在,摄影,体...
    有趣的谷粒阅读 469评论 0 1
  • 人生不能在恐惧中渡过
    871263354579阅读 155评论 0 0
  • 情人的爱,不是没有目的。情人的爱,我们很难评判谁对谁错。女人做情人,或是为了爱,或是情非得已。 女人为什么要做情人...
    小卡布笔录阅读 1,532评论 0 1