数据分析入门基础---统计学(笔记,附学习资料)

96
马小野
2018.08.13 16:33* 字数 1227

文章仅为统计学基础知识的学习笔记,供快速查找。如果只需要电子书及视频学习资料,拉到文尾自行提取(无密码)。

第一章 变量和图形

统计学:科学方法收集、整理、汇总、描述和分析数据资料,并在此基础上进行推断和决策的科学;

归纳统计学/统计推断:通过样本分析来给总体下结论

描述性统计学/演绎统计学:值描述和分析特定对象而不下结论或推断

变量、常量、连续变量、离散变量、连续数据、离散数据

自变量、因变量、函数、单值函数、多值函数

第二章 频数分布

数组阵列:原始数据按照数量大小升序或者降序排列,最大值与最小值的差为全距;

组距、组限、组界、组中值、直方图与频率多边形

频率分布=某一组频数/总频数

累计频数分布/累计频数表,累计频数多边形/卵形线

累计频率分布/百分率累计频数=累计频数/总频数

第三章 均值、中位数、众数及其他表示集中趋势的度量

1、平均值/集中趋势的度量:趋向落在根据数值大小排列的数据的中心

算术平均:

加权算术平均:

2、中位数:一组数根据数量大小排列后的做兼职或者两个中间值的算术平均值

3、众数:一组数出现次数最多的那个数,众数不一定存在,也不唯一

均值、中位数和众数之间的关系:

4、几何平均G

5、调和平均H

算术平均、几何平均和平均之间的关系

6、均方根RMS

第四章 标准差和其他表示利差的度量

离差/变差:数值数据围绕其平均值分布的分数与集中程度,常用的有全距、平均偏差、半内四分位数间距,10-90百分位数间距、标准差;

1、全距:最大值-最小值

2、平均偏差

3、半内四分位数间距

4、10-90百分位数间距

5、标准差

6、方差:标准差的平方

离差度量间的关系

第五章 矩、偏度和峰度

1、矩

2、r阶中心矩

3、偏度:分布不对称程度或偏离对称程度的反映


4、峰度:分布的陡峭程度,尖峰、扁峰、常峰态

第六章 初等概率论

1、概率

2、条件概率,独立和不独立事件


3、互不相容事件:两个或多个事件中,任意两个事件都不能同时发生

4、概率分布

离散型:离散型概率分布

连续型:概率密度函数、连续型概率分布

5、数学期望

如果一个人活得S美元的概率为p,则他的数学期望=pS

第七章 二项分布、正态分布和泊松分布

1、二项分布


2、正态分布


正太分布与二项分布的关系

3、泊松分布

4、多项分布

第八章 初等抽样理论

随机样本、随机数、有放回和无放回抽样

1、抽样分布

均值的抽样分布

2、标准误差

一个统计量的抽样分布的标准差常称为该统计量的标准误差

第九章 统计估计理论

1、无偏估计

2、有效估计

3、点估计和区间估计

第十章 统计决策理论

统计假设、零假设/原假设、备择假设

假设建业、显著性检验/决策法则

1、第一类和第二类错误

2、正太分布的检验、双边检验和单边检验、特殊检验、OC曲线

第十一章 小样本理论

样本容量N<30时,称为小样本,对小样本统计量的抽样分布的研究称之为小样本理论,得到的结论不仅适用于小样本问题,也适用于大样本问题,也称为精确抽样理论。

1、t分布


第十二章 曲线拟合和最小二乘法









概率为p,则他的数学期望=pS


电子书资源:

大数据的统计学基础  https://pan.baidu.com/s/1AwT9gav5pK0xcjhgc6YchQ

统计学基本概念、统计学(第三版) https://pan.baidu.com/s/1BRhZgcGuDMelSuFWx4eLLA

数据
Web note ad 1