[ML-02]数学基础-概率论

大纲 内容和意义

  1. 概率的概念:离散,连续的值的概率

  2. 例子1:每个盒子至多一个球的概率

  3. 概率公式:常见公司,贝叶斯示例

  4. 常见概率分布-离散型

  5. 常见概率分布-连续型

    Q:概率和机器学习到底关系多大呢?
    A: 噪声的分布经常都是正态分布;
    指数分布是一般线性回归的分布的主要形式;
    泊松分布可以用来模拟以时间序列发送的事件,具有无记忆性;

1.概率的概念


概率:P(x)∈[0,1]
  • X为离散值,则P(X=X0)表示X0发生的概率
  • X为连续值,则P(X=X0)表示X0发生的概率密度
累积分布函数:F(a)=P(x<=X0)
  • F(X0)是单增的
  • min(F(X0))=0 , max(F(X0))=1

遇到一个函数,若是单增,且值域为[0,1]则该函数可以看做是概率累积函数

2. 概率求解示例


解决问题的基本套路:(有效事件数量)/(总事件数量)

n个球放N个盒子,n<=N,求每个盒子最多一个球的概率


每个盒子至多一个球的概率
引出组合的概念

n个商品分为k组,每组个数分别是n1,n2...nk,则不同分组方法
一共有n!/ (n1!n2!...nk!)种方法

简化上述问题,n个商品分为2组,第一组m个,第二组n-m个,则分组方法
一共有n!/ (m!(n-m)!)种方法

这就是n个里面选m个,即组合数C(m,n)

3.概率公式


基本概率公式
手动版贝叶斯

8个枪,5个好的3坏的,好枪命中率0.8,坏枪0.3。现在随机拿一把,射击中靶。求是好枪的概率。
已知条件整合

  • P(好枪)=5/8 , P(坏枪)=3/8
  • P(中 | 好枪)=0.8,P(不中 | 好枪)=0.2
  • P(中 | 坏枪)=0.3,P(不中 | 坏枪)=0.7
    求解问题:** P(好枪 | 中)=?**


    手动版贝叶斯

贝叶斯公式

贝叶斯公式

先验概率 P(θ):系统本身事件θ发生概率
后验概率 P(θ|x):在数据x的条件下,事件θ发生概率
似然函数 P(x|θ):给定参数θ的概率分布

4.常见概率分布-离散型


目录

  1. 0-1分布
  2. 几何分布
  3. 超几何分布
  4. 多项分布
  5. 泊松分布
0-1分布
0-1 Distribution(0-1分布)
几何分布
Geometric Distribution(几何分布)
超几何分布
Hyper Geometric Distribution(超几何分布)
贝努利分布/二项分布
贝努利分布/二项分布
多项分布
Multinomial Distribution(多项分布)
泊松分布
Poisson Distribution (泊松分布)

泊松分布补充说明
一个随机事件,以固定平均瞬时速率随机且独立出现,呢么这个事件在单位时间内出现次数就近似服从泊松分布

  • 某一服务设施,一定时间内到达的人数
  • 电话交换机接到的呼叫次数
  • 汽车站台的候客人数
  • 机器出现故障数
  • 自然灾害发生次数
  • 一个产品的缺陷数
  • 单位分区细菌分布数
  • 放射性物质单位时间发出粒子数

5.常见概率分布-连续型


目录

  1. 均匀分布
  2. 指数分布
  3. 正态分布
均匀分布
均匀分布
指数分布
指数分布
正态分布
正态分布

推荐阅读更多精彩内容