深入浅出最大似然估计(Maximum Likelihood Estimation)

最大似然估计是利用已知的样本的结果,在使用某个模型的基础上,反推最有可能导致这样结果的模型参数值。

深入浅出最大似然估计

例子1:抽球

举个通俗的例子:假设一个袋子装有白球与红球,比例未知,现在抽取10次(每次抽完都放回,保证事件独立性),假设抽到了7次白球和3次红球,在此数据样本条件下,可以采用最大似然估计法求解袋子中白球的比例(最大似然估计是一种“模型已定,参数未知”的方法)。当然,这种数据情况下很明显,白球的比例是70%,但如何通过理论的方法得到这个答案呢?一些复杂的条件下,是很难通过直观的方式获得答案的,这时候理论分析就尤为重要了,这也是学者们为何要提出最大似然估计的原因。我们可以定义从袋子中抽取白球和红球的概率如下:

x1为第一次采样,x2为第二次采样,f为模型, theta为模型参数

其中theta是未知的,因此,我们定义似然L为:

L为似然的符号

两边取ln,取ln是为了将右边的乘号变为加号,方便求导。

两边取ln的结果,左边的通常称之为对数似然。
这是平均对数似然

最大似然估计的过程,就是找一个合适的theta,使得平均对数似然的值为最大。因此,可以得到以下公式:

最大似然估计的公式

这里讨论的是2次采样的情况,当然也可以拓展到多次采样的情况:

最大似然估计的公式(n次采样)

我们定义M为模型(也就是之前公式中的f),表示抽到白球的概率为theta,而抽到红球的概率为(1-theta),因此10次抽取抽到白球7次的概率可以表示为:

10次抽取抽到白球7次的概率

将其描述为平均似然可得:

10次抽取抽到白球7次的平均对数似然,抽球的情况比较简单,可以直接用平均似然来求解

那么最大似然就是找到一个合适的theta,获得最大的平均似然。因此我们可以对平均似然的公式对theta求导,并另导数为0。

求导过程

由此可得,当抽取白球的概率为0.7时,最可能产生10次抽取抽到白球7次的事件。

例子2:正态分布

假如有一组采样值(x1,...,xn),我们知道其服从正态分布,且标准差已知。当这个正态分布的期望为多少时,产生这个采样数据的概率为最大?

这个例子中正态分布就是模型M,而期望就是前文提到的theta。

似然
正态分布的公式,当第一参数(期望)为0,第二参数(方差)为1时,分布为标准正态分布
似然值
对上式求导可得


综上所述,可得求解最大似然估计的一般过程为:

1. 写出似然函数;

2. 如果无法直接求导的话,对似然函数取对数;

3. 求导数 ;

4. 求解模型中参数的最优值。

推荐阅读更多精彩内容

  • 转载 http://blog.csdn.net/zouxy09 EM算法是一种迭代算法,用于含有隐含变量的概率模型...
    Jlan阅读 1,852评论 1 13
  • 转载自最大似然估计(通俗易懂) 一、例子1 最大似然估计是建立在这样的思想上:已知某个参数能使这个样本出现的概率最...
    ShaderJoy阅读 822评论 0 2
  • 前面的文章主要从理论的角度介绍了自然语言人机对话系统所可能涉及到的多个领域的经典模型和基础知识。这篇文章,甚至之后...
    我偏笑_NSNirvana阅读 12,585评论 2 64
  • 本文转自 刘未鹏的博客! 概率论只不过是把常识用数学公式表达了出来。 记得读本科的时候,最喜欢到城里的计算机书店里...
    Bioquan阅读 3,699评论 1 29
  • 早上开心的事就是 睡醒的时候 看到你昨天晚上回我的 我来不及看到的内容 ​​​
    鸡腿饭先生阅读 134评论 0 0
  • 乍暖还寒时候,最难将息。三杯两盏淡酒,怎敌他、晚来风急。 冬末春初乍暖还寒很是难熬,尤其北方的冬天更胜...
    Xingfl阅读 213评论 0 0
  • 或许我与生俱来就是不完整的,这不是单纯意义上的身体缺陷,而是更深层次的,都说人有三魂七魄,而我似乎只有一魂三魄!我...
    257ff7fefd7b阅读 62评论 0 0
  • 曾经的远方,在到达后就不再向往了,反而故乡,却是破不急待要返回的地方。在远方饱受苦难,无论是精神上还是物质上,总是...
    anan安安阅读 108评论 0 0
  • -1- 每逢秋天,或者说秋雨如丝的时候。右膝盖就隐隐作痛,仿佛在提醒,心也该痛了。今天,痛的尤其厉害。 上班时鼓着...
    婴儿看世界阅读 181评论 7 2