统计学习方法思路疏导—逻辑回归与最大熵

二项逻辑回归

二项逻辑回顾是分类模型,由条件概率 P(Y|X) 表示,其中随机变量 X 取值为实数,而随机变量 Y 取值为 1 或 0

模型公式

逻辑回归公式.jpg

模型参数估计

逻辑回归的参数模型一般使用梯度下降函数来求解参数 w
这里说一下似然估计,似然估计是利用已知的样本集反推最有可能导致结果的参数值,即什么参数会导致训练集的呈采集数据那样分布的。比如有一个训练集 X ,我们通过对 X 进行反推去找出让训练集呈现如同 X 一样分布的 w,当然了,是最大可能性的 w,因为 w 会有很多个,我们只找出可能性最大的那一个。

步骤如下:

  1. 根据二项逻辑回归模型公示写出似然函数
  2. 对似然函数求极大化找出参数,在吴恩达机器学习公开课中似然函数是作为损失函数来表示
  3. 极大化似然函数可以通过梯度下降法来求解

参考《统计学习方法》,吴恩达机器学习公开课

最大熵模型

最大熵模型的作用是在没有太多特征数据的情况下,默认模型的概率分布是最均匀的,也就是混乱度是最大的,熵越大,混乱度越大。所以称为最大熵。我们是默认自然界的事物总是向混乱的趋势发展,所以我们在没有太多特征数据的情况下,默认模型的概率也是按照混乱趋势来进行分布。

  • 经验分布:
    经验分布.jpg
  • 边缘分布:
    边缘分布.jpg

特征函数

我们定义一组函数 f(x,y) ,用于描述 x 与 y 之间的关系,它是二值函数,如果 x 与 y 满足某一事实,则为1,否则为0

  • 特征函数关于经验分布的期望值:
    经验分布期望.jpg
  • 经验函数关于模型P(X|Y)与边缘分布的期望值:
    边缘分布期望.jpg

引入特征函数是因为 x 在某种情况下(这里的情况可以理解为一个特征),输出 y 的概率会更好,我们需要求的是在满足这些情况下的最大熵模型,即在特征情况发生时, 输入 y 的概率增大,其余情况 y 的概率平分

模型求解原理

最大熵模型通过最大化条件概率分布的条件熵 H(P)来求解模型

条件熵.jpg

而最大化则是在 将所有的特征函数作为约束条件的情况下,最大化条件熵求解得到模型

引入特征函数的意义在于:让模型 P(Y|x) 在满足特征的情况下,使得模型的的熵最大

由此最大熵模型可以形式化为求解约束最优化问题

我们在样本量足够大的情况下,可以认为:
相等.jpg

而这个就是我们的约束条件,这个约束条件对所有的 f(x,y) 都成立
请注意到:*f(x,y) 是存在多个的

对偶化

约束最优化问题可以通过对偶问题来解决。

  • 原始问题:
    原始问题.jpg
  • 对偶问题:
    对偶问题.jpg

这里不对拉格朗日函数进行描述,请查看《统计学习方法》,但是要注意到,在引入拉格朗日乘子后,我们的拉格朗日函数就多了一个参数 w ,而这个参数就是我们要求的模型参数了,即求解 w 就是求解模型

通过求解对偶问题的最优解找出原始原题的最优解,我们先对对偶问题的最小化求解,记有式子,称为对偶函数:
对偶函数.jpg

我们对对偶函数进行求导并让求导式子等于 0(这里的求导也就是将 w 作为常数,而P(Y|X)做为变量进行求导) ,可以求出 P(Y|X) 的表达式(P就是P(Y|X)的缩写,求出来P的表达式是带有 w 的,详见《统计学习方法》)

那么求出了最小化之后,我们需要对最大化问题进行求解,那么问题归结为最大化对偶函数来求解,如下:(左边就是我们求出来的解了)

最大化.jpg

将P(Y|X) 代入拉格朗日函数,通过式子推导我们可以得到结论:最大化对偶函数等价于最大熵模型的极大似然估计(详见《统计学习方法》)

所以问题形式化为求解最大熵模型的极大似然函数,关于最大熵模型的似然函数推导的过程在下方

极大化似然函数

极大化似然函数可以通过以下几种办法进行求解

  • 改进的迭代尺度法:就是不断通过推导出函数下界,最终对下界求收敛值来求解参数
  • 拟牛顿法

总结流程

  1. 确定最大熵模型为条件概率 P(Y|X),也就是求解熵最大的 P(Y|X) 表达式
  2. 引入特征函数作为约束
  3. 确定模型的形式化问题,即最大化的约束下的条件熵
  4. 约束问题转化为对偶形式来解决,此时拉格朗日函数引进了参数 w
  5. 通过求解对偶问题的最小化部分来求得 P(Y|X) 带有参数 w 的表达式
  6. 求解对偶问题的最大化部分
  7. 通过证明可以知道对最熵模型的极大似然估计就是求解对偶问题的最大化
  8. 通过拟牛顿法等方法进行极大似然估计求解参数 w
  9. 解决问题

极大化似然函数

最大熵模型似然函数推导

对于样本集中的每个样本X,设其概率为p(x)
似然函数在数值上等于概率,但似然函数是利用已知的样本结果反推最有可能导致这样结果的参数值
例如,假设 w 是参数,x 是变量,那么x我们有样本集,我们可以通过 x 反推 w。
根据似然函数的定义,我们有以下的式子

似然函数.png

假设变量x有k个取值,分别为v1,v2,v3,...,vk 我们使用 C(X=vi) 表示在样本集X的值为 vi 的频数,即出现了多少次 vi ,我们有如下式子


似然函数1.jpg

注意:上式中的累乘个数从 n 变成了 k

两边分别去n的开方

似然函数2.jpg

x经验概率是:
x经验概率.jpg

所以最终可以得到似然函数如下

似然函数3.jpg

上式中左边一项是 1/n 次方,是一个单调递增函数,所以我们极大化左边一项,就相当于极大化下面的式子(只是左边去掉了1/2次方,并简写了表达式),注意,连乘号下面从 i 变成了 x ,这里的 x 是值输入变量 X 的取值,我们一共有 k 个取值嘛,那 x 就是K个取值中的 1 个

似然函数4.jpg

注意:累乘的个数从 k 变成了 x,这里说明一下,这个只是简写而已,本质上是一样的,因为P(x)=P(vi),我们只是把 vi 换成了 x

假设对数似然函数是对原本的似然函数取对数,我们可以得到如下式子:

似然函数6.jpg

对于最大熵的似然函数,我们用(x,y)代替原来的x(即原来是单个变量的分布,现在是两个变量的概率分布)。因为最大熵是2个变量的概率分布,即在输入x的情况,得到y的条件概率,不是单个变量的概率分布。得到如下式子:


似然函数7.jpg

其中第二项可知为常数,此时似然函数可以取第一项进行极大化即可,所以最大熵的似然函数如下,将其极大化即可

参考:

似然函数的本质意义:https://blog.csdn.net/weixin_40499753/article/details/82977623
最大熵模型中的对数似然函数的解释:https://blog.csdn.net/wkebj/article/details/77965714
最大熵模型中的数学推导:https://blog.csdn.net/v_july_v/article/details/40508465

后语

逻辑回归在吴恩达的机器学习中有更为详细的描述,思路也不难,建议没接触的读者去了解。笔者发现吴恩达对于逻辑回归的损失函数的表达就是书中的似然函数。如果笔者有错漏的地方,也烦请各位读者海涵指正。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 160,026评论 4 364
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,655评论 1 296
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,726评论 0 244
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,204评论 0 213
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,558评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,731评论 1 222
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,944评论 2 314
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,698评论 0 203
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,438评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,633评论 2 247
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,125评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,444评论 3 255
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,137评论 3 238
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,103评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,888评论 0 197
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,772评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,669评论 2 271

推荐阅读更多精彩内容