机器学习:提升算法简介

提升算法概论:

Boosting(提升)是一族可将弱学习器提升为强学习器的算法。在分类问题中,它通过改变训练样本的权重,学习多个分类器,并将这些分类器进行线性组合,提高分类的性能。

提升算法基于这样一种思想: 对于一个复杂任务来说,将多个专家的判断进行适当的综合所得出的判断,要比其中任何一个专家单独判断好。

强可学习: 

在概率近似正确学习框架(PAC)中,一个概念(类),如果存在一个多项式的学习算法能够学习它,并且正确率很高,那么称这个概念为强可学习的。

弱可学习:

一个概念,如果存在一个多项式的学习算法能够学习它,学习的正确率仅仅比随机猜测略好,那么这个概念为弱可学习。

提升:

Schapire 证明强可学习和弱可学习是等价的,就是在概率近似正确学习框架(PAC)中一个概念强可学习的充分必要条件是这个概念是弱可学习的。

因此,如果发现了 弱学习 算法,理论上就存在 强学习算法,通常弱学习算法更容易发现,将弱学习算法 转化为强学习算法的方法便是提升。

提升算法基本思路:

从弱分类学习算法出发,反复学习,获取一系列弱分类器(基本分类器),然后组合这些弱分类器,构成一个强分类器。

提升算法的两个主要问题: 

     1. 如何构建弱分类器

      2. 如何将弱分类器组合成一个强分类器

围绕这两个问题,人们提出了很多提升算法,常见提升算法如下:

常见提升算法

AdaBoost (Adaptive)

   1. 提高那些被前一轮弱分类器错误分类的样本的权重,弱化正确分类的权重,这样一来,后续分类器重点关注之前分类器未关注到的样本,分类问题被一系列弱分类器分而治之。

   2. 采用加权多数表决来组合弱分类器。 加大误差小的分类器权重,减小误差大的权重。

Boosting Tree()  提升树

    以分类树,回归树作为基本分类器(弱分类器),对基本分类器进行线性组合(加法模型),采用前向分步算法。

    对于分类问题采用二叉分类树,回归问题采用二叉回归树。

    提升算法是统计学习中性能最好的方法之一。

Gradient boosting(GB)  梯度提升

   优化算法采用损失函数的负梯度作为残差的 近视值。

Gradient boosting Decision Tree(GBDT)  

    GBDT是GB和DT的结合,以决策时作为基函数,梯度提升算法为优化算法。

Xgboost  

   XGBoost是提升算法的高效实现,在各项机器学习、大数据比赛中的效果非常好。

  XGBoost与GBDT主要的不同在于其目标函数使用了正则项并且利用了二阶导数信息

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 151,688评论 1 330
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 64,559评论 1 273
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 101,749评论 0 226
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 42,581评论 0 191
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 50,741评论 3 271
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 39,684评论 1 192
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,122评论 2 292
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 29,847评论 0 182
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 33,441评论 0 228
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 29,939评论 2 232
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,333评论 1 242
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 27,783评论 2 236
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,275评论 3 220
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 25,830评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,444评论 0 180
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 34,553评论 2 249
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 34,618评论 2 249

推荐阅读更多精彩内容