Beam_search集束搜索

1.算法描述

Beam Search算法是以较少的代价在相对受限的搜索空间中找出其最优解,得出的解接近于整个搜索空间中的最优解。
Beam Search算法一般分为两部分:

  • 路径搜索:是指在受限空间中检索出所有路径
  • 路径打分:是指对某一条路径进行评估打分

Beam Search的一般步骤为:

  • 初始化beam_size个序列,序列均为空,这些序列称之为beam paths;
  • 取下一个Frame的前N个候选值(N一般为beam size或者更大,Frame内部侯选值已按照概率倒序排列),与已存在的beam paths组合形成N * beam_size条路径,称之为prob_paths;
  • 对prob_paths进行打分,取前beam_size个prob_path作为新的beam paths;
    若解码结束在完成算法,否则回到2。

注意:

beam_search只在test的时候需要。

2. motivation动机

(1)encoder-decoder框架

encoder-decoder.png
  • Encoder部分是一个两层的LSTM 神经网络,这个神经网络不做任何输出,只输出最后一步的h,c,我们可以理解这个h,c 是已经总结了的输入信息;
  • Decoder部分也是一个两层的LSTM 神经网络,并且其隐藏层h,c 的初始值为Encoder 部分输出的h,c,然后在Decoder 部分进行翻译。

注意在Encoder 部分每一步并不预测任何东西,其初始的h,c 为全零向量,并且与Decoder 是完全不同的参数。

(2)Beam Search

Mismatch between Train and Test

首先需要注意到模型训练和模型预测是两个不同的过程,在训练时,我们知道每一步真正的reference,而在预测时是不知道每一步的reference 的。


encoder过程.png

在上图的网络结构中,都是以上一时刻真正的reference 作为下一时刻的input 来训练模型。但是在预测阶段我们是不知道reference 的,我们可以尝试这样做,把上一次的输出作为下一次的输入。
如果一步错,可能步步错,造成严重后果


不适用beam-search的可能后果.png

3. 代码讲解

未完待续……

4.改进

论文1:A Simple, Fast Diverse Decoding Algorithm for Neural Generation

作者:Jiwei Li, Will Monroe and Dan Jurafsky
单位:Stanford
关键词:seq2seq, diversity, RL
文章来源:arXiv, 2016
问题:seq2seq模型decoder时改进beam search,引入惩罚因子影响排序结果,并加入强化学习模型来自动学习diversity rate,使得解码出的结果更具多样性
模型改进:对比标准beam search,本模型引入惩罚因子。


模型.png
论文2:DIVERSE BEAM SEARCH: DECODING DIVERSE SOLUTIONS FROM NEURAL SEQUENCE MODELS

作者:
Ashwin K Vijayakumar, Michael Cogswell, Ramprasath R. Selvaraju, Qing Sun1 Stefan Lee, David Crandall & Dhruv Batra
单位:
Virginia Tech, Blacksburg, VA, USA
Indiana University, Bloomington, IN, USA
关键词:
Beam Search; Diversity; Image Caption; Machine Translation; Visual Question Answer; Chatbot
文章来源:
arXiv, 2016.10
问题:
如何改进beam search解码算法,使其在seq2seq模型中可以生成更加丰富的结果?
模型:
经典的beam search算法以最大后验概率作为优化目标函数,每一个time step只保留B个最优的状态,是一种典型的贪心算法,这个经典算法常常被用于解码可选状态数量多的情形,比如生成对话、生成图片描述、机器翻译等,每一步都有词表大小的可选状态集。seq2seq模型的流行,让这种解码算法的研究变得热门。在生成对话任务时,用经典的beam search会生成类似“我不知道”等这种没有营养的对话,虽然没有语法上的错误,而且可能在一定的评价体系内会得到不错的分数,但实际应用效果太差,因此diversity的研究变得热门。
本文针对diversity的问题,提出了一种改进版的beam search算法,旨在生成更加多样性的话。
新算法的主要思路是将经典算法中的Beam进行分组,通过引入一个惩罚机制,使得每一组的相似度尽量低,这一项保证了生成的话相互之间差异更大一些,即满足了多样性的需求,在每一组Beam中,用经典的算法进行优化搜索。具体的算法流程如下图:


image.png
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 157,924评论 4 360
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 66,902评论 1 290
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 107,716评论 0 239
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,783评论 0 203
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,166评论 3 286
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,510评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,784评论 2 311
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,476评论 0 196
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,196评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,459评论 2 243
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,978评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,321评论 2 252
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,964评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,046评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,803评论 0 193
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,530评论 2 271
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,420评论 2 265

推荐阅读更多精彩内容