《Adversarial Multi-task learning for text classification》阅读笔记

论文来源:ACL2017    链接:paper

multi-task learning,学习shared layers to extract the common and task-invariant  features.通用和任务不变的特征

然而,现有的方法,提取共享特征往往会被特定任务的特征或者其他任务带来的噪音污染。

在本文,提出了一个adversarial对抗的 multi-task learning framework,缓解共享和私有潜在特征空间相互干扰。

目前的方法都将不同任务的特征分割到private and shared spaces,

对比

重叠部分是shared space,蓝色的代表task-specific特征,红色代表可以共享的特征

这种框架最大的缺点是:shared features可能包含一些不必要的与任务相关的特征,一些共享的特征也会混杂在private space中,有特征冗余的问题,feature redundancy

问题:"The infantile cart is simple and easy to use"和“This kind of humour” is infantile and boring。 这两句话中都有infantile,但是第一句话中是中性的情感,第二句话是negative的。但是通用的shared-private模型会把infantile放在一个共享的空间,给其他task带来潜在的危险。除此之外,shared space的容量也因为一些不需要的特征而被浪费了。

为了解决这个问题,本文提出了一个对抗的多任务框架,为了让共享和私有space是无关的,引入了正交性约束,orthogonality constraints。为了防止shared和private latent特征空间相互影响,本文提出了两种解决策略:一种是对抗训练adversarial training和正交约束orthogonality constraints. 对抗训练用于确保shared feature space只包含通用和任务不变(task invariant)的特征,正交约束用于去除private和shared space中的多余特征。

本文的贡献:1. 更精确的分割task-specific和shared  space,而不是共享参数。 2. 将原有的binary对抗训练扩展到multi-class,不仅可以让多任务jointly训练,同时也允许我们使用没有被标记的数据。3. 将多任务之间的共享信息压缩到一个off-the-shelf(现成的)神经层,可以很容易的转移到新任务。


用LSTM做文本分类:

有一个文本序列 x = {x1, x2, ..., xT},首先使用一个lookup layer来得到每个词的词向量,vector representation(embeddings)。最后一个时刻的输出hT可以看作整个序列的表示,然后有一个全连接层,softmax层预测类别的概率分布

预测的概率

数据集N, (xi, yi),网络的参数被训练,用来最小化预测的和真实分布之间的交叉熵。

交叉熵

多任务学习,文本分类

两种多任务的架构

多任务学习的目的是为了利用这些任务之间的关联来改进分类,by learning tasks in parallel。

数据集

多任务学习的关键点在于!!!:sharing scheme in latent feature space.    神经网络的潜在特征被看作隐藏神经元的状态。    特别对于文本分类,LSTM隐藏状态的潜在特征是一个句子的结束。sharing scheme在如何分组shared特征上是不同的,有两种方法:fully-shared scheme和shared-private scheme


Fully-shared model(FS-MTL) figure 2a:

用单层LSTM提取所有任务的特征,这个模型忽视了一个事实:一些特征是task-dependent的,依赖于任务的。


Shared-Private Model(SP-MTL)figure 2b:

每个任务有两种特征空间:一个用于存储task-dependent的特征,另一个用于抓取task-invariant特征。对于任务k中的任意句子,可以计算它的shared representation stk和 task-specific representation htk:

shared representation和task-specific representation

最终的特征是来自私有空间和共享空间的特征连接,concatenation


task-specific output layer:

对于任务k中的句子,它的特征h(k),最终进入相应的task-specific softmax层,为了分类或其他任务。所有任务的预测和真实分布之间的交叉熵

loss

ak 是task k的权重


结合对抗训练Incorporating adversarial training

结合对抗训练的多任务框架

对抗网络的损失:

对抗网络的损失

本文提出了对抗shared-private模型 for multi-task learning,一个共享的RNN层 is working adversarially towards a learnable multi-layer perceptron多层感知器,防止它对任务类型做出准确的预测。对抗训练可以使共享空间更纯净并且确保了共享的representation不被task-specific特征污染。

任务分类器 Task Discriminator:将句子的shared representation映射到一个概率分布,估计句子编码来自那个task。

任务分类器

对抗损失Adversarial Loss:增加了task adversarial loss Ladv来防止task-specific特征跑进shared空间中。这个loss用来训练模型来产生shared特征,一些一个分类器不能完全依赖用来预测任务种类的特征。

原有的对抗网络的损失很有限因为它是二元的,为了克服这个,我们扩展它到多类别的形式。

损失

dik是当前task分类的label。给定一个句子,shared LSTM生成一个representation来误导任务分类器;同时,分类器尝试去对任务的分类做正确的分类。在训练阶段,shared特征提取和任务分类器达到一个特定点,两个都无法再改进,并且分类器也不能区分所有任务。


半监督多任务学习 Semi-supervised Learning Multi-task Learning:

Ladv只需要input sentence并且不需要label y,所以可以将本模型与半监督学习联系起来。最后,本模型不仅可以利用相关任务的数据,同时可以应用于abundant unlabeled corpora。


正交约束orthogonality constraints

上面模型的缺点,一些task-invariant特征可能出现在shared空间和private空间


损失:

最终的损失

使用BP,使用一个gradient reversal layer(梯度反向层)使得minimax优化可行

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,233评论 4 360
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,013评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,030评论 0 241
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,827评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,221评论 3 286
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,542评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,814评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,513评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,225评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,497评论 2 244
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,998评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,342评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,986评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,055评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,812评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,560评论 2 271
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,461评论 2 266

推荐阅读更多精彩内容