Do Deep Nets Really Need to be Deep?

一、主要思想

用一种模型压缩( Model Compression)[2]的方法训练浅层网络来模仿深层网络,得到只有一个隐藏层的浅层网络。 Shallow nets can be trained that perform similarly to complex, well-engineered, deeper convolutional architectures,文章通过实验验证了这一结论,并推论 there probably exist better algorithms for training shallow feed-forward nets than those currently available only by deep models.


  • 当复杂模型可以被浅层模型来模拟时,就说明复杂模型的内在 function 并不是真正复杂的。模型的复杂性,和模型表达能力的复杂度是两回事。

二、 Training Shallow Nets to Mimic Deep Nets

1、training a state-of-the-art deep model

2、training a shallow model to mimic the deep model.

1. Model Compression

        将未标签的数据输入 teacher model,得到的分数拿去训练 student model model,it is trained to learn the function that was learned by the larger mode。主要问题在于学习模型的复杂程度和达到最好学习效果的 size of the representation。
       浅层网络在原始数据上直接训练要比深层网络更容易过拟合,所以采用模型压缩的方法就相当于一种正则化手段来缩小浅层网络和深层网络之间的 gap,如下图

gap

2.Mimic Learning via Regressing Logit with L2 Loss

        shallow mimic models 的训练采用 softmax 层前的 Logit 输出, The logit values provide richer information to student to mimic the exact behaviours of a teach model.

3.Speeding-up Mimic Learning by Introducing a Linear Layer

        模拟模型层数少,但节点多,运算非常慢,收敛的也慢,因此在输入层和非线性隐藏层之间加入一个线性层(含有 k 个 units),由于线性层可以被吸收到权重矩阵中,所以加入线性层之后,新的模型具备和原来一样的表达能力。
这样重新参数化权重矩阵不仅提高了收敛速度,也大大降低了内存空间,这样也就允许训练更大的浅层网络

4 Discussion

  1. 为了学习更难的深层模型,加入了一个卷积层和池化层。
    SNN-MIMIC models for CIFAR-10 thus consist of a convolution and max pooling layer followed by fully connected 1200 linear units and 30k non-linear units.
  2. shallow models with a number of parameters comparable to deep models are likely capable of learning even more accurate functions if a more accurate teacher and/or more unlabeled data became available


  3. 浅层网络更加适合当前的并行计算设备,计算速度更快,需要更少的计算周期(cycles),更适合实时项目。

三、总结

  1. 本文的模型压缩算法使得在精确度和计算消耗上的权衡更容易了。
    This approach allows one to adjust flexibly the trade-off between accuracy and computational cost
  2. Developing algorithms to train shallow models of high accuracy directly from the original data without going through the intermediate teacher model would, if possible, be a significant contribution.
  3. 深度学习的优势可能来自于其深度结构和当前训练方法的 good match 。

For a given number of parameters, depth may make learning easier , but may not always be essential .

**参考文献:
[1] Lei Jimmy Ba, Rich Caruana. Do Deep Nets Really Need to be Deep? NIPS 2014· ·
[2] Cristian Bucilu, Rich Caruana, and Alexandru Niculescu-Mizil. Model compression. ACM SIGKDD, 2006

注:[2]主要是将复杂的集成模型转化成单层神经网络,结果是:mimic neural nets are 1000 times smaller and 1000 times faster。并且作者认为任何算法模型都可以通过模型压缩方法用简单的神经网络来模拟实现。
· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,736评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,167评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,442评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,902评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,302评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,573评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,847评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,562评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,260评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,531评论 2 245
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,021评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,367评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,016评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,068评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,827评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,610评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,514评论 2 269

推荐阅读更多精彩内容

  • 2018年6月8日 星期5 天气晴 88天 这是个吉祥的数字,上午去御景尊品工地看了看,一切正在进行...
    一个小老汉阅读 78评论 0 0
  • 昨天一天的疯玩,蛋哥实在累了。开心的小脚通过走路发出的跳跃声你都能听到。 他的运气不错,一块钱的弹子能打很久,每次...
    耳东小猫熊阅读 232评论 0 1
  • 一丝愁意眉间聚,玉面凝思泪欲含。 心事万千无处寄,遮云明月诉窗前。 作者王永豪(注:新韵)
    王永豪阅读 396评论 0 7
  • 暮春的傍晚层层夜幕渐渐笼罩白天鸟语花香,明媚绚烂的校园 呜呜…呜…哇…… 一阵幽怨哀恸的抽泣声从僻静的一角清晰地送...
    坚冰至_Monsol阅读 688评论 2 49