Attribute-Enhanced Face Recognition with Neural Tensor Fusion Networks

image

1.论文相关

论文题目:Hu, Guosheng, et al. "Attribute-Enhanced Face Recognition with Neural Tensor Fusion Networks." Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017.
原文链接:http://yang.ac/papers/Hu2017Attribute.pdf

2.摘要

image

  本文作者提出了一种基于张量的图像特征融合方法。证明这种张量融合方法和神经网络等价之后,作者直接使用神经网络来学习并得到最终融合后的特征。最后的实验证明,融合后的特征在MultiPIE,CASIA NIR-VIS2.0和 LFW 数据集上都取得了不错的效果。

3.相关工作

  得益于大数据和深度学习的支持,人脸识别技术最近取得了长足的进步。不过,由于特征提取方法的局限,人脸识别技术在处理姿态变换问题时尚有不足。比如当一个人正面面对我们和侧面面对我们时,传统的提取特征方法提取到的特征FRF(face recognition features)肯定是不同的,这就会降低我们的识别准确率。而另一种特征FAF(face attribute features)对于光照和分辨率以及姿态变换则很鲁棒。什么是FAF呢?顾名思义,就是用一组属性来描述人脸特征。比如,一个人的外貌可以描述为“大鼻子,大眼睛,小嘴巴,高鼻梁,厚眉毛”,无论这个人以如何的姿态面对镜头,他的这些属性特征是不会改变的(比如不管正脸还是脸,大鼻子还是大鼻子),所以说FAF具有一些很鲁棒的特性。但是,单独用“大鼻子,大眼睛,小嘴巴,高鼻梁,厚眉毛”这些属性来描述一个人外貌又显得不够有区分性,因为长这样的人实在太多了。所以,本文作者为了充分利用两种特征的互补性,将FRF和FAF二者特征用基于张量的方法融合。由于求解张量特别繁琐,作者发现这个求解过程完全可以用一个神经网络来等价。于是作者最终使用神经网络来获取最终融合后的特征,降低了计算的复杂程度,并且取得了不错的效果。

4.具体方法

4.1目标函数

  以简单的多分类问题举例。

  对于一个特征来说,特征x和标签y之间的关系可以用矩阵W来建模,他们的关系如下:
image

而对于多个特征,比如2个特征
image

,其中x表示FRF特征,z表示FAF特征,他们的关系也可以用一个张量W来建模,关系如下:
image
在这里,W是一个融合模型,一个D*C*B的三阶张量,x是D维特征向量,z是B维特征向量。y是最后标签,是一个C维向量,表示目标被分成C类。注意,公式2里的的乘法均为张量点积(tensor dot product)。所以,如果要对M个样本进行建模,求得一个最终的分量W的话,最终的目标函数即为:
image

其中,
image
就是一般的损失函数了。这个公式里的W,融合了FRF和FAF并最终确定了特征的分类y。

4.2问题优化

  公式3里的W是一个三阶张量,有着非常复杂的计算难度。所以我们首先对W使用Tucker分解,将W分解为如下形式:
image

S是一个KD*KC*KB的三阶张量。
image
是KD*D维的矩阵,
image
是KC*C的矩阵,
image

是KB*B的矩阵。通过约束
image
,我们可以有效地把参数从
image
降低到
image
。这样我们只需学习到
image
即可。
将公式4插入公式2,得到
image

整理得到
image

在整理得到
image

其中,
image
是克罗内克积。
image
是张量S的二模展开(mode-2 unfolding),为KC*KDKB矩阵。
观察公式7,我们可以发现,融合特征是一个KC维的向量,而
image
则扮演着一个分类器的角色。所以我们只要学习到
image
,就可以使用
image
来预测类别了。
本文就使用一个神经网络来学习这4个变量,如下图所示:
image

4.3基本特征提取

(1)FRF特征使用下面网络提取,激活函数采用maxout。最终的特征为全连接层的256维向量。
image

(2)FAF特征使用Lighten CNN(Z. S. Xiang Wu, Ran He. A lightened cnn for deep face representationarXiv:1511.02683, 2015. 5)。5个conv-activation-pooling单元之后连接一个256维的全连接层。训练网络时,标签去掉了""wear glasses"和"smiling"这些不具有判别性的属性,最后一共使用17个属性来训练网络。

5.实验

image

image

image

image
image
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,560评论 4 361
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,104评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,297评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,869评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,275评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,563评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,833评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,543评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,245评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,512评论 2 244
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,011评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,359评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,006评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,062评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,825评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,590评论 2 273
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,501评论 2 268

推荐阅读更多精彩内容

  • 文章作者:Tyan博客:noahsnail.com | CSDN | 简书 翻译论文汇总:https://gith...
    SnailTyan阅读 9,731评论 0 8
  • ------写给经历过书信时代的我们 一叠发黄的信 见证了四季轮回的风雨 定格时间的邮戳 映衬着不再纯白的封皮 这...
    Bohemian_e6af阅读 141评论 0 4
  • 你可以使用ps命令。它能显示当前运行中进程的相关信息,包括进程的PID。Linux和UNIX都支持ps命令,显示所...
    剑御阅读 4,069评论 0 2
  • 嗯,这是之前发在自己朋友圈里作分享的,既然要开始写简书,我就把以前写的一些博物馆tip 陆续传上来,希望大家喜欢。
    梓达冬阅读 417评论 0 0