[GAN学习系列3]采用深度学习和 TensorFlow 实现图片修复(下）

这是本文的最后一部分内容了，前两部分内容的文章：

以及原文的地址：

http://bamos.github.io/2016/08/09/deep-completion/

最后一部分的目录如下：

第三步：为图像修复寻找最佳的假图片
- 利用 DCGANs 实现图像修复
- [ML-Heavy] 损失函数
- [ML-Heavy] TensorFlow 实现 DCGANs 模型来实现图像修复
- 修复你的图片

第三步：为图像修复寻找最佳的假图片

利用 DCGANs 实现图像修复

在第二步中，我们定义并训练了判别器D(x)和生成器G(z)，那接下来就是如何利用DCGAN网络模型来完成图片的修复工作了。

在这部分，作者会参考论文"Semantic Image Inpainting with Perceptual and Contextual Losses" 提出的方法。

对于部分图片y，对于缺失的像素部分采用最大化D(y)这种看起来合理的做法并不成功，它会导致生成一些既不属于真实数据分布，也属于生成数据分布的像素值。如下图所示，我们需要一种合理的将y映射到生成数据分布上。

image

[ML-Heavy] 损失函数

首先我们先定义几个符号来用于图像修复。用M表示一个二值的掩码(Mask)，即只有 0 或者是 1 的数值。其中 1 数值表示图片中要保留的部分，而 0 表示图片中需要修复的区域。定义好这个 Mask 后，接下来就是定义如何通过给定一个 Mask 来修复一张图片y，具体的方法就是让y和M的像素对应相乘，这种两个矩阵对应像素的方法叫做哈大马乘积，并且表示为 M ⊙ y ，它们的乘积结果会得到图片中原始部分，如下图所示：

image

接下来，假设我们从生成器G的生成结果找到一张图片，如下图公式所示，第二项表示的是DCGAN生成的修复部分：

image

根据上述公式，我们知道最重要的就是第二项生成部分，也就是需要实现很好修复图片缺失区域的做法。为了实现这个目的，这就需要回顾在第一步提出的两个重要的信息，上下文和感知信息。而这两个信息的获取主要是通过损失函数来实现。损失函数越小，表示生成的G(z)越适合待修复的区域。

Contextual Loss

为了保证输入图片相同的上下文信息，需要让输入图片y（可以理解为标签）中已知的像素和对应在G(z)中的像素尽可能相似，因此需要对产生不相似像素的G(z)做出惩罚。该损失函数如下所示，采用的是 L1 正则化方法：

image

这里还可以选择采用 L2 正则化方法，但论文中通过实验证明了 L1 正则化的效果更好。

理想的情况是y和G(z)的所有像素值都是相同的，也就是说它们是完全相同的图片，这也就让上述损失函数值为0

Perceptual Loss

为了让修复后的图片看起来非常逼真，我们需要让判别器D具备正确分辨出真实图片的能力。对应的损失函数如下所示：

image

因此，最终的损失函数如下所示：

image

这里 λ 是一个超参数，用于控制两个函数的各自重要性。

另外，论文还采用泊松混合(poisson blending) 方法来平滑重构后的图片。

[ML-Heavy] TensorFlow 实现 DCGANs 模型来实现图像修复

代码实现的项目地址如下：

https://github.com/bamos/dcgan-completion.tensorflow

首先需要新添加的变量是表示用于修复的 mask，如下所示，其大小和输入图片一样

self.mask = tf.placeholder(tf.float32, [None] + self.image_shape, name='mask')

对于最小化损失函数的方法是采用常用的梯度下降方法，而在 TensorFlow 中已经实现了自动微分的方法，因此只需要添加待实现的损失函数代码即可。添加的代码如下所示：

self.contextual_loss = tf.reduce_sum(
    tf.contrib.layers.flatten(
        tf.abs(tf.mul(self.mask, self.G) - tf.mul(self.mask, self.images))), 1)
self.perceptual_loss = self.g_loss
self.complete_loss = self.contextual_loss + self.lam*self.perceptual_loss
self.grad_complete_loss = tf.gradients(self.complete_loss, self.z)

接着，就是定义一个 mask。这里作者实现的是位置在图片中心部分的 mask，可以根据需求来添加需要的任意随机位置的 mask，实际上代码中实现了多种 mask

if config.maskType == 'center':
    scale = 0.25
    assert(scale <= 0.5)
    mask = np.ones(self.image_shape)
    l = int(self.image_size*scale)
    u = int(self.image_size*(1.0-scale))
    mask[l:u, l:u, :] = 0.0

因为采用梯度下降，所以采用一个 mini-batch 的带有动量的映射梯度下降方法，将z映射到[-1,1]的范围。代码如下：

for idx in xrange(0, batch_idxs):
    batch_images = ...
    batch_mask = np.resize(mask, [self.batch_size] + self.image_shape)
    zhats = np.random.uniform(-1, 1, size=(self.batch_size, self.z_dim))

    v = 0
    for i in xrange(config.nIter):
        fd = {
            self.z: zhats,
            self.mask: batch_mask,
            self.images: batch_images,
        }
        run = [self.complete_loss, self.grad_complete_loss, self.G]
        loss, g, G_imgs = self.sess.run(run, feed_dict=fd)
        # 映射梯度下降方法
        v_prev = np.copy(v)
        v = config.momentum*v - config.lr*g[0]
        zhats += -config.momentum * v_prev + (1+config.momentum)*v
        zhats = np.clip(zhats, -1, 1)

修复你的图片

选择需要进行修复的图片，并放在文件夹dcgan-completion.tensorflow/your-test-data/raw下面，然后根据之前第二步的做法来对人脸图片进行对齐操作，然后将操作后的图片放到文件夹dcgan-completion.tensorflow/your-test-data/aligned。作者随机从数据集LFW中挑选图片进行测试，并且保证其DCGAN模型的训练集没有包含LFW中的人脸图片。

接着可以运行下列命令来进行修复工作了：

./complete.py ./data/your-test-data/aligned/* --outDir outputImages

上面的代码会将修复图片结果保存在--outDir参数设置的输出文件夹下，接着可以采用ImageMagick工具来生成动图。这里因为动图太大，就只展示修复后的结果图片：

image

而原始的输入待修复图片如下：

image

小结

最后，再给出前两步的文章链接：

当然这个图片修复方法由于也是2016年提出的方法了，所以效果不算特别好，这两年其实已经新出了好多篇新的图片修复方法的论文，比如：

2016CVPR Context encoders: Feature learning by inpainting
Deepfill 2018--Generative Image Inpainting with Contextual Attention
Deepfillv2--Free-Form Image Inpainting with Gated Convolution
2017CVPR--High-resolution image inpainting using multi-scale neural patch synthesis
2018年的 NIPrus收录论文--Image Inpainting via Generative Multi-column Convolutional Neural Networks

欢迎关注我的微信公众号--机器学习与计算机视觉，或者扫描下方的二维码，在后台留言，和我分享你的建议和看法，指正文章中可能存在的错误，大家一起交流，学习和进步！

image

我的个人博客和 CSDN 博客：

http://ccc013.github.io/

https://blog.csdn.net/lc013/article/details/84845439

往期精彩推荐

1.机器学习入门系列(1)--机器学习概览(上)

2.机器学习入门系列(2)--机器学习概览(下)

3.[GAN学习系列] 初识GAN

4.[GAN学习系列2] GAN的起源

5.[GAN学习系列3]采用深度学习和 TensorFlow 实现图片修复(上）

6.[GAN学习系列3]采用深度学习和 TensorFlow 实现图片修复(中）

最后编辑于：2018.12.22 18:28:28

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 159,117评论 4赞 362
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 67,328评论 1赞 293
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 108,839评论 0赞 243
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 44,007评论 0赞 206
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 52,384评论 3赞 287
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 40,629评论 1赞 219
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 31,880评论 2赞 313
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 30,593评论 0赞 198
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 34,313评论 1赞 243
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 30,575评论 2赞 246
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 32,066评论 1赞 260
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 28,392评论 2赞 253
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 33,052评论 3赞 236
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 26,082评论 0赞 8
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 26,844评论 0赞 195
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 35,662评论 2赞 274
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 35,575评论 2赞 270

[GAN学习系列3]采用深度学习和 TensorFlow 实现图片修复(下）

第三步：为图像修复寻找最佳的假图片

利用 DCGANs 实现图像修复

[ML-Heavy] 损失函数

Contextual Loss

Perceptual Loss

[ML-Heavy] TensorFlow 实现 DCGANs 模型来实现图像修复

修复你的图片

小结

推荐阅读更多精彩内容