图像检索(一):因缘际会与前瞻

之前因为学习Keras的缘故,看到一个图像检索的Demo,代码实现了输入一张查询照片,检索出最相似的n张照片的效果。

图像检索示例

进而用t-SNE将所有照片降至2维,以便可视化并观察相似照片是否聚集到了一起。下图是我“复现”了Demo后,一千张图像可视化的结果:可以看到右上角是人脸肖像簇;左边是摩托车簇;左下角是飞机簇等等,效果还不错。


1kimages-example-tSNE-animals1k.png

最初看到这个demo,我非常兴奋,兴奋的原因大概有两点。其一是好几年前有这样一篇文章——《你说你看过2000部电影,我笑笑说我也是》——令我至今难忘。文中介绍了法国博主Christophe Courtois对诸多相似风格的电影海报进行了整理。

举几个例子:背靠背的两个人


Christophe Courtois-1.jpg

下方的海滩与上方浮现的人物:


Christophe Courtois-2.jpg

分开的双腿:
Christophe Courtois-3.jpg

渗人的眼睛:


Christophe Courtois-4.jpg

可以看出确实有很多相似的套路,如此说来设计海报也不是件多难的事嘛?!(设计师看了想打人)。不同类型的电影题材会有各自倾向的海报风格,这也并不是多眼前一亮的结论。但上述所引终归是多年前的文章以及他人的归纳结果,对于阅片篇并不多的我来说,更好奇的是,能否通过爬取电影海报(或其他主题,比如音乐专辑照片等)并结合文章开头的技术来挖掘出类似的结论,或者找到更多不曾被人归纳的风格。

为此我专门爬取了豆瓣电影“Top250”“分类排行榜”的数据(后者通过md5值删除重复海报后从3853张降到2281张)分别进行了研究,这部分从爬虫代码、爬取的数据、海报检索以及可视化的内容均为在后续文章中涉及。

豆瓣电影-分类排行榜.JPG

其二是2017年11月公众号上看到小火的清华美院的向帆老师在一席演讲的视频与文稿《如果把每年的春晚都像蚊香一样卷起来的话,它就是这样的》,各种酷炫的可视化作品令人叹为观止,非常推荐大家看一下此视频。相关作品也可到此网站查看。

2001-2014年春晚“蚊香图”.jpg
春晚色彩盘.jpg
国内外大学院系组织结构.png
全国美展历年获奖作品研究.JPG

当时看完久久不能平静,想着离2018年春晚还早,要是能了解下这些作品都是怎么做出来的,然后趁着过年时“不进则已,一鸣惊人”下,也是美滋滋哈。但搜寻后却发现可能用到的软件等似乎蛮难上手,现今也记不得许多,唯有那会第一次知道“t-SNE”可以用来可视化高维数据这件事,觉得挺神奇的就存了些图。


t-SNE.PNG

但也并不清楚背后的数学原理以及具体如何操作照片数据集。以下是以动画的方式直观感受下使用t-SNE后MNIST手写数字类别不断分开的过程

t-SNE-MNIST.gif

所谓:“念念不忘,必有回响”。一切因缘际会,万没想到却在学Keras时都撞上了。那么,这Keras又是什么东西呢?


keras.jpg

简单的说,Keras 就是一个深度学习的python 库,可以以Tensorflow、Theano 以及CNTK 为后端。它简单易用,能像搭积木一般构建神经网络,对于新手小白而言,是最易上手深度学习的库,没有之一。


keras-workflow.jpg

怎么个简单易用,本文暂且不表,后续系列再来讲解。你可能又会好奇,标题不是说好了介绍图像检索的嘛,怎么又扯到深度学习上了,到底是如何实现检索出相似图像,如何用t-SNE对海量图像进行可视化的呢?这其中的缘故,且听我慢慢道来。

深度学习、卷积神经网络有多火,想必大家都是知道的。但对于不曾了解过其原理的人而言,或许会觉得是很艰深晦涩、很高大上的事。如果一上来看到下面这样的图,心情一定不会美妙,一脸懵逼,这tm是个啥。


神经网络.png

本文当然不会过多涉及这部分讲解,感兴趣的小伙伴可以阅读下这两个不错的知乎话题,看完你就比90%的人清楚CNN到底是怎么回事了:
能否对卷积神经网络工作原理做一个直观的解释?
CNN(卷积神经网络)是什么?有入门简介或文章吗?

那么原本用于图像识别,比如识别一张图像里到底是猫还是狗的卷积神经网络,又是结合到图像检索上的呢?以下图为例,CNN可以看成是特征提取和分类器两部分,通过一层层的神经网络对图像逐渐提取出抽象的特征,有了特征就有了可以区分和评判的指标,分类器就能识别出是猫还是狗了。


CNN.jpg

而如果把分类器去掉,用剩下的特征提取器对海量图像分别提取特征,并借助余弦相似度等衡量指标,我们就能实现上述的图像检索效果了。

类似流程图大致如下,相关阅读:《基于deep learning的快速图像检索系统》

寒小阳.jpeg

经过上述的介绍,你就对图像检索有了一定的了解,如果非常技痒,可以直接看Demo的代码:Image Search。当然后续我也会基于此继续更新本系列文章,涉及原始代码一些小BUG的修改与复现、豆瓣电影海报的爬取与研究、以及Keras的更多介绍、基于内容的图像检索(CBIR)的更多细节,以及可能的改进方向等等。敬请期待。

PS:欢迎关注公众号:牛衣古柳(ID:Deserts-X),以及欢迎加QQ群:Python交友娱乐会所(613176398)哈。娱乐会所,没有嫩模。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,117评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,328评论 1 293
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,839评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,007评论 0 206
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,384评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,629评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,880评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,593评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,313评论 1 243
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,575评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,066评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,392评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,052评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,082评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,844评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,662评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,575评论 2 270

推荐阅读更多精彩内容