Object Detection: From A to Z

RCNN

1. Rcnn的Motivation是什么?

目标检测进展缓慢,CNN在 图片分类 中取得重大成功。应用CNN将检测问题转化成
分类问题。

2. 候选框提取

一张图片,利用seletive search方法从中提取出2000个候选框。由于候选框大小不一,考虑到后续CNN要求输入的图片大小统一,将2000个候选框全部resize227×227 分辨率;

3. 目标检测为什么需要候选区域,有哪些生成候选区域的方法?

在目标检测中,为了定位到目标的具体位置,通常会把图像划分成很多子块。再把这些子块依次送入目标识别模型中。

  • 滑动窗口法(sliding window)
    滑动窗口的方法就是按照子块的大小在整幅图像上穷举所有子图像块。这种方法产生的数据量想想都头大。效率较低,对于实时性要求高的情况不建议使用。

  • Seletive Search

  1. 滑窗法类似穷举进行图像子区域搜索,但是一般情况下图像中大部分子区域是没有物体的。只对图像中最有可能包含物体的区域进行搜索以此来提高计算效率。
  2. 主要观点:图像中物体可能存在的区域应该是有某些相似性或者连续性区域的。首先,对输入图像进行分割算法产生许多小的子区域。其次,根据这些子区域之间相似性(相似性标准主要有颜色、纹理、大小等等)进行区域合并,不断的进行区域迭代合并。每次迭代过程中对这些合并的子区域做bounding boxes。

4. 特征提取+分类器的过程

  • 227*227的大小并输入到CNN,将CNN的fc7层的输出作为特征;
  • 将每个Region Proposal提取的CNN特征输入到SVM进行分类;
  • 得到SVMs对于所有Proposal的评分结果,将一些分数较低的proposal去掉后,剩下的proposal中会出现候选框相交的情况。采用非极大值抑制技术,对于相交的两个框或若干个框,找到最能代表最终检测结果的候选框。

5. RCNN的缺点?

  • R-CNN需要对SS提取得到的每个proposal进行一次前向CNN实现特征提取,因此计算量很大,无法实时;
  • 由于全连接层的存在,需要严格保证输入的proposal最终resize到相同尺度大小,这在一定程度造成图像畸变,影响最终结果。


SPPNet

1. Sppnet的Motivation是什么?

  • 卷积层对输入图像大小不作特别要求,但全连接层要求输入图像具有统一尺寸大小。
  • R-CNN在训练和测试是需要对每一个图像中每一个proposal进行一遍CNN前向特征提取,如果是2000个propsal,需要2000次前向CNN特征提取。

2. sppnet如何做到任意大小featuremap得到固定全连接?

任意大小的feature map首先分成16、4、1个块,然后在每个块上最大池化,池化后的特征拼接得到一个固定维度的输出。以满足全连接层的需要


3. sppnet只需要进行一次cnn特征提取?

SPP-net只需要进行一次前向CNN特征提取,即对整图进行CNN特征提取,得到最后一个卷积层的feature map,然后采用SPP-layer根据空间对应关系得到相应proposal的特征。



Fast-Rcnn

1. fastrcnn的motivation是什么?

fastrcnn可以看成是一个joint training的sppnet。加入ROI pooling层解决需要多次计算cnn特征的问题。

2. 具体过程?

  • 利用selective search 算法在图像中从上到下提取2000个左右的建议窗口(Region Proposal);
  • 将整张图片输入CNN,进行特征提取;得到一个整个的Feature map
  • 把建议窗口映射到CNN的最后一层卷积feature map上;
  • 通过RoI pooling层使每个建议窗口生成固定尺寸的feature map;

3. Rol pooling layer的作用?

  • 将image中的rol定位到feature map中对应patch
  • 是用一个单层的SPP layer将这个feature map patch下采样为大小固定的feature再传入全连接层

ROIpooling更具字面意思就是一个pooling,它是把不同尺寸的featuremap输入,得到相同尺寸的featuremap的输出。
ROI是Region of Interest的简写,指的是在“特征图上的框”;
1)在Fast RCNN中, RoI是指Selective Search完成后得到的“候选框”在特征图上的映射,
2)在Faster RCNN中,候选框是经过RPN产生的,然后再把各个“候选框”映射到特征图上,得到RoIs。

候选框-映射共享featuremap-不同大小的featuremap-spp-相同大小的featuremap。

4. 如何引入多任务loss的?

  • 利用Softmax Loss(探测分类概率) 和Smooth L1 Loss(探测边框回归)对分类概率和边框回归(Bounding box regression)联合训练.
  • 将边框回归直接加入到CNN网络中训练


Faster-Rcnn

FasterRcnn中RPN的引入,可以说真正意义上将检测流程融合成一个网络。
Faster RCNN = RPN + Fast RCNN
阅读这篇博客https://blog.csdn.net/lanran2/article/details/54376126https://blog.csdn.net/lanran2/article/details/60143861写得很好,比较通俗易懂。我大致总结一下。

关于RPN

  1. RPN网络大致处于整个网络的中前端,RPN输入的featuremap是一个共享的featuremap,为RPN和后面的ROI共同使用。


  2. 公共的Featuremap是77512(视网络结构),输入RPN层,经过一个33的卷积,得到77256的输出,相当于77个256维向量,相当于7*7的特征图(比原图缩小了32倍)上每一个点都有一个256维的向量,每个点的256维度向量接两个FC,一个预测该点是前景还是背景。一个预测该点相对于原图的偏移。

  3. 7*7上每个点相对与原图来说,都是对应于一个框。那这个框是什么样呢,就是基于锚点(anchor)来讲的。锚点(x,y,w,h)决定了一个框的大小。fasterrcnn中这个框是确定的,一共有9个。

  4. 那么77上每一个点可以在原图上有9个框,那么每一个点对应的256维度的向量可以输出29个判断是否是前景的概率值。也可以输出49个判断anchorbox与原图的偏移。 那么77256会得到 7729个概率,774*9个坐标。

  5. 基于上面两个步骤就可以得到候选框。



  1. RCNN系列目标检测都包含四个基本步骤:
  • 候选区域生成
  • 特征提取
  • 分类
  • boundingbox修正
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,736评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,167评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,442评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,902评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,302评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,573评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,847评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,562评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,260评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,531评论 2 245
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,021评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,367评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,016评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,068评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,827评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,610评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,514评论 2 269

推荐阅读更多精彩内容