YOLO9000读书笔记

  YOLOv2作为YOLO的第二个版本,在思想上仍然延续了YOLO的总体思路,还是单阶段检测。其实,作者主要是结合了当时其他人一些较好的方法或者techniques来改进YOLO。
  1、Batch Normalization
  在每一个卷积层之后增加一个BN层。
  2、高分辨率
  增加输入图片的分辨率,首先用448 * 448的分辨率在ImageNet上训练10个epoches。然后把这个网络经过fine-tuning用于检测。
  3、Convolutional with anchor boxes
  (1)借鉴faster r-cnn关于RPN的思想,在特征图的每一个格子中手动生成anchor。关于定位,预测的是坐标的偏移量而不是直接预测坐标,这样有助于网络学习。
  (2)去除了YOLO中的全连接层,去除了最后一个池化层。以416 * 416为输入的分辨率,最终的输出经过了32倍下采样,因此输出的结果是13 * 13。(因为YOLO是以格子来预测物体,所以奇数个格子可以确保物体的中心只落在一个格子中)
  (3)从格子中解耦关于物体概率的预测,而把这个工作交给bounding box来完成。因此,每一个bounding box输出的结果维度是:25(4个坐标+1个置信度+20个分类概率)
  4、Dimension cluster
  作者通过对gt_box聚类的方法,最终选取了5种不同形状的bounding box(对比faster r-cnn是采用了9种不同的anchor),这种方法选取的anchor更具有针对性。聚类的结果显示:这5种anchor的形状大多是瘦高形状的,矮胖型的很少。
  5、Direct location prediction
  关于坐标的预测问题,作者改变了faster r-cnn中关于中心点坐标偏移量的预测方法,而对宽度和高度的缩放量进行预测则是和faster r-cnn中一致。
  为什么要这么做呢?作者认为产生的bounding box有可能出现在任何位置,这样会导致收敛困难。
  ( ps:我觉得作者的想法有待商榷,因为在faster r-cnn中,会计算每个anchor和gt_box的IOU,如果IOU大于阈值0.7,那么对应的anchor才会被采用,如果0.3<IOU<0.7,那么这种anchor会被舍弃。也就是说,我们需要回归的目标anchor都被限制在了gt_box周围的一定范围之内。)
  从作者提供的公式来看(简书不支持公式,就不上公式了),处理方式还是延续了YOLO的思想,计算bounding box的中心点和所在格子左上角坐标的偏移量,来达到归一化的目的。这种做法,会把bounding box的中心点限制在每个格子距离为1的范围之内,确实可以加快收敛的速度。
  6、Fine-Grained Features
  YOLOv2在最后生成的13 * 13的特征图上进行检测,对于大目标的物体来说是足够 的。但是,对于小物体的检测能不能提高效果呢?所以,作者借鉴了SSD中在不同的feature map上进行检测的方法(在前面的特征图中检测小目标,在后面的特征图中检测大目标)。
  但是,实现的方法和SSD中不同,作何借鉴了ResNet中的思想,增加了一个passthrough层来实现。作者把倒数第2层,即 26 * 26 * 512这个feature map直接进行reshape,变成 13 * 13 * 2048,然后把它和最后一层13 * 13的feature map进行concat。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,117评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,328评论 1 293
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,839评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,007评论 0 206
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,384评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,629评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,880评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,593评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,313评论 1 243
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,575评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,066评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,392评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,052评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,082评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,844评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,662评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,575评论 2 270

推荐阅读更多精彩内容