自动驾驶入门日记-6-视频语义分割

在自动驾驶任务中,实时性一直是急需解决的一个问题,也是极其具有挑战性的一个问题。一方面,现阶段一辆装满所有传感器的自动驾驶汽车每秒收集的数据量高达1-4GB(数据来自网络,不一定准确),另一方面,为保证汽车长时间的续航能力,自动驾驶汽车应尽可能的保证节省电力,同时大功率的计算部件其散热也是一个必须解决的问题。

因此,如何在减少计算量的同时保证得到的结果准确鲁棒就是计算机视觉科学家应该审慎思考的一个问题了,目前针对降低自动驾驶视频语义分割延迟的相关工作已经发表了很多,我选取其中的几篇进行简答介绍。

1.SegNet: A Deep Convolutional Encoder-Decoder Architecture for Robust Semantic Pixel-Wise Labelling

参考资料:卷积神经网络CNN(4)—— SegNet

SegNet使剑桥大学机器智能实验室提出的在FCN的基础上修改的一种比较优美的网络结构,由于其官网上提供了很详尽的学习资料,因此在其基础上也衍生出了很多优秀工作。


网络结构

网络结构的细节感兴趣的可以看论文,由于篇幅问题这里比详细阐述了。SegNet的架构可以看作一个Encoder-Decoder模型,前一半可以看作一个使用CNN和polling的编码器,后一部分使用upsampling与deconvolution组成对应的解码器。

值得注意的是,相比于其他网络结构的pooling层,SegNet中的pooling层多了一个index的功能,即记录最大池化时所选取的数值的位置信息,以便在上采样过程中进行恢复。、


unpooling

Bayesian SegNet

在SeNet中最后每个像素都会对每一类的概率进行计算,再通过Softmax输出概率最大的一个,然后这个像素点就认为是这一类别,对应的概率就是这一像素属于该类的概率。这种由原因到结果的推导,可以称为先验概率,任何先验概率使用都会出现一个问题,不能知道这一结果的可靠性,即便先验概率非常大,但是对于不同的样本,先验概率无法保证一定正确。正是如此,才需要有从结果寻找原因的贝叶斯概率,即后验概率,它能给出结果的可信程度,即置信度。Bayesian SegNet正是通过后验概率,告诉我们图像语义分割结果的置信度是多少。


Bayesian SegNet

可见,在网络中加入一层Dropout即可得到语义分割图像的不确定性灰度图,具体的原理参考Dropout as a Bayesian approximation: Representing model uncertainty in deep learning

高斯过程是指任意有限个随机变量都服从联合高斯分布,同时只需要知道均值与协防差就能够确定一个高斯过程,所以高斯过程可以用于从有限维到无限维的回归问题,从已知高斯分布,增加新的随机变量分布可以求出新的高斯分布,根据新的分布可以求出其均值与方差。 

如何确定一个高斯分布?需要多次采样才能确定一个分布。蒙特卡罗抽样告诉我们可以通过设计一个试验方法将一个事件的频率转化为概率,因为在足够大的样本中,事件发生的频率会趋向事件发生的概率,因此可以很方便地求出一个未知分布。通过蒙特卡罗抽样,就可以求出一个新分布的均值与方差,这样使用方差大小就可以知道一个分布对于样本的差异性,方差越大差异越大。

在Bayesian SegNet中通过DropOut层实现多次采样,多次采样的样本值为最后输出,方差最为其不确定度,方差越大不确定度越大,多次采样后就可以得到不确定性的灰度图。

可以看到,不确定性灰度图很像图像的边界提取,这也直观的表明了在语义分割问题中边界的不确定性较大的问题。

2.Low-Latency Video Semantic Segmentation

参考资料:CVPR 2018 | 商汤科技Spotlight论文详解:极低延迟性的视频语义分割

算法核心思想

本文算法使用视频分割中经典的基于关键帧调度的模式来有效平衡计算量和精度。具体来说,如果当前处理帧为关键帧,则使用整个分割网络来获得语义分割的标签,如图2左部分所示;如果当前帧不为关键帧,则变换分割网络高层历史帧特征为当前帧高层特征,再使用分割网络的语义分类操作获得当前帧的语义标签,如图2右部分所示。关键帧的选择和特征跨帧传播两个操作均基于同样的网络低层特征,具体操作在之后章节详述。在划分分割网络结构时,算法尽量保证低层网络的运行时间远小于高层网络,(如图2所示)低层网络耗时61ms,而高层网络耗时300ms。这样考虑的出发点在于:因低层网络的计算代价很小,算法可以基于低层网络提取的特征,增加少部分额外的计算来完成关键帧选择和特征跨帧传播;当前帧的低层特征同样包含当前帧的信息,可以互补来自不同时间的传播特征;所有的操作均复用了逐帧模型的结构,算法整体模型更加简洁。

由于实现过程中涉及到一种关键帧调度的问题,而以往的关键帧选取方法要么简化为固定时间间隔选取,要么计算高层特征差异,根据设定阈值选取。前者无法适应视频帧内容变化,容易错过关键帧或者浪费计算资源,后者由于特征变化较大,阈值难以确定。因此作者使用当前帧语义标签和前一个关键帧语义标签的差异值来作为视频内容变化程度的判断依据,当差值超过某个阈值的时候,则选择该帧作为关键帧。但是直接计算这样一个差异值较为困难,作者在Cityscapes和Camvid两个数据集上发现低层特征和语义标签的变化值有很大的关联,因而利用低层特征来预测这样该差值,即输入历史帧低层特征和当前帧低层特征到一个回归器来回归该差异值。


自适应关键帧选择


整体框架

当视频的序列帧不断输入时,在第一帧时刻,进行初始化操作,即输入图片帧给整个网络,获得低层特征和高层特征。在接下来的时刻t进行自适应的计算,首先计算低层特征:输入和上一个关键帧低层特征至自适应关键帧选择模块,判断当前帧是否为关键帧。若为关键帧,则输入底层特征至高层网络获得高层特征;否则输入底层特征至自适应特征传播模块获得当前帧高层特征,进而通过语义分类获得当前帧语义标签。

本文在牺牲较小精度的条件下极大的降低了系统延迟,这种低延迟调度策略可将延迟由360ms降低到119ms。但是本文方法在场景变化剧烈的条件下(即关键帧采样比较密集)仍然无法有效降低延迟,因此论文作者希望在未来工作中在模型压缩和模型设计方面进一步降低算法的总体延迟和计算量。

祝好!愿与诸君一起进步。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,015评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,262评论 1 292
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,727评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,986评论 0 205
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,363评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,610评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,871评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,582评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,297评论 1 242
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,551评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,053评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,385评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,035评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,079评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,841评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,648评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,550评论 2 270

推荐阅读更多精彩内容