深度学习的卷积运算的直观认识

转载请注明出处:https://www.jianshu.com/p/e9f2083f730a 如果觉得有用,麻烦点个赞噢~
卷积运算,如果用数学公式来说明,会让很多人头大(包括我)。
关于卷积运算的文章,网上可以搜到很多,虽然大部分都没解释清楚,但也不乏非常棒的,比如这篇:https://zhuanlan.zhihu.com/p/61898234,文中有一个关于图像卷积过程的gif动图,特别好,如下:

图片来源于http://cs231n.github.io/convolutional-networks,侵删
如果看懂这个gif图,那恭喜你,你已经搞懂了,不用再看下面的文字介绍了。
下面我根据上面的gif图,做简单的若干点说明,把卷积的关键知识点列出来:

以下是针对经典的图像卷积

  • 输入(input)的图像,数据形状是(width_in, height_in, channel_in),如gif图中,图像的宽高均为5,channel_in为3.

  • 原始图像中的channel,指的是通道,比如彩色图片通常有3个通道分别是:R, G, B

  • 单个卷积核(kernel)的的数据形状是(width_k, height_k, channel_in)

  • 【重点】单个卷积核跟原始图像之间的卷积运算,用文字来描述就是:按元素相乘,比如:input[0][0][0]kernel[0][0][0]相乘,input[1][1][1]kernel[1][1][1]相乘。最后将所有元素加和。

  • 单个卷积核不是一个二维矩阵,而是带厚度的,即channel_in。并且,kernel的channel跟输入的channel一一对应地做按元素相乘运算。

  • 【重点】单个卷积核跟输入卷积后,得到的output的形状是(width_out, height_out)。发现没?没有channel!如gif图所示,单个卷积核,我们称之为Filter,即过滤器,意义是将原图在某个层面上过滤得到特征。

  • 【重点】输出(output)的宽高,是可设计的,可以跟原图尺寸一样,也可以变大或者减小。这里会涉及到padstridedilate三个参数,比如,对于宽高是2x2的原图,卷积核宽高是3x3,步长stride是1,膨胀系数dilate是0,如果希望输出的宽高也是2x2,要求pad是多少呢?答案是:原图四条边各填充1层。填充的数值通常是0。在gif图里,原图数据四条边全是0,就是被填充的。计算pad是有公式的。我们先不看前面的二维矩阵,拿掉一个维度,现在看一维的情况,total_pad = (len_out - 1) x stride + kernel_size - len_in,其中,total_pad是总填充数,kernel_size是一维卷积核的长度(如果膨胀系数dilate不为0,那kernel_size是膨胀后的长度。所谓膨胀,就是卷积核每两个元素之间插入dilate个0。)对应gif图里的取值,len_out=3,stride=2,kernel_size=3,len_in=5,可以算出total_pad=2。即在一维输入的两侧各填充1个0。现在代入二维矩阵的情况,不就是在四条边各填充一层嘛。

  • 【重点】如果想得到输出(output)具有channel_out个通道呢?增加Filter即可,也就是增加卷积核数。gif图里,输出有两个通道,对应了两个卷积核。

  • 一次Conv2D,表达式是:output = W * input + biasW是权重,bias是偏置。它们都是深度学习要学习的对象。W是由卷积核组成的,gif图里的两个Filter组成了W,与之对应的两个bias组成了bias。那么权重W中有多少个参数呢?答案是:width_k * height_k * channel_in * channel_out。gif里就是 3 * 3 * 3 * 2 = 18。加上bias的两个参数,这层Conv2D的参数总共有20个。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,560评论 4 361
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,104评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,297评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,869评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,275评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,563评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,833评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,543评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,245评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,512评论 2 244
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,011评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,359评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,006评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,062评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,825评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,590评论 2 273
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,501评论 2 268