论文 | Pixel2Mesh三维重建模型解读《Pixel2Mesh: Generating 3D Mesh Models from Single RGB Images》

一 写在前面

未经允许,不得转载,谢谢~~

文章基本信息:

这篇文章是三维重建领域的,但是比较新颖的点就在于模型并不需要借助点云、深度或者其他更加信息丰富的数据,而是直接从单张彩色图片直接得到3D mesh。

强烈推荐~~~

关键词:3D shape generation,Graph convolutional neural network,Mesh reconstruction,Coarse-to-fine, End-to-end framework;

二 主要内容

2.1 相关背景

从单张图像恢复出原来的三维模型在计算机视觉中是一个很基本的任务,但是也同样具有非常高的难度。

这里先介绍一下常用的几种三维表示方法

  • volume:规则数据结构。将物体表示成NNN的格子立方体;
  • point cloud:不规则数据结构。即如字面意思,用一堆的点来表示物体;
  • mesh:不规则数据结构。由点、边、面组成。

根据各种不同的表示方法我们可以知道volume受到分辨率和表达能力的限制,会缺乏很多细节;point cloud,点之间没有连接关系,会缺乏物体的表面信息。相比较而言mesh的表示方法具有轻量、形状细节丰富的特点。

三种表示的实验结果可以参考下图:


那么这篇文章到底做了什么事情呢?

  1. 文章实现用端到端的神经网络实现了从单张彩色图直接生成用mesh表示的物体三维信息;
  2. 文章采用图卷积神经网络来表示3D mesh信息,利用从输入图像提到的特征逐渐对椭圆尽心变形从而产生正确的几何形状;
  3. 为了让整个形变的过程更加稳定,文章还采用coarse-to-fine从粗粒度到细粒度的方式;
  4. 文章为生成的mesh设计了几种不同的损失函数来让整个模型生成的效果更加好。

其实文章的核心思路就是给用一个椭球作为任意物体的初始形状,然后逐渐将这个形状变成目标物体。

接下来会详细介绍这个变换的过程是如何实现的,以及各个部分是如何进行表示的。

三 本文模型方法

3.1 主要模型方法

先贴上网络结构图吧~

我们先不管具体的细节,来看一下主要的流程

  1. 给定一张输入图像:Input image
  2. 为任意的输入图像都初始化一个椭球体作为其初始三维形状:Ellipsoid Mesh
  3. 整个网络可以大概分成上下两个部分;
    • 上面部分负责用全卷积神经网络提取输入图像的特征;
    • 下面部分负责用图卷积神经网络来表示三维mesh,并对三维mesh不断进行形变,目标是得到最终的输出(最后边的飞机)
  4. 注意到图中的perceptual feature pooling层将上面的2D图像信息和下面的3Dmesh信息联系在一起了,即通过借鉴2D图像特征来调整3D mesh中的图卷积网络的节点状态。这个过程可以看成是mesh deformation.
  5. 细心的同学应该也注意到除了刚刚提到的mesh deformation,下面这部分还有一个很关键的组成是graph uppooling。文章提出这个图上采样层是为了让图节点依次增加,从图中可以直接看到节点数是由156-->628-->2466变换的,这其实就是coarse-to-fine的体现。

3.2 各个关键部分

看完3.1部分应该基本了解整个过程是什么样子的了,接下来我们来看一下比较关键的几个部分,比如怎么表示3D mesh,又是怎么从2D图像信息中提取信息来帮助3D mesh的转变?

3.2.1 图卷积神经网络GCN

我们前面介绍过3D mesh是由(顶点,边,面)来描述3D object,这正好对应于与图卷积神经网络M = (V, E, F)一一对应:

  • V (N个顶点)
  • E (E条边)
  • F (N个顶点的特征向量)

图卷积神经网络的定义如下:


其中:

  • f(p,l), f(p,l+1)分别表示顶点p在卷积操作前后的特征向量;
  • N(p)指顶点p的邻居节点;
  • W1,W2表示待学习的参数;

其实整个公式就是表达了图卷积神经网络的节点是根据其自身的特征和邻居节点的特征来进行更新的。

这样我们就解决了3D mesh的表示问题以及如何更新节点状态的问题。

3.2.2 融合2D和3D信息(perceptual feature pooling & mesh deformation block)

文中用了经典的VGG网络来提取二维的图像信息,而用GCN来表示3D mesh,那么如何在两个不同模态的数据之间进行融合工作,更好的利用2D的图像信息来帮助重建3D mesh。

理解图中的两个关键部分(perceptual feature pooling & mesh deformation block)就可以知道了。

mesh deformation block

  1. 如上图(a)所示。
  2. C表示三维顶点坐标,P表示图像特征,F表示三维顶点特征;
  3. perceptual feature pooling层负责根据三维顶点坐标C(i-1)去图像特征P中提取对应的信息;
  4. 以上提取到的各个顶点特征再与上一时刻的顶点特征F(i-1)做融合,作为G-ResNet的输入;
  5. G-ResNet(graph-based ResNet)产生的输出又做为mesh deformable block的输出,得到新的三维坐标C(i)和三维顶点特征F(i)。

perceptual feature pooling

  1. 如上图(b)所示。
  2. 负责给定三维坐标点以及图像特征的情况下,获取到三维点对应的特征信息。
  3. 首先将3D坐标信息映射回2D坐标点;
  4. 取2D坐标点边上最近的四个点进行双线性插值,其结果做为这个顶点的特征;
  5. 特别的文章中取了VGG中的conv3_3(256维),conv4_3(512维),conv_5_3(512维)的特征进行连接,那么每个顶点就有1280维的特征。
  6. 除了最开始的block没有F(i-1)的信息外,其他的block都还能利用上一时刻的128维度的F信息,一共1408维。

G-ResNet

  1. 如上图(a)中间的部分。
  2. 前面为每个顶点都得到了1408维的特征(除了第一个block)通过G-ResNet就能得到新的位置坐标C和每个顶点的形状特征F;
  3. 这就需要节点之间有效的信息交换,但每次图卷积网络只能交换邻居节点的信息,很影响新的交换效率,有点类似2D CNN的小感受野。所以增加了shortcut结构。
  4. 每个block的G-ResNet的结构都是一样的(14个conv + 1 shortcut),输出128维,这样就产生新的128维的节点形状信息。

3.3.3 图上采样层(Graph uppooling)

  1. 主要是为了节点数量能够逐渐增加,降低训练难度;
  2. 主要有face-based和edge-based这2种方式,都比较好理解,就不再解释了;
  3. 文章中采用的edge-based的方式。

3.3.4 losses

文章一共为网络模型设计了4种不同的loss,来从不同角度保证网络模型的性能。

这个具体的也不再说了 ,都看到这里了就去看看原文吧嘻嘻٩(๑❛ᴗ❛๑)۶

四 写在最后

这篇文章还是很不错的,我觉得整体的创新性很高~

接下来应该会做3D mesh相关的工作,有兴趣的可以多多交流哇。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,560评论 4 361
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,104评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,297评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,869评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,275评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,563评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,833评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,543评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,245评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,512评论 2 244
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,011评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,359评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,006评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,062评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,825评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,590评论 2 273
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,501评论 2 268

推荐阅读更多精彩内容