Caffe2核心代码解析系列之一:综述

介绍

笔者当下恰有工作需要对caffe2底层实现有较好的认识。打算趁这个工作机会学习下caffe2框架底层的具体设计及实现,同时写一个系列的相关学习笔记文章集出来,希望能对想深入了解深度学习框架实现的朋友有些启发。

当下最为火热、流行的深度学习框架非Google领导的Tensorflow莫属。其次则为分别由Facebook及Amazon力推的Pytorch(caffe2为其一个后端)与Mxnet。这些框架本身很多设计思路及具体实现都是类似的,因此学其一可知其它。在这当中显然caffe2的整个代码结构要相当简单些,所以比较适合入门学习。

Caffe是另一个较为经典的深度学习框架。由于其良好的性能,至今仍有国内的很多公司选择caffe(或自己深度定制过的caffe)为自己的深度学习软件框架。而caffe2与caffe的设计者是同一个人(现在Facebook的Jiang, Yangqing),很多caffe2中的理念及术语更是直接源自于caffe,因此对于有过caffe相当知识的朋友,caffe2学习起来相对也较为简单。

Caffe2_Logo

caffe2核心代码组成

Caffe2框架是一个静态的图框架。同大多静态图框架一样,它的应用程序一般会干两件事情,先是建立模型(即建图,主要使用python等较友好的语言脚本或像caffe那样直接使用prototxt文件),然后则是迭代执行模型。业务层面而言,它需要能够方便解决两个深度学习的任务及训练与推理。

Net

为了建立图,显然需要有图的概念,caffe2中的图即是Net。Net表示的是一系列计算执行操作的集合。

Operator

Net之中那些具体的执行操作被称为是operator(简称Op)。

Blob

operator之间通过相互依赖的输入、输出发生关联关系。而这些operator的输入、输出则被称为Blob。Blob是深度学习模型当中数据元素的抽象,它可以指的是具体的输入、输出数据,也可以指的是operator计算当中用当到的可训练参数等。

Tensor

显然反映high level数据抽象的Blob都应有相应的底层内存单元在背后。而Tensor则ghd 是这些底层内存单元的进一步封装。每个tensor都可以直接访问对应的内存单元地址,它之上的数据元素类型,它的大小,内存初始化及析构函数等则被封装到另外一个单元当中。这个单元即为TypeMeta,它具体反映tensor里面的数据元素的类型及相应的底层实现所需细节。

Context

Tensor与Operator分别对应相应的内存单元抽象及计算单元抽象。众所周知,当下可用于深度学习任务的计算单元有许多像CPU/GPU/FPGA/ASIC芯片等。它们在执行具体的计算任务时,分别有着不同的实现(分别包装着其各自特定的计算指令集及内存分配与读写单元)。caffe2中将各类不同的device封装为一个个不同的context对象。然后Tensor/Operator则以模板的形式分别在实例化时支持不同的底层计算设备context。

Registry

像Windows中使用注册表来管理其系统上的配置等信息一样,caffe2中也使用了全局Registry的方式对各种不同类型Op/OpSchema/Net等具体实现都进行了注册。这样当具体某个operator运行时,都会去全局Registry table里面查找此operator在相应设备上对应的注册实现并调用执行。一旦它发现此种类型实现不存在,那么就会报错退出。Net的不同类型执行也与此机理大致相似。

Workspace

当我们具体执行某个深度学习模型训练或推理任务时,需要考虑对全局所用到的变量及计算单元命名空间进行管理。它应当作为深度学习任务的发起者及终结者(当然还是收拾者)。这么一个角色在Tensorflow里面是Session,而caffe2中则是Workspace。它包含了一切运行时创建的对象,包括所有的Blob,以及Net等。

Python绑定

Caffe2中上当只支持C++与Python两种语言。在它的哲学当中,一切计算复杂的单元都应由C++实现的函数中来完成,而Python只是因其用户友好性被用来进行建图,规划整个图执行,并不真正参与核心的计算。这一点保证了它的高效率,但同时也意味着它对其它语言的支持不够好,同时也无法很灵活地添加一些由Python等高级语言写就的Operators。

一般由Python脚本所描绘的图会会序列化为protobuf文件,然后传入C++端,开始执行网络的计算过程。

在使用Python构建一个完整的用来作training工作的图时,只需要显示写出做前向计算的系列operators,然后通过使用AddGradientOperators方法(以最终的loss作为其输入参数)可自动完成反向梯度计算的operators的添加。

总之Caffe2中的一切真正计算像先向/反向计算/Checkpoints保存/参数更新乃至参数初始化等等无一例外均是通过某一实现好的C++ operator函数来执行。

参考文献

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 160,108评论 4 364
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,699评论 1 296
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,812评论 0 244
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,236评论 0 213
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,583评论 3 288
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,739评论 1 222
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,957评论 2 315
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,704评论 0 204
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,447评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,643评论 2 249
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,133评论 1 261
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,486评论 3 256
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,151评论 3 238
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,108评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,889评论 0 197
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,782评论 2 277
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,681评论 2 272