10. Forwarding (1)

好久没有更新文章了,因为公司在憋大招。上周Big Cloud Fabric 3.0终于登场,博主这才得空。先在这里做三个广告:

1. Big Cloud Fabric 3.0在历时两年的开发之后,终于问世。博主有幸参与了整个产品的设计,开发和测试。产品非常扎实,与openstack和vmware无缝结合。欢迎大家上手一试

2. 伴随产品的发布,我们还发布了新的定价方式 elastic SDN pricing, 这种定价方式开了两个先例:首先,网络设备的软件和硬件价格全面公开,这还是行业内的第一次。第二,弹性收费终于开始进入到了数据中心的日常运营。

3. 博主今年十月份会回国一个月,主要在上海北京两地转悠,希望有机会和同行交流,欢迎大家私信。

广告做完,开始正文。如何在SDN网络中转发数据包是一个太大的话题,博主想借两到三篇文章聊一聊在一个多租户数据中心里一个数据包是如何转发的,博主见识有限,纯粹盲人摸象,欢迎大家查漏补缺。

博主首先要科普一下现在被绝大多数数据中心解决方案所采用的多租户模型。(1) 一个租户(tenant)可以创建一个或者多个logical router,(2) 这个租户还可以创建多个subnet,一个subnet可以接入到某个logical router上,(3) 一个subnet内的通信往往在2层,而同一个logical router上两个subnet之间的通信则需要logical router作为default gateway进行转发。(4) 如果两个subnet接入到不同的logical router,它们之间的通信有两种方式:a.将两个logical router以某种方式相连,并在每个logical router上配置相应的路由。b. 借助NAT或者floating IP,让logical router进行IP地址转换。

目前绝大多数多租户数据中心解决方案都在向以上的用户模型靠拢,原因也很显然:这几乎是最简单的网络模型了,简单到任何一个数据中心的租户都不应该对该模型产生丝毫的理解困难。但是这种简洁的用户模型,往往意味着复杂的实现,最大的困难缘于在这个模型中逻辑网络和物理网络是完全无关的,也就是说我们要找到一个方法将逻辑网络中的各个要素映射到物理网络上,理解了这个映射也就为理解数据包转发奠定了基础。

就博主有限的知识储备,目前工业界从逻辑网络到物理网络的映射方案分两大类:overlay和fabric。博主这里先梳理一下那些构成逻辑网络的最基本要素,以及这些要素在两类方案中是如何映射到物理网络上的。

Port

一个port是指一个bare metal server或者VM的网卡与网络相连接的地方,从逻辑上讲它只有四个最关键的属性:tenant, network, IP和mac。租户其实并不在乎这个port究竟在物理网络的什么位置。但所有SDN网络解决方案却需要清楚的知道如何把这个逻辑上的port映射到物理物理网络上:这个port究竟在哪个OVS上,或者在哪台物理交换机上?是否有vlan tag?有时候人们还会在port的基础之上采用一些冗余备份的技术(比如bond), 这样在逻辑port向物理port映射时,就需要追加更多的信息。如果大家在玩儿openstack,会发现neutron数据库里的port table是最复杂的一张表,原因就在于它将关于一个port逻辑上和物理上的所有信息都放在了一起。

Subnet

在传统的数据中心里,subnet和物理网络是严格耦合的:处于同一个rack的port会被划分到同一个subnet里。但在多租户的数据中心里,subnet与物理网络完全解耦合:属于同一个subnet的两个port无论出现在物理网络的任何位置,它们都应该能够直接在2层通信。这是多租户数据中心最特别的地方,也是overlay和fabric两类解决方案的根本区别所在。overlay方案采用隧道技术(比如vxlan, GRE),fabric则将整个网络当作一台distributed switch(比如Big Cloud Fabric)。两类方案的技术细节博主会在下篇文章中详细分析。

Router

多个subnet的互联互通是需要router作为default gateway的。对于overlay方案而言,逻辑上的router和物理上的router是简单的一对一映射,这个router往往需要多个功能:隧道的封装/解封装,路由,NAT以及floating IP。这也就是为什么绝大多数的overlay方案往往都需要采购一些功能齐全并且带宽足够的router做为解决方案的一部分。而fabric方案,是把整个网络当作一个distributed router,网络当中的各个switch都可以完成路由,NAT以及floating IP的功能。两类方案的技术细节同样会在之后的文章中详细分析。

以上只是初步涉及了port,subnet和router三个最关键的网络要素在overlay和fabric两种解决方案中是如何从逻辑概念映射到物理概念的。对于那些更复杂的要素,博主目前只有些零散的观察和想法,等有系统的观点之后会陆续分享,这里先把它们写下来以防忘掉:L2 service insertion, L3 service insertion, L4-L7 service insertion, multicast, dynamic routing protocol。

在开始后续文章之前,博主想先提一句:博主坚定的认为fabric方案是技术上更优秀的选择,因为它在三个方面完胜overlay:第一,价格,请参见博主的第四篇文章。第二,性能。分布式的硬件转发和路由最大程度的避免了overlay方案中由于软件封装,解封装以及路由带来的性能瓶颈。博主知道有很多兄弟会在这点上持反对意见,于是列出几个事实先:cisco和vmware都推出了在TOR交换机上进行隧道封装和解封装的方案,opencontrail全弃用了OVS而开发了自己的virtual switch来提高性能,这其中的原因不言自明。第三,在overlay方案中,troubleshooting简直是一场灾难。首先,overlay网络和物理网络是分别管理的,任何一个网络故障都需要两方面的工程狮联合调试。其次,即便联合调试,一旦一个数据包被封装好进入物理网络,我们便再也无法识别这个数据包了,除非在物理网络上花大价钱进行Deep Packet Inspection。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,560评论 4 361
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,104评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,297评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,869评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,275评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,563评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,833评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,543评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,245评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,512评论 2 244
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,011评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,359评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,006评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,062评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,825评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,590评论 2 273
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,501评论 2 268

推荐阅读更多精彩内容

  • 前段时间有幸和国内的同行们交流了一番,发现形势大好。云,openstack,VMWare,SDN都开始有repea...
    xinwu阅读 827评论 0 3
  • 有些朋友一看这个问题可能会有些不知所云,如果SDN控制器不管物理交换机,那么它管什么呢?答案是只管理虚拟交换机。这...
    xinwu阅读 3,597评论 7 22
  • 宝宝今年又大了一岁,但是说话依旧很雷人,同时也给我们带来了无限的乐趣。 一天,我和宝宝在外面吃饭,吃饭的地方离家有...
    柳絮XM阅读 259评论 4 4
  • 你做过意志力训练么?比如21天连续写作、100天连续早起、365天每天记日记。 是不是坚持一段就不坚持了? 今天看...
    馋人小博阅读 534评论 2 1
  • Snapseed是一款相片处理软件,任何人均可轻松美化、转换和分享其相片。特别是Snapseed被google收之...
    纸影阅读 3,322评论 0 35