首页 首页 云计算 查看内容

云数据中心网络虚拟化——大二层技术巡礼之控制平面多虚一

木马童年 2018-8-10 20:57 31 0

控制平面多虚一,指的是将两台或者多台设备的资源(包括操作系统、转发实例、转发表、端口等)进行整合,对外表现为一台逻辑设备,以Cisco VSS,Huawei CSS和H3C的IRF为代表,后来Cisco又推出了vPC技术作为对VSS的升 ...

控制平面多虚一,指的是将两台或者多台设备的资源(包括操作系统、转发实例、转发表、端口等)进行整合,对外表现为一台逻辑设备,以Cisco VSS,Huawei CSS和H3C的IRF为代表,后来Cisco又推出了vPC技术作为对VSS的升级(虽然vPC已经很难说是控制平面多虚一技术了)。其实在这些技术中,除了转发实例、转发表这些转发逻辑层面的资源以外,端口这些数据平面的资源都被连带着整合了,因此又称“虚拟机框”技术。为了方便起见,以下就称为“虚拟机框”技术了。

这类技术和堆叠技术,感觉应该本质上是一回事,不过堆叠设备必须要落在一起,要通过专门的堆叠口、堆叠线进行连接,而“虚拟机框”设备间则可以通过线卡上的端口进行以太网的连接,距离能拉的很远。

几台设备搞成一台,好处是很多的。第一,简化了运维,以前几台设备各配各的配置,复杂不说还容易出错,堆叠后管理员配一次就都OK了。第二,高可用性,每台设备里面都有引擎,一台坏了能够自动倒换,也就省去了HSRP这些麻烦事。第三点,也是最重要的是,“虚拟机框”技术在提供端口冗余的同时,能够避开STP,除了网管心头的一个大害。这类技术典型的组网场景如下图右侧所示:

1)VSS

VSS是Cisco Catalyst 6500系列交换机推出的虚拟机框技术,支持对两台6500设备以主备模式进行整合。其中主用交换机中的引擎负责这个逻辑设备的转发决策,形成转发表,而备用交换机不断地同步相关信息,不进行学习和计算。而主备用设备的线卡都是分布式的,同时进行数据的转发。VSS主要有以下技术点:

  • 控制信令VSL(Virtual Switch Link)。VSS技术通过VSL将两个机架绑定成为一个虚拟的交换系统,它依赖于控制信令VSLP的交互,以完成主备的协商以及状态的同步。同时VSL也能在主备交换机间传输普通数据流量,这时它其实就相当于虚拟设备的背板走线。当然了,为实现虚拟设备的线速转发,VSL链路应该具备足够的带宽。
  • 高可靠技术NSF/SSO。SSO (Stateful Switchover)技术是保证了主备引擎、线卡能够以最短的时间进行切换。但是即使中断时间很短,数据转发也可能出现中断,路由可能需要重新收敛。NSF(NonStop Forwarding)则解决了这一问题,实现了路由的平稳重启。
  • 跨设备链路聚合MEC(Multichassis EtherChannel)。MEC是一种二层的多路径技术,它将相连节点分别与VSS主备两台交换机间相连的两个端口聚合为Port Group,统一为一个转发端口,从而允许在不采用生成树协议的条件下,构建无环路的二层转发拓扑。在VSS拓扑结构中使用MEC,所有链路都是激活的,在提供高度可用的拓扑结构的同时,也提高了链路的利用率。
  • 双活监测机制。当VSL故障后,两台物理设备都将成为主用交换机,对上下游设备造成IP网关混乱。为了防止双活问题的发生,VSS采用以下机制进行监控:如果有跨设备链路聚合时,使用PAgP来互相检测通知;如果有富裕接口在虚拟化的两台物理设备间可以单独再拉根直连线路,通过VSLP Fast Hello专门用做监控;另外VSS还可以使用IP BFD通过互联的三层链路进行监控。监测到双活后,立刻禁用原备用交换机的端口,直到VSL链路恢复。

虽然VSS只允许两台物理设备的虚拟化,不过通过虚拟设备间的互联仍可进一步简化核心网的拓扑。如下图所示,图中汇聚层和核心层均使用了VSS技术,保证高可用性的同时形成了一个天然无环的拓扑结构。

2)CSS/IRF 2

CSS、IRF 2分别是华为、华三私有的“虚拟机框”技术。CSS的前身是iStack,iStack通过堆叠方式支持盒式设备的多虚一,而CSS支持对框式设备的多虚一。IRF 2的前身是IRF 1,IRF 1通过堆叠方式支持盒式设备的多虚一,而IRF 2同时支持盒式设备/框式设备的多虚一。CSS/IRF 2和VSS的基本原理和组网架构如出一辙,也就是换换名称而已,对比如下。

控制信令

可靠性技术

链路聚合技术

双活监测技术

CiscoVSS

VSLP

NSF/SSO

MEC

PAgP/VSLPFastHello/IPBFD

HuaweiCSS

堆叠竞争报文

支持倒换,可能不支持NSF

Eth-Trunk

私有DAD协议

H3CIRF

IRFLink

支持倒换,可能支持NSF

支持,没找到技术名称

LACP/免费ARP/BFD

另外,相比于VSS只支持两台设备的虚拟化,CSS和IRF 2都支持1:N的主备用模式,能够提供更高的可靠性。从目前能够找到的资料来看,CSS和IRF 2最多都能支持4台框式交换机,或者9台盒式交换机的虚拟化。其实,Cisco最开始设计VSS时,也准备支持1:N模式,但是后来由于Cisco的控制平面多虚一的技术路线演化为了vPC,因此也就不了了之了。

3)vPC

Cisco在Nexus系列交换机中摒弃掉VSS,推出了 vPC( virtual Port-Channel)特性。前面说过VSS/IRF是整机级别的虚拟化, 而vPC则是接口级的虚拟化,其实就是实现了VSS中的跨设备链路聚合。因此在vPC中只需要对成员接口进行链路聚合相关的信息同步即可,不需要对整机进行状态同步。下图中其中vPC对应MEC,Peer-Link对应VSL,CFS Protocol对应VSLP ,Peer-Keepalive Link对应VSLP Fast Hello。

下面通过一个二层转发的实例来介绍vPC的工作原理,其中左图为ARP请求的泛洪过程,右图为ARP应答,假设SW1 port 11,SW2 port 21属于vPC 1,SW1 port12,SW2 port 22属于vPC 1。SW1通过port 11上收到ARP请求,之后在vpc link和port 12上进行泛洪。SW 2收到该ARP请求后,判定port 21与port 22与SW 1中的一些端口进行了vPC绑定,因此不会从这两个端口进行转发。同时SW 1通过CFS消息告诉SW 2 MAC_A接在vPC 1上。当SW 2通过port 22收到ARP应答后,查找MAC地址表,得知目的地址为MAC_A的帧应该向vPC 1的成员端口转发,于是通过port 21转发给SW 3,同时通过CFS告知SW 1 MAC_B接在vPC 2上。之后的通信得以按照学习到的信息进行转发。

对外来看,实现vPC的设备还是两台设备(就目前找到的资料来看,vPC也只支持2台设备的虚拟化),管理上还是要分开配置,两台设备的转发实例、转发表等都是独立的,STP、HSRP这些协议也还需要启用(vPC针对HSRP有一些改进)。可以说,vPC网络是单数据平面,双控制平面的。当然了,这也意味着vPC设备的引擎是双活的,就这一点来说vPC比VSS要好一些。不过,从复杂度来讲vPC没有VSS这类技术好。vPC与VSS简单对比如下。

VSS

vPC

共性

跨设备链路聚合

支持

支持

链路负载均衡

支持

支持

控制平面

控制引擎

1:1主备

双活

现有协议

链路汇聚协议

PAgP

LACP

生成树协议

不需要

需要

网关冗余协议

不需要

需要

网管

单一配置

两台机器独立配置

跨设备链路聚合,除了Cisco的vPC一台,Arista也有个类似的技术MLAG,其核心原理和vPC如出一辙,这里就不再赘述了。

控制平面多虚一技术发展了很多年,其技术已经较为成熟稳定,在数据中心中得到了广泛的部署。从最初的堆叠到“虚拟机框”,在一定程度上解除了地理位置的限制,但是走分布式协议来进行整机状态的同步,终究还是会对部署规模有一定的制约。虽然CSS/IRF 2都支持4台框式交换机的虚拟化,但估计也很难再往上提高了。另外,扩大部署规模还可以通过虚拟设备间的互联,不过本节提到的技术都是私有的,各家设备不能混合组网,属于技术以外隐形的约束。而近年来,隧道的数据平面虚拟化技术的发展,则为数据中心提供了几乎无限的可扩展性,“虚拟机框”的技术面临着极大的挑战。

作者简介:

张晨,北京邮电大学未来网络理论与应用实验室研究生

主要研究方向:SDN、虚拟化、数据中心

个人博客:http://sdnv.xyz/

个人邮箱:zhangchen9211@126.com

在不久的将来,多智时代一定会彻底走入我们的生活,有兴趣入行未来前沿产业的朋友,可以收藏多智时代,及时获取人工智能、大数据、云计算和物联网的前沿资讯和基础知识,让我们一起携手,引领人工智能的未来!

操作系统 数据流量 虚拟化 华为 负载均衡 虚拟化技术
0
为您推荐
云安全,为什么离不开可视性即服务?

云安全,为什么离不开可视性即服务?

无论您是一名网络管理员、安全管理员还是首席信息官,您是否考虑过如果不能对大部分网…...

云计算市场竞争越演越烈,腾讯云四大核心产品全面降价!

云计算市场竞争越演越烈,腾讯云四大核心产

1月2日,腾讯云宣布云服务器、云数据库、云存储和云安全四大核心产品全面调价,最高降…...

云计算还是 云“算计”?

云计算还是 云“算计”?

现在越来越多的公司都在讨论云计算的概念,工信部日前发布的发展意见中提到,到2019年…...

云计算为金融行业特别是银行业,带来了哪些机遇和收益?

云计算为金融行业特别是银行业,带来了哪些

云计算不仅仅是简单的服务器和存储器租赁,更深层次地,它提供了一种灵活、敏捷的以客…...

关于公有云隐私,我们必须知道哪三个问题

关于公有云隐私,我们必须知道哪三个问题

公有云与私有云之使用的辩论一直未有信息。对于公有云,大部分企业拒绝使用它的一个原…...

SAP CTO张侠:云安全并不很可怕

SAP CTO张侠:云安全并不很可怕

如今,云计算虽火,但云安全问题却成为拦在人们心里的一道坎。ForresterResearch调查…...

谷歌称人工智能芯片让他们省了15个数据中心!

谷歌称人工智能芯片让他们省了15个数据中心

谷歌神经网络芯片 谷歌的操作系统无疑是地球上最大的计算机网络,该系统由遍布四大洲…...

怎样使用云和大数据赢得黑客战争?

怎样使用云和大数据赢得黑客战争?

今天 ,惠普资深副总裁以及企业安全软件产品负责人Art Gilliand ,在2013年RSA安全大…...

全球链圈大咖云集,2018可信区块链峰会将于10月在京召开

全球链圈大咖云集,2018可信区块链峰会将于

在政策、技术、市场的多重推动下,区块链技术正在加速与实体经济融合,如何推进区块链…...

阿里集团CTO王坚:云计算是一种公共服务

阿里集团CTO王坚:云计算是一种公共服务

“过去,你必须把一台计算机搬回家才能使用计算;今天,你可以通过互联网来享受计算,…...