首页 首页 大数据 查看内容

互联网企业大佬们的自研数据中心之路

木马童年 2019-4-29 10:55 22 0

2000年以后,我们进入了互联网时代。在这个世界上涌现出了一批优秀的互联网企业,比如国外的Google、Facebook,国内的百度、阿里巴巴、腾讯等。这些互联网大佬依托于互联网技术发家,自然对自己赖以生存的数据中心非 ...

2000年以后,我们进入了互联网时代。在这个世界上涌现出了一批优秀的互联网企业,比如国外的Google、Facebook,国内的百度、阿里巴巴、腾讯等。这些互联网大佬依托于互联网技术发家,自然对自己赖以生存的数据中心非常重视。Google每年投入到数据中心建设的费用高达数亿美元,在2013年投入超过了10亿美元。Facebook也不甘落后,纷纷在世界各地建设新的。国内的企业也在布局,仅2013年,百度在内蒙建设的大型数据中心建设,腾讯的天津特大型数据中心建设,都耗资数亿。全世界的数据量都在成倍的增长,互联网企业要想保持高速增长,就必须做大量的投入,购买数万台的服务器,数千台的网络设备,一个数据机房一周的时间就可以搭建完毕。流淌着的流量那就是金钱,谁的数据中心规模越庞大,谁就能掌握的流量越多,谁就将成为这个市场的王者。

在经过了近些年大刀阔斧的建设后,这些大佬们才意识到控制成本,一味的不考虑成本的投入显然大大摊薄了获得的净利润。只有自己对自己的数据中心建设意图最了解,对采购进来的服务器、网络设备、存储设备等只做简单的堆叠与互连,显然无法充分发挥出最大的效能。有些大佬已经开始意识到这样的发展迟早会出现问题,会被竞争对手所超越,最好的数据中心并不是指有最多数量的服务器和网络设备。

互联网企业的业务完全依托于集群服务器(指的是数百台服务器因一个应用同时工作),对服务器数量需求很大,随着数据量增加,增加服务器是不可避免的。所以首先他们要控制采购服务器的数量,减少硬件采购成本,尽量通过软件优化提升性能。互联网企业的技术人员整天和服务器打交道,所以对服务器非常了解,尤其许多涉及硬件的应用设计还需要和服务器厂家的人合作完成,这就让互联网企业的人有机会接触到服务器操作系统的底层实现,这样互联网企业就有了自研服务器的技术基础。现在的服务器几乎成为了标准设备,硬件方面主要是CPU+内存+硬盘+网卡,再安装上免费的Linux操作系统就可以用了。互联网企业显然不愿意再掏大量的金钱去购买这些服务器,让服务器厂家大赚一笔。于是他们开始自己研发服务器样品,然后直接与代工厂合作,提供需要的服务器硬件指标,由代工厂生产,这样减少了采购环节,节约了采购成本。在Google、Facebook的数据中心到处可见其自研的服务器设备,他们可以为了实现自己的应用甚至去修改服务器的硬件设置,让服务器完全为应用服务,如果使用的是别人的服务器就很难实现。这种自研服务器为Google和Facebook的业务部署提供了方便,Facebook甚至还准备向外出售其设计的服务器产品。

当然,凡事都有两面性,服务器厂商专做服务器几十年,显然不是互联网企业所能比拟的。虽然互联网企业技术积累深厚,但毕竟不是专做服务器,所以他们自研的服务器仅限于低级应用程序使用,服务器的性能和功耗等也无法与服务器厂商的设备相比。现在服务器厂商的设备可以达到32核同时工作,硬盘数TB,内存32G,这样的高性能产品互联网企业很知趣,还得乖乖地从外部采购,自研技术还不到家。就算是自研的服务器也不敢承载重要业务,与服务器厂家设备在各种各样应用环境中得到磨练相比,自研服务器的稳定性还不足,一旦承载的业务出问题,有苦只能往自己肚子里咽,如果是使用的是服务器厂商的,还可以向服务器厂商讨要损失。所以服务器自研之路并不是那么好走的,只能是互联网大佬的一个尝试,想完全自给自足,还有很长的路要走。

国内几个互联网大佬们也没有闲着,自研服务器对他们有点难度,毕竟中国接触服务器的时间有点晚,掌握到服务器设计技术的人才较少,服务器技术的发展远低于国外,于是他们将触角引向了网络设备。百度和腾讯早在自己的数据中心里部署了自研的网络设备。这些互联网企业的数据中心网络架构并不复杂,普遍内部采用的是大二层网络,汇聚层有几台三层设备就可以了,基本没有复杂的协议运行,OSFP是其最喜欢的三层协议,二层聚合互连是其最喜欢的二层协议,这样的数据中心为了实现服务器互连需要数千台的二层网络设备,所以他们每年采购二层网络设备数量仅次于服务器数量,价格不菲。二层网络设备硬件组成主要有转发芯片+CPU+内存,转发芯片可以完成二层转发功能,只要通过软件调试让这些芯片协调工作起来即可,所以相比服务器,二层网络设备更为容易自研,现在的百度已经完全实现了二层网络设备自己自足。由于受技术积累所限,三层以上的网络设备还需要从外部采购,腾讯也采用的这种模式。同样,采用自研设备受限于自身技术积累不足,掌握不好反而达不到节省成本的目的,2013年年底的这次腾讯QQ业务大断网就是其自研设备惹的祸,这次故障给腾讯带来了非常不好的声誉,所以过于大胆采用自研设备就意味着风险增加,就目前互联网的技术积累而言,步子还是不要迈的太大。

数业有专攻,互联网企业本质还是基于数据中心做应用的,并不是专业的数据中心提供商,走自研之路可以给互联网节约成本,更加具有竞争优势,值得学习。但除非有雄厚的技术积累,成熟的应用,才可以走自研之路。就现行的技术发展水平而言,互联网企业的数据中心自研仅能作为其数据中心建设的一个必要补充,成不了主流,更不会是全部。对于中小型的互联网企业而言,就不要自研了,聚焦自己业务,否则会得不偿失。

在不久的将来,多智时代一定会彻底走入我们的生活,有兴趣入行未来前沿产业的朋友,可以收藏多智时代,及时获取人工智能、大数据、云计算和物联网的前沿资讯和基础知识,让我们一起携手,引领人工智能的未来!

互联网 阿里巴巴 互联网技术 数据中心 网络设备 数据机房
0
为您推荐
大数据技术改变城市的运作方式,智慧城市呼之欲出

大数据技术改变城市的运作方式,智慧城市呼

纽奥良虽像大多数城市一样有火灾侦测器安装计划,但直到最近还是要由市民主动申装。纽…...

大数据分析面临生死边缘,未来之路怎么走?

大数据分析面临生死边缘,未来之路怎么走?

大数据分析开始朝着营销落地,尤其像数果智能这类服务于企业的大数据分析供应商,不仅…...

什么是工业大数据,要通过3B和3C来理解?

什么是工业大数据,要通过3B和3C来理解?

核心提示:工业视角的转变如果说前三次工业革命分别从机械化、规模化、标准化、和自动…...

大数据普及为什么说肥了芯片厂商?

大数据普及为什么说肥了芯片厂商?

科技界默默无闻的存在,芯片行业年规模增长到了3520亿美元。半导体给无人驾驶汽车带来…...

大数据技术有哪些,为什么说云计算能力是大数据的根本!

大数据技术有哪些,为什么说云计算能力是大

历史规律告诉我们,任何一次大型技术革命,早期人们总是高估它的影响,会有一轮一轮的…...

个人征信牌照推迟落地,大数据 重新定义个人信用!!

个人征信牌照推迟落地,大数据 重新定义个

为金融学的基础正日益坚实。通过互联网大数据精准记录海量个人行为,进而形成分析结论…...