作为在数据中心和基础网络上资源最为雄厚的一家运营商,中国电信在继去年率先发布完整云计算战略后,又单独成立专业云计算公司,统筹管理全国各省的云计算业务。与公司架构调整同步的是,中国电信同时在集团层面成立了云计算研究中心,为全网后续发展提供技术储备和智力支持。
但作为一家坐拥数亿个人家庭用户和数千万企业级用户的运营商,中国电信在云计算方面的一举一动都牵动着业界的神经。如此大体量的玩家,应该如何切入到云计算这个新鲜事物中,在不能冒太大的技术风险的前提下,既要保持行业前瞻性和领导力,又要对现网中的业务产生良好的支撑。
机会总是青睐于有准备的人,在中国电信的云计算摸索中,广东电信和广东电信规划设计院在很大程度上进行了大胆实践创新,不但构建了国内最大的电信级业务网云计算平台,还对众多新技术进行了跟踪验证。广东电信的很多经验被集团所采纳,并在全网进行推广。广东电信是如何做到的呢?在日前,C114中国通信网编辑对广东电信规划设计院技术总监王晖博士和项目经理林梓鹏进行了专访。
创新
据王晖博士介绍,中国电信从2009年正式开始了云计算征程。“集团公司领导对此给予了很高重视,希望能够借助云计算和新兴的商业模式,实现多业务、多网络、多终端的融合及价值链延伸,为客户提供便捷、丰富、个性化、高性价比的综合信息服务。”
与中国移动提倡的公有云和私有云不同,中国电信是按照应用场景而不是用户群体进行划分,初步划分为IT云和业务云。业务云分成两类,一个是满足中国电信自身业务网络应用,再者就是满足公众用户需求,而IT云则主要是面向核心的运营支撑系统。
“中国电信的云计算是从上到下决定部署的,集团选定了几个相关的研究机构,而我们院则是整体规划中的重要支撑单位,主要承担云计算数据中心设计、云计算管理平台和IT支撑系统云化等方面的工作。在具体工作中,我们(设计院)和集团公司的几大研究院都进行了紧密合作,他们靠前,我们靠后。”
图为广东电信规划设计院技术总监王晖博士
云计算数据中心是王晖关注的焦点之一。“一开始我们认为虚拟化是云计算技术的难点,但在后续部署过程中,发现网络也是个很大的难点。所以,中国电信在今年将数据中心交换机拿出来单独进行集中采购。”
单独招标虽然能够使得交换机产品满足云时代的大容量、高速率、无阻塞、线性转发等技术特性,但并不能从根本上解决问题。“在服务器虚拟化的浪潮下,网络也必须完全虚拟化,但在这方面,业界并没有明确的标准。大二层的网络是大家都认可的,但如何去实现却有着不同的技术路线,这是个很大的问题。但作为运营商而言,无论是采用何种技术,我们肯定不希望是私有标准。”
王晖以中国电信西部信息中心为例子进行了详细说明。“作为集团公司新一代五星级数据中心的典型代表,西信面临的是一个高密度、大容量的网络应用场景,这就要求解决方案必须具备高万兆宽口密度、40G接口、虚拟化能力、突发流量吸收、绿色节能等特征。经过严格的技术性能验证,我们选择了华三解决方案来组网。从后面的效果来看,网络的稳定性和可靠性得到了充分保障。”
从王晖的经验来看,并不是所有的业务都适合云计算架构。“业务网络(包括对内对外)可以云化,因为它能够显著提高IT资源的使用效率。云计算比较适合那种大规模并发、多线程可逆度小的业务,普遍的都是短流程特征,而IT支持系统的业务生产流程非常长,而且牵扯到数据库,很难提供这些业务必须的QoS。”
王晖的想法与中国电信集团的实践也是相符的。“中国电信正在全国范围内对业务网络平台进行整合,将那些利用率不高的业务平台关停下线,或者是迁移到虚拟资源池中,这将会显著提高利用率。”王晖透露。
实践
对于云计算而言,前瞻性的技术研究层出不穷,但真正落到实处的却是凤毛麟角。这也从另外一个层面凸显了实践性的重要性,而广东电信在这方面则迈出了坚实的步伐。
“其实,我们在2009年就开始了云计算资源池的部署工作,而当时集团公司还没有明确计划。”林梓鹏说,“当然这也有点歪打正着的意思,因为广东电信的增值服务做得比较好,对于业务的快速开通部署上线方面有着明确需求。而传统的‘烟囱式’IT架构是难以满足这一点的。在以前,我们一个新业务的开通需要好几个月的时间,但现在只需要几个小时。”
“当时,我们在元岗机房部署了首个资源池,采用是惠普的服务器和VMware的虚拟化软件,主要做天翼手机云。在2010年,我们又相继在花地湾和跑马场进行了资源池部署;而在去年,又在新大岗进行了商务领航云的资源池建设。几个局点合计已经超过了五千台虚拟机的规模。”林梓鹏介绍到。
五千台虚拟机的绝对数量,在国内可能排不上前列。但在电信运营商的某个省级运营单位,还是首屈一指的。就以多年前就开始宣传的中国移动大云规模来说,其节点的数量也只是维持在2000个左右。
“我们的虚拟资源池现在承载了天翼手机云、商务领航云、IMS云、增值业务核心平台云、互联网云、移动互联网云等。我们还是采用集群的方式来建设,比如商务领航云就分布在三个节点上,而增值业务平台云则是部署在两个节点上。”
做云计算首先需要解决的就是虚拟化。在这方面,林梓鹏则更有心得。“广东电信这几年积累了很多经验,从配置方面来说,我们一开始是尝试用刀片来做虚拟化的,然后又改用PC服务器。但实际过程中,刀片机框散热不是很好,一个机架也只能放一框刀片框,空间成本很高,所以我们放弃了用刀片来做虚拟化。后来,我们基本上全部采用高端PC服务器,特别是高密度服务器。”
在虚拟化软件平台上,广东电信则普遍采用的是VMware平台,只有小部分采用了微软的Hyper-V和红帽的KVM。“VMware的成本是很高的,但我们也是希望能够一炮打响。”据他透露,后续可能会引入一些相对较低成本的虚拟化平台。
云计算平台构建另外非常关键的环节,就是如何保障虚机之间的无缝迁移。“目前我们采用的是H3C的IRF技术,它通过把多台物理设备虚拟成一台逻辑设备,避免生成路由协议。如果数千个虚机采用传统方式进行交换,生成树结构就非常复杂。而IRF这样的堆叠技术本身就可以实现链路之间的分担,解决云计算资源池二层网络的问题。”
“但IRF只是传统网络中的技术增强,并没有超出传统网络,它为虚拟机迁移创造了合适的大二层环境。但并没有解决虚拟机迁移网络策略跟随的问题,在这方面,我们目前是尝试着在采用H3C推出的VEPA来最终实,通过二层网络里打标签,在三层网络里进行交换。”林梓鹏说。“虽然它尚未完全成为业界标准,但已经得到了惠普、IBM等国际大厂的支持,而且在应用过程中,效果也非常明显。”在技术选择上,林梓鹏和王晖持有同样的观点,“我们会尝试多种新技术但肯定不会选择采用私有协议。”
众所周知,在虚机交换与迁移领域,主要技术有思科力推的VEB和H3C等力推的VEPA。而VEB最重要的是该解决方案是一个封闭体系的解决方案,在某种程度上可以说思科利用其在业界的技术品牌优势,对一个封闭体系的解决方案进行大力营销。
“之前都是摸着石头过河,虽然取得了一些成绩,但也走了一些弯路。现在集团公司对于云计算的热情和投入已经非常大,也成立了专门的研究机构,这将加速我们在未来云计算部署上的速度和规模。”林梓鹏说。“我们接下来也将和兄弟部门一道,继续在云计算方面的探索,创造更多更好更有价值地实践经验。”
来源: |