李永超, 程 航, 周丽丽, 张 悦
(1.辽宁省大连市气象信息中心,辽宁大连 116001;2.辽宁省大连市气象台,辽宁大连 116001)
大连气象云平台设计
李永超1, 程 航2, 周丽丽1, 张 悦1
(1.辽宁省大连市气象信息中心,辽宁大连 116001;2.辽宁省大连市气象台,辽宁大连 116001)
摘要立足解决大连市气象局数据中心面临的IT运维管理难题,结合大连市气象局的实际业务应用情况,讨论了构建气象云平台的必要性和实际意义。通过分析云平台的整体设计部分分层讨论了各部分功能及特点,并对比分析传统数据中心服务器及存储管理方式,发现气象云平台能够极大地降低IT中心TCO(总体拥有成本)、提高运营效率和提高服务水平,且实现了对旧硬件和操作系统的投资保护。
关键词云计算;服务器虚拟化;气象云平台;设计
随着国内气象业务的不断发展,越来越多的气象业务系统依赖于数据中心的支撑,其中包括门户网站系统和各类其他便民系统以及各类测试系统等,这些业务迅速发展给IT带来很大压力,服务器需求不断增多,机房空间、电力成为瓶颈,导致应用所需服务器资源紧张,正常项目开展受到限制。在数据中心的建设过程中,随着各种业务系统的建设和更新换代,每个业务系统均占用了大量的新旧服务器,其硬件利用率低下、管理复杂、运行成本居高不下等问题正逐渐显现。由于传统服务器的硬件和操作系统的绑定,使得服务器之间无法复用计算资源,只能通过为不同业务单元分别堆加服务器来满足业务要求,随着企业规模发展,显然传统模式的数据中心无法在快速响应和节省成本之间找到平衡点。为了应对这些压力,人们开始寻求新的技术和管理解决方案[1]。
大连市气象局数据中心作为数据资料密集型事业单位,信息化建设不断发展,目前信息化网络以信息中心为运营维护单位,覆盖自动站采集、数值预报计算等多套业务系统,服务器资源庞大[2]。虽然大连市气象局完成了对其数据中心的服务器虚拟化改造,大幅度提高云计算系统中资源和应用程序的效率和可用性,但仅仅完成服务器的虚拟化已经远远不能满足各种业务对其数据中心的新需求,尽快地完成云计算建设是一件势在必行的大事。在这种模式下,从管理和资源使用方面来讲均存在诸多问题,如不断增加的服务器数量导致耗能、制冷,甚至空间占用都十分巨大;资源共享困难,使得服务器利用率很低;气象数据资料的迅猛增加,存储资源成为一大难题。为此,笔者提出气象云平台的研究与设计,尝试从根本上改变气象业务系统的传统部署方式,解决目前存在的种种问题。
1现状分析
1.1需求分析目前大连市气象局的磁盘阵列划分孤立、分散,造成了磁盘阵列的浪费以及数据的高风险性,且十分不易于维护。随着之后系统和数据量的不断增加,这一现象将会持续加剧。服务器中,除了视频服务器和下载服务器外,其他服务器的负载均非常小,远没有达到充分利用的状态。虽然视频服务器和下载服务器的负载相对较高,但也没有充分发挥硬件平台的资源效率。另外还有一些运行边缘业务的服务器,由于设备老旧以及所在位置等原因,此次尚未统计在内。在存储阵列方面,大连市气象局数据中心的主要存储设备及其相应系统的容量与使用率情况如下:①IBM DS4700阵列上,网管系统可使用的总容量为1 400 G,现已使用了800 G,使用率为57%;邮件系统可使用的总容量为1 950 G,现统计分析系统已使用了900 G,使用率为67%。人力资源系统可使用的容量已全部分配完毕。②IBM FastT600阵列上,库存管理系统可使用的总容量为1 340 G,现已使用了1 340 G,使用率为100%;身份认证系统可使用的总容量为340 G,现已使用了170 G,使用率为50%。③IBM DS5020阵列上,视频服务器可使用的总容量为1 540 G,现已使用了1 530 G,使用率为97%;防病毒系统可使用的总容量为270 G,现已使用了206 G,使用率为76%。④EMC CX3-40阵列上,财务系统可用总容量为941 G,现已使用了325 G,使用率为32%;移动站业务管理系统可用总容量为800 G,现已使用了270 G,使用率为34%;安全评估系统可用总容量为600 G,现已使用了305 G,使用率为51%。
通过对大连市气象局服务器和存储现状的分析,目前IT基础架构有以下几个问题亟待解决:①资源孤立且利用率低下。现有数据中心中,计算、存储以及网络资源均是紧耦合的,也就是说数据中心内的IT建设是烟囱式的,根据客户需求一个项目建设一套系统,这样便形成了一个个的“项目孤岛” 。这种系统牵一发而动全身,很难做任何改变,扩展起来要对系统进行重新设计。在这种环境下,系统之间无法相互通信,资源不能在整个数据中心里实时、动态调度与共享,这样便使服务器与存储以及网络资源得不到充分利用,各种资源的利用效率全面低下。②服务器和存储购置成本高,维护成本递增。随着应用的不断增加,服务器数量也随之增加,每年要支出高额购置费用,还有部分服务器已经过保修期,部件逐渐进入老化期,维护、维修预算费用也逐年增加[3]。③可用性低下。首先,几乎每个应用服务器均是单机,如果某台服务器出现故障,相对应的业务也将中断。其次是当硬件需要维护、升级或出现硬件故障时,上层业务系统均会出现较长时间的中断,影响业务的连续性,其中包括一些重要业务系统,一旦中断服务影响很大,未来数据中心搬迁时会更加麻烦。④兼容性差。业务系统和应用迁移到其他服务器上时,需要考虑与旧系统关联的兼容性。新的软件包括操作系统和应用软件无法运行在老的硬件平台,而老的代码有时候也很难移植到新的硬件平台上。如由于各种资源数据库不同公司分别开发,需要运行的软硬平台很多时候不能保证兼容。为节省时间、物力和保持系统部署的顺利,只能用增加服务器单独部署的方法来解决。
1.2云平台创建的必要性虚拟化技术在一定程度上缓解了上述问题带来的影响,如服务器虚拟化可以帮助数据中心减少物理服务器的数量,进而使企业在电源、散热以及机房面积上节省巨大的成本。此外,它还可以减少数据中心UPS和网络设备的费用以及所占用的空间,同时还可以大幅减少管理物理服务器的宝贵时间,提高部署服务器的效率。当前的企业环境中,IT的运营管理存在浪费、低效率等通病,传统的管理模式无法满足动态变化的虚拟化和云环境。传统的垂直竖井式管理把特定应用和基础架构捆绑在一起,这种方式脆弱且不便管理。为了增加业务敏捷性,许多企业希望缩短由竖井式的手动操作导致的冗长的服务响应时间,由于操作的不灵活,IT专家经常需要数天甚至数周来交付急需的资源和应用[4]。此外,业务系统应用的开发较以往任何时期都要发展迅速,功能每日都会更新,规模每小时都在改变,因此,用户需求带来的持续压力使得业务应用系统面临着变更不及时的问题。云平台的业务应用系统需要实时访问云基础架构,而构建应用程序仍需管理员在各个虚拟机上分别安装和配置应用程序组件,以便插入到应用体系结构中。在当下的云计算时代中,企业和组织需要更高效的应用部署方法。
2气象云平台整体设计
2.1整体架构
2.1.1服务器虚拟化层。由vCloud Suite所构建的云计算数据中心的整体概念架构(图1)最底层是最基础的服务器和网络与安全虚拟化,该层是整个云计算数据中心的基石,用来实现对物理服务器以及相关联的网络与安全组件的虚拟化功能,对应的vCloud Suite产品组件是vSphere。
图1 VMware vCloud Suite整体架构Fig.1 The overall framework of VMware vCloud Suite
2.1.2服务编排层。服务器虚拟化层之上是服务编排层,这一层可以对所支持的相关服务进行编排,协调多个系统以实现组合操作,从而避免在不同系统上执行多个单独的操作。该层对应的产品组件是vRealize Orchestrator (vRO),该组件目前打包在vCenter Server中,无需单独购买。
2.1.3服务调配层。服务编排层之上是服务调配层,通过该层,客户可以对通过自助式门户和目录向终端用户提供的预定义基础架构和桌面服务进行自动化调配,同时,它还可以调配和管理应用服务或部署用户自己的PaaS。该层自身不具备虚拟化资源的能力,而是与底层虚拟化平台协作,来提供调配和管理基础架构、桌面和应用服务的能力。该层对应的产品组件是vRealize Automation (vRA)以及vRA企业版所包含的组件vRealize Automation Application Services。
2.1.4运维管理模块。概念架构图的右侧是运维管理模块,该模块用来对整个云计算数据中心进行性能、容量以及应用依赖关系相关的管理。该模块使 IT 部门可以获得更好的可见性和可操作的智能信息,从而主动确保动态虚拟环境以及整个云计算数据中心中的服务级别、资源利用率优化和配置合规性。该模块对应的产品组件是vRealize Operations。
图 2 云平台安装流程Fig.2 The installation process of cloud platform
2.1.5可用性与灾难恢复模块。架构图的最左侧是可用性与灾难恢复模块,该模块可以最大程度上提升云计算数据中心的可靠性、可用性和灾难恢复的能力。该模块对应的产品
组件包括vSphere的相关高可用机制,如vMotion、Storage vMotion、vSphere Replication以及灾难恢复解决方案vCenter Site Recovery Manager。2.2简单部署气象云平台的部署过程简单来说分为4个步骤,首先是准备阶段,需要整理软件安装包和数据等,接下来是安装系统文件和数据库,然后是安装云管理平台软件(图2)。
3小结
该研究立足解决大连市气象局数据中心面临的IT运维管理难题,结合大连市气象局的实际业务应用情况,讨论了构建气象云平台的必要性和实际意义。基于大连气象云计算管理平台的关键模块展开研究,通过分析VMware vCloud Suite架构中服务器虚拟化、可用性与灾难恢复、运维管理与服务调配等方面技术特点及优势,并对比分析传统数据中心服务器及存储管理方式,发现气象云平台能够极大地降低IT中心TCO(总体拥有成本)、提高运营效率和提高服务水平,且实现了对旧硬件和操作系统的投资保护。
参考文献
[1] 王学芹.云计算安全问题研究与探讨[J].科技与创新,2015(17):41,45.
[2] 何明华.云计算环境下的信息处理技术[J].信息通信,2015,23(1):10-11.
[3] 臧劲松.基于云计算的实验平台设计[J].计算机时代,2015,18(12):80-81.
[4] 卢良进.基于云计算的电子商务服务模式研究[J].软件导刊,2015,2(2):80-81.
作者简介李永超(1982- ),男,河南原阳人,工程师,硕士,从事计算机应用技术研究。
收稿日期2016-04-29
中图分类号S 16
文献标识码A
文章编号0517-6611(2016)16-196-02
Design of Dalian Meteorological Cloud Computing Platform
LI Yong-chao1, CHENG Hang2, ZHOU Li-li1et al
(1. Dalian Meteorological Information Center, Dalian, Liaoning 116001; 2. Dalian Meteorological Station, Dalian, Liaoning 116001)
AbstractBased on solving the problems of IT operation and maintenance faced by data center of Dalian Meteorological Bureau, combining with the actual situation, the necessity and practical significance for constructing meteorology cloud computing platform were discussed. Through analyzing the overall design of cloud computing platform, the functions and characteristics of each part were discussed. Traditional data center server and storage management mode were analyzed, it was found that meteorology cloud computing platform could significantly reduce TCO of IT center, improve operation efficiency and service level, realize the investment protection of old hardware and operating system.
Key wordsCloud computing; Server virtualization; Meteorological cloud platform; Design