葛志刚,张永红,侯永涛(.中国联通浙江省分公司,浙江杭州 0000;.中国联通兰州分公司,甘肃兰州 70000;.中讯邮电咨询设计院有限公司,北京 00048)
随着信息产业的高速发展,通信运营商的业务范围不断扩展,传统的通信机房融合了信息及IT 等业务服务,成为综合的信息及通信(ICT)业务机房。ICT 技术发展和业务需求的快速提升,机房用电量、功率密度和发热量急剧增加,配电和空调系统更趋庞大,日常运维管理更加复杂,对ICT 机房的配电管理、热管理以及空间管理等方面,提出了更高要求。因此,建设高质量的基础设施监控管理系统,对于ICT 机房安全可靠、高效智能的运行,具有重要的意义。
ICT 机房基础设施主要包括保障通信设备和IT 设备正常运行的变配电设备、机房环境、各类电力变换设备、后备电池、门禁系统和视频系统等,为实现对相关设备及机房环境的实时监控,ICT 机房大多建设了动环、门禁、安防等诸多监控系统。
由于不同ICT 机房运营商建设管理和运维管理体系不同,所建设监控系统的种类以及监控对象会有较大的差异。就中国联通而言,不同省份、不同管理部门的建设模式也同样存在较大差异,如对于动环监控系统,根据行业标准《通信局(站)电源、空调及环境集中监控管理系统》(YD/T 1363)的规定,动环监控系统可以涵盖高低压设备、能耗、视频、门禁等诸多监控对象,中国联通大部分省份遵循了这种建设模式。还有部分省份则将动环监控仅仅定义为对电力变换设备、单元式空调和机房环境的监控,其他监控对象则分属不同的监控系统,如机房视频和机房门禁作为安防系统建设,归属安保部门,机房维护人员无法实现机房视频和门禁等的管理,一般将此类动环监控系统称为狭义的动环监控系统。实际上,各通信运营商对监控系统的分类,都存在相同的情况,不同省公司,甚至同一省公司不同部门的建设模式各不相同。
表1 所示为目前ICT 机房基础设施监控系统建设时,相关监控对象和监控系统归属关系。
表1 ICT机房基础设施监控对象及监控系统归属
当前,不同的监控行业制定了不同的国家标准或行业标准,这些标准都是针对单一行业编制,关注某一个特定的应用场景,如视频监控、楼宇自控系统(BA)等。而ICT 机房的各类基础设施应作为一个整体考虑,不同的监控对象之间不是孤立的,而是存在千丝万缕的联系的。为解决这一问题,目前通常方案是建设一个ICT 基础设施综合监控平台,各子系统接入综合监控平台,对相关子系统进行整合,在统一的基础设施监控平台实现数据共享,进行大数据分析,实现智能(AI)运维和运营,使整个基础设施系统安全、高效地运行。
当前基础设施监控系统建设方案通常是,先建设不同的监控子系统,再将不同的子系统融合,接入统一的基础设施监控平台(也称基础设施综合网管)。各个被监控设备到现场监控采集设备的通信口,称为A 接口;现场监控采集设备到各监控子系统监控平台的通信口,称为B接口;各监控子系统监控平台到基础设备监控平台之间的接口,称为C接口;基础设施监控平台到其他系统的接口,如通信运营商的资管系统、传输网管等,称为D接口。这种建设模式是当前建设的主流,但也存在诸多问题,阻碍了基础设施监控系统建设的顺利实施。
A 接口是监控对象的通信接口,目前在通信行业中,YD/T 1363 规定了A 接口的通信协议,通信行业广泛应用的UPS、开关电源、高压直流电源以及单元式空调等设备普遍采用了该接口协议,保证被监控设备能够快速接入监控系统,降低了接口协议接入开发成本。而对于非通信行业专用的设备,如高低压配电、柴油发电机组等设备,A 接口仍处于无章可循的局面,监控工程实施时,需要监控厂家技术人员对此类设备进行接口协议的解析和调测。对于大型ICT 机房而言,需要对大量的被监控设备一一解析,造成人力和财力的巨大浪费,减缓了工程实施进度。
B 接口指各类监控采集设备的北向接口,由于B接口长期没有相应的规范,不同监控厂商的B 接口协议也不相同;在工程实施时,B 接口协议往往与监控厂家的监控平台高度耦合,使监控采集设备B 接口为该厂家独有,造成监控工程后期扩容、原有老旧监控采集设备更换的垄断。一旦原有监控厂家不再进行技术支撑,已建的监控系统将处于无法维护、最终无法使用的局面,造成投资的浪费,也为基础设施安全运行埋下隐患。
不同监控系统采用单独建设的模式,该模式存在诸多的问题。
a)不同监控系统之间,存在监测点的重复和被监控设备通信接口利用的冲突,不仅浪费投资,也会对各监控系统的顺利实施产生阻碍。如动环监控和空调群控,都需要对空调运行和机房环境进行监控;动环监控和能耗监控,都需要利用配电设备的通信接口获取监控信息。部分子系统分建,会造成子系统监控资源浪费,以及对被监控设备通信接口占用的冲突。
b)监控子系统单独建设,无法数据共享,无法实现重要事件的联动。如关键设备告警、机房水浸、火灾等重要告警信息,无法与视频系统联动,无法及时记录告警现场影像,不利于告警事件追溯,也不利于高效处理现场故障;高低压配电和电力变换设备告警,如果分属不同的监控系统,无法快速评估高低压故障、维修对后续相关电力变换和配电网络的影响,也无法在电力变换设备发生停电故障时,及时准确地追根溯源。
c)不同监控子系统单独建设,采用各系统专用的监控采集设备、交换和传输设备,由于只是对应单一的监控子系统,监控采集设备、交换和传输设备配置的接口往往存在盈余,在传输线缆大量采用光纤的情况下,各系统分建传输,传输带宽也会大量浪费。多监控系统分别安装设备、布放传输线缆,耗费大量的工程费用。
当前,建设统一的基础设施监控平台,需要采用C接口从各监控子系统获取监控信息,由于子系统涉及行业和厂家众多,C 接口没有统一的规范要求,部分工程实施时,少数子系统监控厂家甚至不提供C 接口协议,极大地阻碍了基础设施监控系统的建设进度。通过C 接口接入,在基础设施监控平台发生监控信息缺失、错误告警和遗漏告警时,也会增加查找原因的难度。
目前,各家公司基础设施监控平台的数据库存储结构和系统软件功能也不统一,业内也没有相关的标准可循。
a)监控系统关注点从点到面、从关注单个孤立设备安全运行到整个基础设施系统的安全、高效运行,从单个孤立系统到多系统融合、海量数据共享、大数据分析和AI智能输出,这一切都依赖于翔实、准确、开放的监控数据,而各监控厂家私有化的数据库无疑成为实现这一目标的壁垒。缺少海量数据共享,监控系统的智能化分析将无从谈起。
b)除了监控数据实时监控、准确告警、数据存贮等功能,监控系统的软件功能可以分为2类。
一类是根据监控系统运营方制度和运维人员要求,定制开发的运维管理和运营流程,是监控系统的重要组成部分。
另一类则是根据基础设施的组成、系统结构和运行数据,进行理论分析、数学建模,最终实现AI智能输出,尤其是对供配电、热管理以及空间等基础设施的重点环节进行优化管理,实现系统高效运行,准确预警,提高基础设施运行的安全性。在今后较长的时期,这类功能必定是基础设施监控系统开发的重点和难点。由于当前对于监控系统软件功能缺少完善的评估机制,目前部分监控厂家往往以此为噱头,进行夸大宣传和概念展示,而工程实现则是偷换概念或浅尝辄止,扰乱了监控市场的健康发展。
ICT 基础设施监控系统的标准化建设包括数据采集、通信接口、传输、标准化数据库和系统功能第三方评估等方面。
ICT 机房基础设施包括各类变配电设备、电力变换设备、空调设备、机房环境、门禁和视频监控等,从原理上看,除了视频监控采用专有的图像编解码技术,其他监控系统的底端采集设备接口都是由各类通信口、模拟输入AI、数字输入DI和数字输出DO等组成,这些接口具有国际标准,技术上是统一的,不同的监控采集设备在物理接口方面可以完全一致。在工程实施中,不同的监控系统应采用标准化的、通用的监控采集设备,完成所有基础设施监控对象的接入,实现采集设备的统一。
在统一监控采集设备基础上,应标准化监控采集设备的B 接口类型和B 接口协议。目前,部分通信运营商制定了B 接口通信协议,约束监控设备厂家的采集设备,使不同厂家的监控采集设备可以混合组网,互相替换,同时实现监控采集设备和监控中心平台软件的解耦。
目前,中国联通已经颁布实施了动环监控B 接口企业标准,并在部分省公司得到实际应用,实现了不同厂家监控采集设备混合组网、接入第三方监控中心平台软件。中国联通B 接口协议内容涵盖了当前ICT 机房应用的主流动力设备、机房环境及其监测点,并制定了灵活扩充被监控设备和监测点的规则,用于可能出现的新型设备和新增监测点,可以满足ICT 机房基础设施监控系统被监控设备和监测点的标准化需求。
图1所示为基础设施监控系统标准化建设网络结构,其中,消防系统属于国家强制要求必须单独组网;空调BA 系统短时间内仍处于少数几家国外公司垄断局面,也采用单独组网。其他所有的监控系统,都采用共用监控采集设备和传输进行整合,将极大降低工程投资。同时,消防和空调BA 仍采用先建设子系统、再接入基础设施监控平台的模式。在ICT 机房基础设施监控平台,根据需求定制开发不同的软件功能模块,实现对机房基础设施的综合管理。
图1 基础设施监控系统标准化建设结构
当前各监控系统的数据库结构为厂家私有,若私有数据库接口不开放,不可能实现前期已经获取监控数据的共享。因此,在保留原有厂家私有数据库前提下,制定标准的中间数据库,监控系统在正常运行时,将运行数据同时写入标准化的中间数据库,方便第三方调取使用;同时,该数据库也可以作为监控厂商私有数据库的备份。
与ICT 行业大量使用的单元式空调、电力变换等设备不同,各类监控系统没有入网检测,缺少专业的检测标准和检测机构对监控系统进行测试评估,在工程招标时只能依靠投标厂家的技术应答、厂家规模、以往业绩和报价等因素,选择中标方,缺少可量化的技术指标约束,最终往往是低价中标,最终导致整个行业处于低研发投入、低水平竞争、劣币驱逐良币的局面。
因此,制定系统软件性能测试要求,细化测试项目、测试指标、测试方法和测试分级,开展可量化的第三方测试,公开评测监控厂商软件平台性能,从系统稳定性、数据分析准确性、系统响应实时性以及智能化程度等方面,进行科学地评判,改变当前仅靠厂家宣传和技术应答书进行技术评价的现状。
ICT 机房基础设施监控系统应遵循标准化建设先行、智能化分析为发展重点的原则,制定相应的监控系统建设规范,实现监控采集设备、接口协议以及中间数据库的通用性,搭建起完善的数据采集平台,为智能化分析提供翔实、可靠的数据源。
a)不同系统共用底端采集设备和传输,执行开放的北向接口,可极大降低建设投资,实现监控中心平台软件和底端采集硬件的解耦。
b)建设统一的监控中心软件平台,制定标准的中间数据库,按需求定制不同的软件功能模块,实现数据共享、多系统融合和监控系统的快速联动。
c)在监控数据全面、准确的基础上,进行深度数据挖掘、分析,以供配电、热管理和空间管理等方面为重点,完善基础设施数学建模,输出智能化决策,真正实现ICT机房基础设施安全可靠、智能高效的运行。