网络监控经济实用型创建思路

网络监控经济实用型创建思路

本文作者:谢海华 单位:江苏省广播电视信息网络股份有限公司盐城分公司

广电行业最重要的职能之一是安全播出。随着光纤向用户端不断延伸、数字电视业务的日益普及和三网融合类业务的不断涌现,广电机房的数量和机房内设备的数量越来越多。除了传统的模拟电视播出设备和新增的数字电视播出设备外,还大量增加了波分传输设备、网络交换设备、业务支撑设备等与计算机或网络相关的业务系统。这些系统已成为广电业务系统的重要组成部分,与之相配套的机房动力环境设备(如供配电、UPS、空调、消防、保安等)的重要性也更加日益突出。它们需要为广播电视、数据网络系统提供正常的运行环境,一旦机房动力环境设备出现故障,就会影响整个广电网络的系统运行,对节目播出、数据传输、存储及系统运行的可靠性构成威胁。若事故严重又不能及时处理,就可能损坏硬件设备,造成停播、劣播等严重后果,造成不可估量的经济损失或政治影响。目前许多机房的管理人员不得不采取24小时专人值班,定时巡查机房环境设备的措施,这样不仅加重了管理人员的负担,而且更多的时候,安全隐患并不能得到及时的发现和排除。因此建设具有广电特色而又经济、实用的机房动力环境监控系统,对广电机房的各种环境设备实现全方位的统一集中监控管理,实时监控、监测各种环境设备的运行状态和指标,并通过美观友好的监控画面显示出来,在发现异常时立即通过网络、现场声光报警以及手机短信或语音电话系统等实现自动远程报警,以确保系统的可靠运行。这将大大减轻机房维护人员负担、提高系统运行的可靠性、实现机房的科学管理。

1.机房动力环境监控系统原理

机房动力环境监控系统,是随着信息化、数字化浪潮一同发展起来的新兴产业,也是信息时代的必然产物。通信技术和网络技术的飞速发展对运行广电网络核心设备的机房提出了更高的维护和管理需求,这就必然需要智能化管理手段和措施的引入;其次信息技术的发展也同时带动了相关的传感技术、自动化控制技术以及嵌入式技术的兴起与成熟,这也为智能化控制理论在机房管理领域中的应用提供了强有力的技术支撑。动力环境监控系统在广电机房中应用的核心目标是通过各类传感技术、自动化控制技术、信息技术等组成的监控体系将机房内运行的各类设备以及设备运行的环境有机的结合在一个统一的管理平台上,对可能影响设备稳定运行的各项参数指标进行实时监测和控制,并进行记录和分析,辅助机房管理人员对机房进行整体管控,从而达到提高设备使用效率、减轻人员管理强度、优化保护建设投资的目的。

2.机房动力环境监控系统的主要功能

机房动力环境监控通过对机房内可监控设备和机房环境实现机房运行全程、全时的监控,其主要实现的功能是对机房运行的各项关键参数进行采集和监测,例如环境温湿度、供电电压及电流、空调运行状态、配电开关及浪涌保护器工作状态等等,并将异常情况以声光告警、短信报警、语音及邮件通知等各种方式提示机房管理人员,机房管理人通过以上信息对可能出现的异常状况进行判断,并凭借管理经验通过监控系统进行手动控制和参数调整,使机房始终处于安全、可控之下,保证各业务系统的可靠运行。一个完善的机房动力环境监控系统应具备以下功能:①高、低压配置系统:监视各主要开关状态及实时监视电压、电流、频率、有功功率、功率因素等参数,发现异常及时告警,以确保供电安全。②UPS系统:对UPS各模块的工作状态及各种参数如UPS的输入/输出电压、电流、频率、功率因素、逆变器状态、电池状态、旁路状态、报警状态等进行实时监测并及时告警。③空调系统:监控空调压缩机状态、风机状态、加热器状态、加湿器状态、报警状态等,发现异常及时告警。同时对空调进行智能控制,可以根据现场温度情况自动联动控制空调的开启、关闭,在机房核心设备正常运行的温差范围内做到尽可能节电。④温湿度监测:精确测量机房的温湿度参数并与指定阈值进行比对,超过范围自动报警,并可与空调系统自动联动控制。⑤漏水监测:对机房漏水情况实现进行监测并及时告警。⑥门禁系统:通过门禁系统控制并记录各机房的人员进出情况,并存档以备调用备查。⑦视频监控:24小时视频实时监控各机房关键部位,监控机房内工作人员的相关操作、设备的运行情况及机房人员的出入情况,从而有效地保障机房内设备的安全运行。⑧其他系统:根据机房实际情况的不同,机房动力环境系统还可以加入保安、消防、发电机、服务器、交换机、网络等相关业务系统的监测功能,并在发现异常时及时告警。

3.盐城广电数字机房动力环境监控系统的实现

(1)建设原则及工程目标。为适应科学管理的要求,提高机房管理的效率,保证安全播出与安全运营的要求,盐城广电数字机房本着“集中管理、分散控制、经济适用”的建设原则,根据实际运行的需求,开展了具有广电特色的机房动力环境监控系统的建设。一期工程的范围包括中心机房及市区的4个无人值守分机房,各分机房现场的监控数据传送到本地监控主机,各本地监控主机再通过城域网将数据传输到中心机房的监控管理中心,由监控中心管理服务器来集中管理监控数据,以实现对全部现场数据安全、实时、完整存储和控制的要求。监控中心与各机房的监控单元以TCP/IP协议方式进行数据传输,数据传输的通道采用干线MSTP以太通道。监控中心管理软件可以实时显示各机房各监控单元传回的监控对象的监测值。可以直观的浏览机房的基本情况及监控对象的当前监控量。监控中心可以随时发送对指定监控站监控对象的遥控和遥调指令,完成对监控对象的遥控和遥调。可以按指定条件查询指定监控对象的历史监测数据,并可以图形方式显示指定监控对象的指定时间段的变化量曲线图。

(2)监控对象及实现方式。根据信息采集的方式,盐城广电数字机房内的被监控对象分为了智能设备与非智能设备两大类。智能设备本身即具有数据采集和处理能力,并带有智能接口,可以与动力环境监控系统通过协商一致的接口通讯协议进行交互通信,实现对这些智能设备的监控,这类设备包括APC、UPS、中恒直流电源系统、海洛斯精密空调等。非智能设备本身则不具备数据采集、处理能力,需要增加传感器、变送器和采集器来完成数据的采集与上报。如果从功能上来分,被监控对象可分为动力和环境两大类。动力类包括高压配电、低压配电、UPS、中恒直流电源系统、电池组等。环境类则包括空调、门禁、温度、湿度、漏水等。#p#分页标题#e#

①供配电监测。对于现代机房环境来说,最重要部分就是电源,电是广电机房运转的基础,也是动力环境监控系统的重点。在实际工程中,我们采用智能电量仪对供配电状态进行处理,变换为电平信号,再输入到智能采集模块转换为数据信息,送往现场监控主机,以实现对供配电的监控。监控范围包括监视各回路的开关状态、电压、电流、功率、频率等。通过对供配电系统的监控,可诊断出主、辅两路供电系统三相电源的断相、跳闸、接触不良、保险熔断、欠压、过压及三相电压不平衡等故障,实时检测在用交流三相电源的输出电流和零序电流,并对安装设备的机柜电源空开的开关状态进行实时检测,一旦发现上述故障或严重过流、空开开关关闭等异常,将马上上报到监控中心通知值班人员,以便值班人员第一时间进行处理。运行监控示意图如下:

②温湿度监测。在广电数字机房中,设备对温、湿度等运行环境的要求非常严格,所以我们根据各机房实际面积,按照合理的配备原则,在不同部位加装了温湿度传感器,以实时检测机房内的温、湿度,智能温湿度传感器通过智能通讯接口,把检测到的温湿度值实时传送到监控主机中统一监控。对需要重点保障的骨干传输设备、数字电视设备局部则再增布设监控点,一旦温湿度超过预设之阈值范围,传感器将马上上报到监控中心通知值班人员,以便值班人员第一时间进行处理。

③漏水检测。机房是一个用电集中的地方,设备众多,强电、弱电、地线、电缆纵横交错,且部分机房为无人值守,如果不慎发生漏水而不能及时发现并处理,后果将不堪设想。根据现场的实际情况,机房内空调的冷凝水管是布置在机房的静电地板下面,因此我们围绕机房的冷凝水管及机房对外窗口、门口等可能遭水入侵的位置,布置漏水感应绳,监控机房内有无漏水事件发生,确保各设备不受水浸的危害。一旦发生漏水事件,漏水感应绳通过控制器将信号送往监控主机,系统在第一时间报警,监控界面自动切换到漏水监测画面上,发出语音报警及时通知有关人员排除漏水故障。漏水点在界面上准确的显示,便于机房管理人员及时排除故障。

④精密空调监测。通过机房内布设的精密空调自带的智能通讯接口及通讯协议,系统可实时、全面诊断空调运行状况,监控空调各部件运行状态与参数,并可通过软件在系统上或通过网络远程修改空调设置参数,实现空调的远程开关机。系统一旦监测到有报警或参数越限,将自动切换到相关的运行画面,并伴随有报警声音及相关处理提示。空调机组即使有微小的故障,也可以通过系统检测出来,以采取步骤防止空调机组进一步损坏,对严重的故障,可按用户要求加设电话语音报警。对重要参数,可作曲线记录,用户可通过曲线记录直观地看到空调机组的运行品质。

⑤UPS及中恒直流电源系统的监测。通过2台UPS主机、2台中恒直流电源系统提供的智能通讯接口及通讯协议,可实时地监视UPS及中恒直流电源系统整流器、逆变器、电池、旁路、负载等各部分的运行状态与参数。系统可全面诊断UPS及中恒直流电源系统运行状况,实时监视UPS及中恒直流电源系统的各种参数。

⑥视频监控及报警。为达到对机房的整体监控管理,我们通过机房内安装多台摄像机的方式实现图像视频实时监控机房,摄像机监控的区域是机房内的设备摆放区及机房出入口,通过这些区域的摄像机监控机房内工作人员的相关操作、设备的运行情况及机房人员的出入情况,从而有效地保障机房内设备的安全运行。值班管理人员可以通过动力环境监控系统的显示器实时监视各摄像机的监控画面,需要进行相关图像资料查询时,可以通过查询功能实现。

⑦门禁控制。机房各出入口的严格有效控制是保障机房设备、数据信息安全,防止破坏、泄露的重点。我们在各机房的出入口及机房设备入口设置门禁控制点,对进出机房的人员实行身份登记,符合相应条件的人员可以进出机房,同时系统加以存储记录,备事后查询。门禁控制方式采用常用的IC卡识别或卡加密码双重识别方式,最大限度保证了机房内设备、数据信息的安全性。由于机房的出入口属于对重点控制区域,故门禁控制系统全部采用双向控制的方式,即进出机房都需要验证登记。

⑧传输设备监控及报警。在数字机房内,还有部分用于省———市、市———县节目、数据交换用的波分设备、MSTP设备等,它们虽然都有自己的网管系统,但由于网管系统或位于省中心或位于其他机房,加上值班人员的技术水平并不能保证熟练和正确地使用复杂的网管系统,因此借鉴对供配电中开关量监控的方法,通过对这些设备机柜上方外置运行状态灯是否开关的监控,可以实现对这些设备(如华为OSN6800/3500/2500等)的监控,一旦这些设备在运行出现严重的异常告警,其相应的告警灯将被设备本身点亮,这时负责监控这些告警灯状态的动力监控设备也将被触发,并向中心监控管理系统报告、通过中心监控管理系统以声、光、电或其他形式通知值班人员,以便值班人员第一时间进行处理。

4.系统特点

建成并投入使用后的盐城广电数字机房动力环境监控系统,在近一年的运行过程,充分发挥了机房动力、环境“第一哨”的作用,多次在第一时间监测到分机房市电停电、UPS负载过高、局部漏水等有可能影响到机房安全播出、安全运行的隐患,以及由于光缆中断、业务端异常等引起的传输网严重故障告警,并在第一时间以声音、告警灯、屏显、短信等形式通知值班人员及维护人员、提醒他们及时处理,很好地保证播出的安全、网络运行的安全,充分满足我们对机房环境监控管理需求。同时建成后的盐城广电数字机房动力环境监控系统还有如下特点:

①“集中管理、分散控制”。“集中管理、分散控制”的实现方式不但满足了对分散机房的集中统一管理的需要,更满足了对现场数据安全、实时、完整的存储和控制的要求。系统设计有三级结构,监控中心中心能查看、监控、切换全部各机房的实时监测数据,每个独立机房可形成一套完整的监控系统本地站,由监控管理中心对各监控本地站实施二次集中监控管理,实现管理者对所有机房及机房内设备环境系统的远程集中联网监控管理。

②事件并发处理,实时响应速度快。整个系统采用事件驱动型的IP网络收发方式,由现场监控前端主动发送,异常时发送UDP包报告数据,中心处理接收到的数据包,反应快,监控点增加后变化不明显。这彻底克服了传统串行通信、轮讯方式下只能在轮训到的时候才能告警及点越多、反应越慢、容易产生报警延时及漏报的现象。#p#分页标题#e#

③使用标准的、开放的协议便于集成以及系统扩容。盐城广电数字机房的动力环境监控系统的组网结构完全基于TCP/IP网络通信协议,搭建了基于IP的监控平台,数据采集也使用标准的MODBUS协议,使得增添监控节点或是增加监控信息非常方便,可实现即插即用的系统集成以及系统扩容,并可根据自身的需求和投资预算进行项目的投资,一次投资,终身受益。

④模块化设计,稳定可靠。系统监控主机与采集模块之间采用国际上先进的FCS现场总线控制技术,所有监控、监测均以模块化方式放在工业现场,而且所有的信号通过分布式智能I/O模块在现场被转换成标准数字信号,只需一根电缆(两线或四线)就可把所有的现场子站连接起来,进而把现场信号非常简捷地传送到控制室监控设备上,降低了成本,又便于安装和维护,同时数字化的数据传输使系统具有很高的传输速率和很强的抗干扰能力,使数据采集与信号传输更精确更迅速。

⑤可灵活设置报警的条件、具有三级告警机制。该系统可按报警类别的不同对每种监控量进行设置,也可根据需要对相关告警量的门限值设置进行调整,使报警的管理更有效、灵活。同时考虑到监测点数量多、监控设备和监测量的种类多,系统设置了三级告警机制,可根据告警情况的严重性设置其级别,便于管理人员在同时出现不同设备不同级别的报警时可以有重点、有先后的进行处理,首先处理最严重的告警。例如,UPS报警类型级别一定是级别最高的三级报警设置,因为机房对供电要求最高。

⑥用户界面直观,软件组态灵活。系统提供多达数百种组态工具,用户可自行定义实时数据的显示格式,所有图形都进行了矢量处理,可任意对画面放大缩小,对不同分辨率的显示器自动适应。同时系统内置二次开发平台,可以通过内置的集成开发环境进行二次开发,所有的二次开发模块与系统平台可实现真正的无缝集成。

目前建成的盐城广电数字机房动力环境监控系统,其功能及监控的范围还仅限于保障机房正常运转而必须的电源、温湿度、空调、漏水等方面,下一步我们计划将其监测功能进一步向以下方面延伸,实现能管尽管,最终向综合网络管理系统过渡并完全整合到综合网管系统中去:

①网络设备的监控。通过TCP/IP网络及相应的管理接口,实现对交换机、路由器、服务器各种软、硬件运行状态的监控(例如:CPU使用率、内存、磁盘空间、程序是否运行、TCP/IP服务、数据库会话、数据库查询、Windows服务是否运行等)。

②网络连通性监控。通过TCP/IP网络及Ping(PacketInternetGrope,因特网包探索器)等实用网络工具,测试并监控网络之间的连通性。

③节目播出监控。与现有的安全播出监控系统对接,接收并处理由其传送过来的节目播出监控信息,在发现异常时及时告警。

④值班管理与报表系统。通过与门禁、关键巡查点处安装的指纹记录仪、人工输入接口等互联,记录值班人员到岗、巡查、本班次各业务系统运行情况、动力环境变化情况、需要记录或交接的其他事宜等,并按班次形成报表,打印生成后形成存档的值班记录,让动力环境监控系统也成为一套完整的机房值班管理系统。