广电网络管理系统优化探究

广电网络管理系统优化探究

摘要:HFC综合管理系统软件(HiveNMS蜂巢网络管理系统)是基于江苏省广电有线信息网络股份有限公司浦口分公司需求,量身定制的一款网络管理系统。可承担网络中上万台设备的日常监控和管理,提供专家预警分析功能,迅速定位故障源头,高效解决故障,保障网络建设达到99.99%的可用性。

关键词:FTTx;监控告警;拓扑管理;巡检;手机APP客户端

1网络发展现状

随着IT和IP技术的发展,以及IT、媒体和消费电子行业的融合,广电行业正面临着巨大的变革。近年来,广电网络的HFC双向网络大规模推进,网络设备数量也逐渐增多。随着高清、超高清(4K)、3D等视频业务和视频通信业务迅速开展,用户对带宽的需求迅速增加。按照“宽带中国”战略发展计划,宽带网络全面覆盖城乡,固定宽带家庭普及率达到70%,3G/LTE用户普及率达到85%,行政村通宽带比例超过98%;城市和农村家庭宽带接入能力分别达到50Mbps和12Mbps,发达城市部分家庭用户达到1Gbps。因此,FTTB超宽带同轴解决方案、FTTH解决方案已经成为主流方案。江苏省广电有线信息网络股份有限公司浦口分公司(以下简称“浦口广电网络”)自2005年成立至今,经历近15年的发展,覆盖用户已近50万户。2007年,浦口广电网络开始进行FTTH网络改造,采用1550nm光传输方式进行,经5年时间,逐步实现双向化。目前,浦口广电网络有源机房70个,包括了1个核心机房和12个2级机房,覆盖总用户达到52万。所有HFC设备组网采用1550nm双环路设计,特别前端1550nm外调光传输设备采用1+1备份传输模式。但采用这些方案同时也需要面临一些挑战:一方面,伴随着光节点下移,接入的设备数量逐渐庞大;另一方面,故障出现时,维护人员需要逐级排查,维护难度大且对于维护人员的素质要求较高。目前,浦口广电HFC双向网络大规模推进,FTTH网改不断扩大,相应的也面临着一些困境。一是网络建设迅速,单位设备覆盖用户量高。单位设备覆盖用户数量越高,发生故障时影响面也就越广,浦口广电网络现网有源机房70个,覆盖用户52万,从安全角度来看,需要一些手段来实时监控这些设备。二是现网设备老化逐年增加,网络可靠性降低。从2007年开始使用,浦口现网陆续上架常规光放大器146台,随着设备使用年限的增加,设备发生故障的可能性也越来越高,其中最早使用的设备使用年限已经超过十年。这些故障设备完全靠人工去发现和处理效率太低,并且处理故障的时效性也不高。三是人力资源限制,运维困难。浦口广电网络一线网格人员只有63人,随着业务的发展,网格人员往往是多重业务集身,人力资源有限,无法投入太多的精力在发现故障和排除故障的工作上。同时,中心机房的运维人员也不可能24小时不间断地去现网巡查故障。由此,亟需HFC光传输网络管理系统产品,可以针对广电FTTx网络中的HFC设备进行管理和维护,同时将设备管理信息进行汇总、分析,提供对FTTx网络的管理支持。为了满足安全播出的需要,针对浦口广电网络1550nm光传输网络运行情况,及时提出要发展网络管理,提高网络巡查以及设备巡查响应速度。以技术保发展,用软件促安播。

2网管系统特色解决方案

一是全面、实时地监控网络状态。HiveNMS网管系统可以通过SNMP协议,实时监控设备的输入、输出、电平、激光器电流、温度、电压等参数。设备故障时,页面显示红色告警,并且伴随声音系统智能提示,精确到机房、设备、故障现象,相应的APP上也会有告警推送。二是针对网络结构、告警相关性进行专家分析,通过拓扑图快速定位告警源头位置,给出根源告警和衍生告警。在当前告警列表中,双击某条告警条目,会显示告警详情窗口,包括告警等级变更记录、衍生告警详情、告警影响范围,根源告警和衍生告警都会给出影响范围。三是分片区管理,可以控制各个机房负责人只单独管理自己片区内的设备。可通过电脑客户端、手机APP客户端、短信、邮件等,实时接收负责区域告警信息,高效解决故障。四是运维人员可根据设备老化风险提示进行老化设备的备机准备和替换工作,巡检功能可帮助运维人员快速完成全网巡检工作,能够节省大量的实地巡检时间。五是HiveNMS网管系统可通过提升运维人员的告警处理情况,从而不断提升运维工作效率,提升网络可用性达到99.99%,建立高可靠性的网络。在没有使用HiveNMS蜂巢网络管理系统情况下,常规运维解决故障需要的时间统计如表1所示;而在使用HiveNMS蜂巢网络管理系统情况下,运维解决故障需要的时间统计如表2所示。

3浦口广电网管系统结构

2017年6月15日,浦口广电网络开始开通部署HiveNMS蜂巢网络管理系统,安装蜂巢网管v3.3软件并用于监控、管理、配置机房各品牌1550nm光传输设备,目标是提高运维效率,实现提前预警,及时排故,提高终端用户满意度,使得有线网络全年可用性达到99.99%(年中断时间少于53分钟)。2018年11月28日,浦口广电网络部署的HiveNMS蜂巢网络管理系统实现了广播网设备和数据网设备的综合管理,部署结构如图1所示。同时,该系统支持对网络故障、现网设备资源、网络拓扑结构进行信息录入和统计,便于信息存储和分析,避免职工调岗带来的网络信息遗失,为公司战略决策和安播、运维部门工作品质提升提供数据分析支撑。

4蜂巢网管辅助运维案例

2018年“两会”期间,机房值班人员发现蜂巢网管出现告警,并伴随着告警提示音。在蜂巢网管上查看,发现沿江机房的接收机输出电平偏低,用户端电平余量充足,不影响收看。查看接收机的状态,发现由于输入光低于AGC范围,导致电平降低,因此需要向上级链路排查原因。通过“拓扑图”功能,逐级排查,发现分前端接收的主路光偏低,上一级光放输出正常,为22dBm,传输10km链路光功率损耗了10dBm。通过擦拭尾纤,排除设备原因后,判断该段光缆有损伤。通过OTDR测试,最终确定该段光缆由于道路施工影响,导致光功率降低。随即将信号切换到备路,光缆修复后再恢复到主路工作。2019年元旦期间,浦口广电网络运维负责人员的手机收到蜂巢APP告警信息推送,显示桥林机房有一台机架式光放大器的制冷电流出现极高告警,远远超出正常工作范围。通过与凌云工程师沟通,最终判断该设备已工作8年,泵浦激光器老化严重,导致电流异常,继续使用会影响输出信号,建议更换新设备,以防止发生更严重的故障。工程师通过蜂巢网管的“巡检”功能,发现参数抖动风险和设备老化风险,自动生成了巡检报告。通过蜂巢网管的“资源统计”功能,统计在网设备的工作年限,罗列出工作年限超过8年的光设备,以便于后图1HiveNMS蜂巢网络管理系统部署结构示意图续更换老旧设备,提高系统稳定性。

5总结

HFC综合管理系统(HiveNMS蜂巢网络管理系统)通过个性化的定制界面以及完善的功能,便于运维人员清晰查看自身网络的运行情况,监控网络运行状态。网管系统可以7×24小时实时监控网络中大部分设备的状态,当设备出现异常告警时,手机端可即时收到告警信息,通过网管迅速定位故障源头,及时通知运维人员,通过远程配置和现场处理,大大提高维护效率。随着广电干线网的光节点越来越接近用户,以及新技术、新产品的不断引入,有线电视网能提供的服务越来越多,用户对服务质量的要求也越来越高。通过引进蜂巢网络管理系统,不仅降低了运维的成本和人员压力,而且适应于广电干线网规模的扩大和综合业务的开展。因此,蜂巢网络管理系统对于广电干线网的网络管理具有非常重要的意义。

作者:郭振明 单位:江苏省广电有线信息网络股份有限公司浦口分公司