网络管理中的性能管理

网络管理中的性能管理

摘要:随着电信网络变得越来越复杂,电信运营商面临着巨大的运营问题。电信管理网络(TMN)是由国际电信联盟——电信标准化部门(ITU-T)开发的用于管理电信网络和业务的框架。性能管理(PM)是ITU-T确定的五大核心管理功能之一。网络管理系统(NMS)属于TMN的网络管理层。本文简要分析了PM原理和PM操作流程。提出了网络管理系统中PM系统的体系结构,并分析了实现PM系统所面临的挑战和克服这些挑战的方法。

关键词:电信管理网络(TMN);网元管理系统(EMS);网络管理系统(NMS);绩效管理(PM);关键绩效指标(KPI)

0引言

TMN是由国际电信联盟电信标准化部门(ITU-T)开发的用于管理电信网络和服务的框架[1]。基于TMN参考模型,管理系统可以分为以下几个层次来执行特定的功能,并具有特定的范围:图1显示了TMN参考模型的五个不同层。业务管理层(BML)负责实施组织内的策略;服务管理层(SML)负责包括服务投诉处理、订单处理和发票在内的客户合同方面的服务,这些服务可以提供给客户或可供潜在的新客户使用;网络管理层(NML)负责协调网络的活动,管理网络端到端连接所需的网络元素之间的关系;元素管理层(EML)负责与位于小范围内的单个或少量网络元件相关的功能;网络元素层(NEL)代表电信设备(或电信设备的组/部分)。ITU-T将管理分为五大管理功能领域,即:故障、配置、计费、性能和安全(FCAPS)[2]。在TMN中引入的FCAPS管理概念的子集将在每个TMN层执行[3]。故障管理是指检测、隔离、修复和记录在网络内发生的错误。配置管理是维护关于网络配置(硬件和软件)的准确信息以及控制与其正常操作相关的参数。计费管理涉及用户管理,以及资源和服务使用次序。性能管理尝试最大限度地提高网络性能。它与QoS、资源利用率、延迟、抖动和丢包等参数密切相关。安全管理涉及网络安全。

1性能管理的基本概念

性能管理(PM)通过收集统计信息,维护和检查历史日志,确定系统性能,改变系统运行模式来评估和报告网元的行为和有效性。理想的性能管理系统的主要功能是优化网络和应用的使用,以提供一致和可预测的服务水平[4]。PM包括网络和应用程序流量的测量,以便在给定实例和定义的时间段内提供一致的和可预测的服务级别。以提高性能和流量管理为目标,PM涉及对网络、应用程序、服务活动以及设计和配置调整的监视。网络性能可能由于外部或内部问题而恶化,这可能会影响服务性能,可靠性、可用性以及最终的客户体验。性能管理使您能够提前发现恶化的趋势,并主动解决潜在威胁,从而防止错误发生。

2性能管理系统的架构

PM系统的体系结构如图2所示,它具有以下几个层次:数据收集和解析层、数据存储和管理层、应用程序层、表示层(用户界面)。

2.1数据收集和解析层

性能管理的基础是使用网络特定的协议从网元收集数据。该协议可以是如图2中介所示的标准管理协议,如SNMP、FTP,也可以是各公司的专有协议。使用标准协议的优势是灵活,使得为协议实现的数据收集可以重新用于从支持相同协议的另一个网络元素(NetworkElement,以下简称NE)收集数据。从NE到EMS,测量工作的结果可以通过三种不同的方式转发:(1)在NE中执行的测量任务产生的结果被发送到EMS。(2)EMS可以随时检索存储在NE中的报告。使用诸如FTP之类的批量传输机制(即基于文件)。(3)除了生成定期的计划结果报告之外,还可以根据运营商定义的阈值发送测量结果。在实例化测量时设置阈值,并且在超过阈值时生成性能报警。对于收集到的数据应将其存储在输入文件中,并将这些文件重命名为统一的文件名,识别并丢弃损坏的文件。最后将正确的文件发送到解析器。处理后的文件可以按照将来数据重新加载的需要进行存储。

2.2数据存储和管理层

在这一层中,使用基于标准DBMS的数据仓库,该数据仓库针对VLDB分布式数据存储进行了优化。验证和加载组件用于将解析的数据加载到数据存储并验证数据间隔和数据重新加载,数据仓库中的存储应该随网络规模的扩展而增加。数据存储和管理应该灵活的适应网络未来的发展及变化,并且使用支持数据访问和修改的嵌入式编程语言。

2.3应用层

收集和存储数据的实际操作在这一层进行。该层应提供对数据库的多线程访问,以便进行数据聚合、事件生成、关联和分析,报告生成的并行处理。该层还负责存储和共享生成的KPI和报告,它应包括检查阈值操作(即警报、通知等)的模块,并执行自动健康检查报告。

2.4表示层

这一层负责提供一个基于网络的用户界面。它包含一个安全层,以确保生成的PM结果以仪表板或是实时图表的形式展现给用户。除此之外,还应提供将结果导出为.csv,.xml,.pdf文件格式的选项。此层可以提供两个用户界面:所有系统组件的管理UI和所有PM结果查看的用户界面。数据抽象层隐藏了应用层聚合、报告、调度、健康检查机制的复杂性,并将PM系统的结果以简化的方式呈现给系统用户。

3性能管理面临的挑战

第一个巨大的挑战是如何高效的管理,即收集、存储、处理和汇总一段时间内的大量性能测量数据。第二大挑战是处理没有统一结构或内容的性能测量标准。由于各种NE类型的性能测量不同,因为制造商在其设备中使用不同的专有协议和数据结构来衡量性能。

3.1处理海量网络性能数据

多个轮询器、线程和探针可用于网络数据收集。使用循环数据库结构的灵活的聚合规则可以用于记录的聚合,记录的定期输出可以在平面文件中完成。逗号分隔值文件(CSV文件)在预定义的保留期限到期之后,记录的永久删除可以在用户预定义的保留期限后自动从数据库中完成。轮询器可用于主动轮询或收集计划基础的性能数据,直接从设备获取KPI。一个性能监控应用程序可以被线程化,不同的进程可以被拆分,以允许多个CPU在一个进程上工作。在收集性能测量时,线程是非常有用的,可以使用多个线程同时执行数据收集工作,因此可以快速完成。探测器是收集有关网络活动的数据的程序,在大型分布式网络体系结构中,探针给出了必要的机制来积累构建网络历史和趋势所必需的数据。任何数据库中可以保存的数据量,特别是大型网络的数据量是有限的。因此,在用户预定的时间限制(例如1周)之后,需要汇总原始数据。

3.2不同性能测量标准的处理

这可以通过在数据收集和解析层中设置一个转换模块来完成。收集器将收集的数据提供给转换器,转换器转而转换成PM系统所属的NMS所了解的标准格式。因此,在将数据保存到数据库之前,将其转换为具有适当结构的标准格式。

4结论

本文介绍了PM原理,提出了网络管理系统中PM系统的结构,分析了PM系统实施过程中面临的挑战,并提出了克服这些挑战的方法。

作者:李维峰 单位:中国飞行试验研究院