网络故障等级范例6篇

前言:中文期刊网精心挑选了网络故障等级范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

网络故障等级范文1

【关键词】 无线局域网 网络故障 解决方法

前言:计算机网络的发展已经逐渐的在人们的生活和工作中占据重要位置,那么在网路出现故障后,将直接影响到人们的工作和生活,所以做好局域网故障性质分析和网络故障排查也就十分重要。

一、局域网概述

无线局域网(Wireless LAN, WLAN)是不使用任何导线或传输电缆连接的局域网,而使用无线电波作为数据传送的媒介,传送距离一般只有几十米。无线局域网的主干网路通常使用有线电缆(Cable ),无线局域网用户通过一个或多个无线接取器(Wireless Access Points,WAP)接入无线局域网。

有线局域网(Wired LAN)的计算机局域网是把分布在数公里范围内的不同物理位置的计算机设备连在一起,在网络软件的支持下可以相互通讯和资源共享的网络系统。通常计算机组网的传输媒介主要依赖铜缆或光缆。

二、局域网主要出现的故障

2.1硬件故障

1)局域网络线路连接故障。线路是保证不同计算机进行数据传输的“生命线”,是核心组成部分,这也使其出现故障的频率比较高。线路的故障根据其内容更可以分为线路损坏与电磁干扰两种类型,前者是最为常见的问题之一。2)网络连接端口故障与问题。该问题也是局域网络中较为常见的问题之一,一般硬件设备上都配置有专门的指示灯作为问题识别最为直接的方法与手段,如果指示灯显示不正常,则说明端口有问题,应该根据不同的指示内容进行问题排查,并有针对性的进行解决。3)外接网络信息传输设备是网路系统的重要组成部分,因设备质量问题导致网络使用问题,但相比较而言,问题出现的概率较低,一旦出现问题,则会导致整个局域网路瘫痪无法使用。

2.2软件故障

1)浏览器。当IE浏览器本身出现故障时,自然会影响到浏览了;或者IE被恶意修改破坏也会导致无法浏览网页。这时可以尝试用"上网助手、IE修复专家"来修复,或者重新装IE。2)杀毒软件。如果网络防火墙设置不当,如安全等级过高、不小心把IE放进了阻止访问列表、错误的防火墙策略等,可尝试检查策略、降低防火墙安全等级或直接关掉。3)感染病毒。这种情况往往表现在打开IE时,在IE界面的左下框里提示:正在打开网页,但长时间没响应。可在任务管理器里查看进程,看看CPU的占用率如何,如果是100%,可以判断是感染了病毒。很多的病毒,杀毒软件无能为力时,唯一的方法就是手动删除。4)网络TCP/IP协议配置的问题。局域网上可以Ping通IP地址,但Ping不通域名:TCP/IP协议中的"DNS设置"不正确,请检查其中的配置。TCP/IP协议的配置主要包括:IP地址、网关、子网掩码的配置。

三、局域网故障排除工具

3.1硬件工具

检查网卡指示灯,如不亮,说明网卡损坏,要更换W卡,安装驱动,设置网络参数后,可解决问题。如果安装配置后,系统检测时报错或检查不到网卡的配置信息,说明网卡没有正确安装,可更换插槽重新配置。

3.2软件工具

排查网络故障的过程中,有时会难以确定故障的根源。如果利用一些软件,可以降低诊断的难度,这些软件直接附带在Window程序中,在“开始一运行”输入Cmd命令调出Dos窗口,可以方便使用。1、Ping程序。Ping是网络中最常用的小工具,它主要用来确定网络的连通性问题。Ping本地地址或者127.0.0.1可以确认本机是否正确安装了网卡,是否正确安装了TCP/IP协议,是否正确配置了IP地址和子网掩码。2、Ipconfig程序。IPconfig可以显示出本地计算机的IP配置信息和网卡的Mac地址。此方法对于用户进行计算机网络的全而检查是很有用的。3、Tracert程序。Traced通过向口标发送不同IP的存活时间值的ICMP数据包来判断口标使用的路由,也就是说当用户连接到一个网站上时,可以查看出从用户的计算机经过了哪些中转服务器才能最终到达口标训一算机。4、Netstat程序 。Nelslal可以显示有关统训一信息和当前TCP/IP网络连接的情况,能够得到非常详尽的统计结果。运行Nelslal程序之后,可以了解到当前训一算机的IP地址、训一算机名称、连接使用的协议与端口等信息,而且在使用附加参数之后还可以获得更多的有用信息。

四、总结

通过对这此网络异常情况的排查和解决,应当认识到,网络维护和故障排查工作并不容易,不仅需要在问题出现时冷静应对、细心分析,还需要在处理问题时周密考虑、通观全局,更重要的是在平时做好安全防范工作,将风险和安全隐患降到最低。当然,还必须通过实践和学习,积累丰富经验,提高应对能力。

网络故障等级范文2

关键词:电力通信网 故障评估 K-均值聚类 粗糙集 径向基神经网络

1 概述

电力通信网是现代电网不可分割的组成部分,是电网安全、稳定、经济、优质运行的三大支柱之一[1],提高电力通信网的通信质量、增加电力通信网的可靠性是国家电网公司对电力通信网提出的一贯要求,这是贯穿整个电力通信网生命周期的持续过程[2]。可靠性问题起源于故障,通信网可靠性测度的演变与故障的研究是分不开的。在通信网中,故障测度的范畴可以分为设备故障与网络故障两个层面,网络故障是设备故障的深层次反映。随着电力通信网的不断发展,设备的不断更新,有必要对现代电力通信网的设备故障情况进行进一步研究。

聚类分析试图将一组未标记样本按照一定的相似度准则分到几个类中去,使得在同一个类中的样本有着较大的相似度,不同类间的样本的相似度较小[3]。K-均值聚类算法是MacQueen在1967年首次提出的一种经典聚类算法,具有能对大型数据集进行高效分类的优点。粗糙集理论(Rough Set)是波兰数学家Z.Pawlak教授于1982年提出的一种数据分析理论[4]。粗糙集方法能有效处理不确定、不精确、需要主观判断的问题,并能保证在不降低评价效果和质量的前提下对指标体系进行约简,去除冗余和相关的指标[5]。径向基神经网络(Radial Based Function Neural Network,RBFNN)是20世纪90年代提出的一种具有全局收敛特性的线性学习算法的前馈网络,因其学习速度快的优点,广泛应用于数据的分类和时间序列的预测等方面。本文基于以上方法,对电力通信网设备故障评估进行研究。

2 方法原理

首先建立一套电力通信网设备故障评估指标体系,使用K-均值聚类方法对设备故障情况进行分类,然后用数据样本对径向基神经网络进行训练,训练网络前利用粗糙集方法降低输入维数,提高网络训练速度,然后从训练后的神经网络中提取指标重要度作为指标权重,从而求得综合指数来判断聚类的故障等级,使径向基神经网络具备故障评估能力。原理框图如图1所示。

2.1 指标体系

目前,电力通信网设备主要包括光纤通信设备、光缆线路、交换机设备、调度总机设备、无线设备、电力线载波设备、微波通信设备以及图传终端设备等,据此可以得到电力系统通信设备故障的7个一级指标,然后根据故障的三因素描述方法,可将每种设备故障情况用故障强度、持续时间和故障程度三个指标来描述,即每个一级指标具有3个二级指标。其中,故障强度是指故障对每一使用单位的作用力的大小,如故障概率和故障阈值的差值,持续时间是故障所持续存在的时间长度,故障程度是指故障所扩散的度量,如故障范围。从而可以得到具有21个二级指标的一个电力系统通信设备故障评估指标体系,如表1所示。

2.2 K-均值聚类

本文利用K-均值聚类方法将某省各局电力通信网设备故障情况分为三个等级类。首先,从观测数据集中任意选择3个观测值作为初始聚类中心,其余观测值则根据与这3个聚类中心的距离和最近距离原则,逐个分别聚类到这3个聚类中心所代表的聚类中。然后在完成第一轮聚类之后,各聚类中心发生了变化,继而更新3个聚类的聚类中心,也就是分别根据各聚类中的观测值计算相应聚类的均值。根据所获得的3个新聚类中心,以及各对象与这3个聚类中心的距离,根据最近距离原则对所有观测值进行重新归类。重复上述过程就可获得最终的聚类结果。

2.3 粗糙集

本文利用粗糙集方法对指标集进行有效约简。首先,将指标集作为条件属性,聚类结果作为决策属性,构造决策信息表。然后利用粗糙集方法对决策信息表中的数据进行分析,然后根据得到的指标质量值,删减掉指标质量较小的指标,保留质量较大的指标,最终得到一个有效约简后的电力通信网设备故障评估指标集。

2.4 径向基神经网络

径向基神经网络第一层为输入层,由信号源节点组成,第二层为隐含层,用径向基函数作为隐单元的“基”构成隐含层空间,其单元数视作所面对问题的需要而定,第三层为输出层,它对输入模式的作用做出响应。

将使用粗糙集方法约简后的指标集所对应的数据样本作为径向基神经网络的输入,K-均值聚类结果作为网络输出,以此来训练神经网络,使其具备故障分类能力,然后从训练好的神经网络中提取指标的重要性,以此作为指标权重,根据数据样本和指标权重,计算各局电力通信网设备故障情况综合指数,从而便可以判断出各聚类所对应的故障等级。

3 实例

3.1 信息表

通过调研得到某省各局电力系统通信设备故障报告,经过数据的整理,得到数据样本。

由于该省各局电力通信网设备中电力线载波设备与图传终端设备并未发生过故障,所以本例中指标T16~T21对各局故障的情况综合评估没有价值,所以剔除掉指标T16~T21。最终的信息表如表2所示。

3.2 K-均值聚类分析

将指标T1~T15作为聚类变量,根据表2中的统计数据对各局故障情况进行聚类。设置聚类数K=3,使用运行均值,迭代29次后,聚类中心收敛。初始中心间的最小距离为2.396。最终聚类中心间的距离为1.402。聚类结果如表3所示。

可见A、B、C、E、F、I、J、K局的通信设备故障情况相同,为3类,而D、H、L局的通信设备故障情况相同,为1类,G局通信设备故障情况与其他局均不同,为2类。

网络故障等级范文3

1 做好计算机机房的软件维护工作

1.1 采用硬盘还原卡和影子系统 目前比较多的机房采用了硬盘还原卡,可避免用户把“垃圾”文件装入系统,它能够保护系统资源和硬盘文件不被更改,沈阳工学院采用的是南京小哨兵还原卡,使用前将保护卡插入计算机主机板相应的PCI插槽上,开机后进行简单的设置后就可以了。该卡缺点是:占用硬盘空间,系统开机启动慢。其中还有一部分计算机采用软件(影子系统)来实现还原的目的。优点是:能保护计算机的系统分区,能设置密码,以防止学生任意修改保护卡的设置,不遭人为的破坏,并短时间迅速恢复系统。

1.2软件备份和恢复 进行系统备份和系统恢复,目前比较常见的软件是GHOST软件。这个软件的优点是可以实现网络克隆(网络克隆是一种短时间内在大批量电脑上安装系统操作的一种先进的方法),系统恢复速度快,操作也较为简单。使用时,可以在计算机上先安装好教学软件、硬件驱动程序、以及系统等等,然后用GHOST软件进行备份和还原。

2 做好计算机机房的硬件维护工作

2.1 网络故障 主要包括:网线的接头松动,插紧即可;

IP地址冲突,更改IP地址。最容易出现的网络故障是网络不通问题。

2.2 主机故障 这类故障主要包括主板故障、电源故

障、CPU风扇故障、内存、显卡故障。主板故障一般就是电解电容被烧凸起了,换电解电容就可以;CPU风扇故障一般是风扇停转或转速过低,可将风扇清理,在风扇轴上加油,其表现为机器自动重启、死机、速度变慢等,如果不行,只能更换新的CPU风扇;电源故障一般表现为开机无反应,电源风扇不转,我们可以检查保险丝是否完好,否则只能送检或更换,在这之前,先用万能表检查有无电压输出;内存、显卡故障,显卡故障一般表现为开机无显示或显示乱码等。内存故障一般表现为开机无显示并发出“嘀嘀”声或机器自检长时间停止。检查方法是把内存或显卡拔下,用橡皮擦拭针脚部位,重新安装,如果不行,可更换插槽尝试,再不行,与正常机器的内存显卡互换以确定是否有问题,有问题只能送修或更换。

网络故障等级范文4

向多元化结构发展,新媒体技术及报业信息化技术也发生日新月异的变化,集团信息化网络的规模越来越大,报业出版及发行等业务系统越来越多。这直接推动Web服务器、应用服务器、数据库以及服务器虚拟化的应用快速发展,IT部门的重要性也不断提升的同时, IT运维面临的挑战也更加复杂化。如,原有的机房已经不能满足现有信息化设备的发展;日益增多的信息化终端设备和放开的USB设备权限导致病毒攻击、流量异常的情况增多;众多的业务系统和需要开启的远程监控窗口,易出现抢桌面和重复开启服务的状况;IP地址冲突以及IP地址不够用等现象。

如何能将现有的IT管理小软件进行资源整合,实现统一平台的集中管理,做到跨域扫描IT运维管理体系,并通过制定相应的流程规范来合理、高效的调配资源,使IT运维管理架构与集团业务系统的管理架构相统一,并将网络拥塞状况直观展现,为管理者和运维工作人员决策提供参考。这将是IT运维监控系统建设项目的总体目标。

总体设计思路

为更合理地配置网络资源、更好地管理网络IP资源,及时统计用户访问量、网络带宽分析、机房环境预知和巡检等,针对集团的实际情况,我们研发了IT运维综合管理平台(IT Operation Management platform,ITOM),为技术管理者提供了多管理领域的全方位解决方案。IT运维综合管理平台的设计主要分三个:

1.信息采集层。包含故障性能信息采集和故障信息采集。性能信息采集是对运行在服务器的中间件、数据库以及应用程序的监控。通过在被管理设备上安装监控程序的方式,然后将来自ICT内各部分的信息标准化为通用格式,实时保存为逻辑分析提供信息基础。包括发现网络拓扑,通过网络运行状况监控,判断网络的运行质量、运行效率、网络流量以及连通率信息等。

在信息采集层采集到的故障信息通常是逻辑故障信息。采集是通过接收IT基础设施发送的标准日志,同时辅以主动对设备轮询,将所收集的故障时间发送给探针,提交给事件管理器进行信息汇总。而其他类网络故障判断需要通过在信息处理层完成。初始故障等级判别是根据信息汇聚层收集上来的事件,级别定义。

2.信息处理层。按照事先设定的业务模型规则,将信息采集层收集的海量数据进行数据分析、数据关联、数据处理,使得看似无序和不同类的事件,通过事先定义的业务模型规则,对信息采集层所采集到的信息进行根源分析和对比,达到故障定位的目的。

网络故障判断在信息处理层须根据默认的规则定义,通过告警系统中的Automation 自动引擎,对故障事件进行分析和计算,经过数据关联和处理后,得出的网络故障判断,生成故障结果表单。例如端口流量、错报和丢包发生率、广播包与非广播包的多少来对设备阀值设定,超过预设参数进入故障结果表单。

3.信息应用层。数据应用层对日常运维的性能参数通过图表的方式反映出来,包括流量报告、故障分析报告、网络监控平台、统计分析报告等。

ITOM基于WEB方式的管理界面,允许维护人员通过浏览器方式查看业务运行状态和告警信息,支持界面的个性化定制。监控平台可实时监控包括网络状态、设备状态、业务主机状态、链路状态、性能管理、流量管理等信息。

支持多种应用接口,包括WebService接口、API接口、文件接口、码流接口等,集成多种第三方管理应用的综合数据接入,在同一平台上予以展现,是全域IT运维管理的决策支持系统。

十大功能描述

1.T运维管理平台采用 ITIL的标准。

ITIL(IT Infrastructure Librry 信息技术基础架构库)是英国各个行业在IT管理方面的最佳实践归纳起来变成规范,它结合流程、人员和技术三要素,为企业的IT部门提供一套从计划、研发、实施到运行维护的最佳实践方案,可以引导组织高效和有效地使用技术,让既有的信息化资源发挥更大的效能。

ITIL实际上是建立在业务和技术之间的桥梁,框架图如图1所示:

ITIL含服务支持和服务提供两部分,对应的10个管理流程是IT运维管理的核心过程,如图2所示:

围绕十个管理流程,并通过服务级别协议(SLA)来保证IT服务的质量,IT运维管理平台的结构图如图3所示。

2.分级用户管理,不同用户拥有不同子域、子系统的使用权限。

不同用户的分级管理通过统一入口授权完成,管理者、IT运维人员登录系统后分别可以查看对应角色的子系统信息,如网络管理员可以看到对应的机房监控数据和网络拥塞信息,资产管理人员可以对资产信息扫描和登记,实现真正意义上的分级管理。

3.网络状况可以做到实时监控,核心设备做负载均衡。

网络部分设备采用双核心双链路热备连接,这种接法的网络经系统智能分析后生成的网络拓扑图与真实物理拓扑结构略有出入,经人为修正后形成集团的网络拓扑图,真实反映整个网络的运行状态,直观反映设备的分布情况、负载状况和设备属性,以及线路的实时流量,同时通过负载均衡动态平衡;流量异常或者超负荷时会有颜色显示,告警网管关注点,动态预警可能存在的故障隐患。

网络平台管理对核心及汇聚等重要设备的UP/DOWN、CPU负载、线路负载等重要指标做告警设置,对核心业务服务器的操作系统参数(系统范围的CPU 使用情况、磁盘和I/O 使用情况、文件系统资源、日志文件等)实施告警监控,协助IT运维人员诊断和排除相关问题。同时可以提供灵活的警报条件定义,生成基于Web的报表,为工作人员进行应用系统的性能分析及系统优化提供依据。

通过ITOM读取在AIMS Server上集中创建生产主机环境的基线数据库,实时监控核心业务服务器的系统环境和应用环境,减少长期运营维护费用、降低危害攻击的可能性,保证了生产环境的稳定和核心业务数据的安全。

网络故障等级范文5

【关键词】图形化;信息网络;网络管理;运行维护

0.引言

在当今时代,信息网络系统已成为社会组成必不可少的一部分,而信息网络系统在各个企业中已成为企业办公、生产、运行管理等方面的重要支撑平台,随着社会发展和企业信息化规模扩大,网络的规模也随之越来越大,网络的结构日趋复杂,局域网的运行维护任务也日益显得复杂繁重,因此如何能够简单有效地管理和维护内部网络已成为当前网络管理研究的一个重要方面,迫切需要一种网络管理方式可以简化运维流程、减少运维步骤、快速查找故障、明确运维目标和提高运维效率。目前商用网络管理软件种类繁多,例如国内的北塔、网强等网络管理系统。这些商用软件网络管理功能较为全面,但是针对信息网络运行维护来说,还存在一些不足之处。

本文介绍了一种针对信息网络运维而设计的网络监控系统,该系统强调以图形化的方式显示当前网络各节点状态。以直观的方式反映网络故障或潜在的故障,具备节点控制、监测日志、统计以及多种智能报警功能,力求减轻网络运维人员的工作量,提高工作效率。

1.概述

在大中型企业内部的整个网络上面运行着各种服务器以及众多的个人台式机,点多面广,管理维护难度和工作量都相对较大。仅靠单纯的人工管理,被动式的检查维护已无法满足整个系统良好运转的需要,面对并处理网络中众多设备发出的事件报告和短时间内检测发现故障点等问题,所有的这些要求很清楚地摆在网络管理人员的面前,因此迫切需要对网络进行主动的监视,自动进行网络故障的检测与解决,以维护网络的良好运转,从而更好地服务于整个公司的业务系统。

图形化监控系统可以更加直接地反映信息网络系统状态和故障,使运维人员明确网络系统运行状态,快速查找故障节点并进行处理。首先,收集网络环境内所有网络节点的信息资料和办公环境图纸,确定网络节点物理位置,建设信息网络节点图形化管理系统,根据收集的信息建立图形界面和联动资料库,包括用户物理位置、用户信息、设备信息、网络连接状态信息等;然后把信息网络节点图形化界面与现有的网络管理系统进行接口配置,在图形界面上产生网络节点的实时状态信息,同时可进行接口状态操作,并进行网络节点状态联动报警系统,当故障发生时,对预先指定的报警情况进行报警,报警方式可通过邮件和短信,使维护人员在第一时间得知并判别故障类型和严重程度,并通过图形界面精确判断故障地点,缩短网络故障发现和处理时间。

2.图形化网络监控管理系统技术结构、技术优越性

2.1图形化网络监控管理系统技术结构

图形化网络监控管理系统由图形部分、网络管理功能部分、网络健康度评估部分和运维流程部分组成。各部分的作用为:

2.1.1图形部分

图形部分是整个监控管理系统的衔接部分。其作用首先是系统本身各类功能的操作界面和针对网络系统各环节物理位置的直观展示,比如机房内设备位置图、建筑结构图和办公室网络布点图等,以及网络系统整体和部分的拓扑结构图,用三维图形和二维图形结合进行展示;其次是对整个监控管理系统的各功能部分进行衔接,像前面提到的网络管理功能部分、网络健康评估部分和运维流程部分要通过图形部分进行衔接,使各部分功能得到体现,监控人员通过其进行监控和管理。图形部分的完整度和详细度直接影响到整个监控管理系统的运行效果。

2.1.2网络管理功能部分

网络管理功能部分是整个监控管理系统的核心组成,按照分层架构设计思想进行建设,实现网管数据采集与处理的分离,数据处理与呈现的分离,共分为 3 个层次:数据采集层、数据处理层和功能显示层,具有较强的灵活性和可扩展性。

数据采集层:数据采集层是位于数据处理层与管理对象之间的数据采集子系统,与 IP 网的网元设备和相关的业务系统交互,遵循标准的通信协议,完成系统所需的各类原始管理数据的采集,包括主机、网络、数据库、中间件、应用软件、环境等数据源的原始信息,如配置数据、性能数据、故障数据和准确性数据等。

数据处理层:将数据采集层所获得各种数据进行清洗、整理和标准化处理,提供各应用功能进行处理分析、统计及存储,如通过触发事件发生器,将收集的各类原始信息与KPI阈值对比后进行分析、配置或处理,形成资源分类的告警信息等。

功能显示层:针对分类管理信息进行统一汇总和多维展现,实现网络、系统硬件设备资源和软件运行状况的统一监控和管理,保障业务系统的正常运行。

另外按功能模块划分可分为六大模块,包括数据采集组件、综合网管服务、WEBService 应用组件、IE显示层组件、数据流分析探针、外部数据库,各模块组件之间通过TCP/IP进行通信,支持灵活的集中或多服务器的部署策略,提高系统的可扩展性。下面是其中几种模块的功能简介:

数据采集组件:接收各网管功能模块的数据采集请求,定时其管理范围内的被管对象中收集IT基础设施信息,同时维护、提供性能数据缓存,存储获得的IT基础设施的性能信息,从而达到:统一的数据获取接口、多管理协议支持、可扩展的IT组件支持、数据有效性控制和智能化网络访问控制。

综合网管服务:综合网管服务(NMS)作为数据处理层,建立了网络管理模型和资源数据访问模型的标准化,NMS数据处理层中采用了O/R Mapping、IOC、Remoting等技术完成系统的架构和实现。NMS将实体对象的数据如网络配置数据、资源数据存储在关系型数据库中,通过O/R Mapping 实现将关系模型映射到面向对象的数据模型,提供完整的面向对象的数据管理、访问模型和接口,完成了网络管理数据的对象化,包括:网络配置数据、 设备网元数据、性能数据(历史数据、实时数据)、告警规则配置数据、告警信息数据、服务资源数据和用户权限配置数据。

WebService应用服务:与图形化部分紧密结合,监控系统的应用管理、呈现层采用WEB架构实现,通过WEB2.0、AJAX、WEBSERVICE、JSCRIPT等技术,实现完整的B/S模式的应用管理、数据呈现等核心功能。通过管理控制台集成了网络拓扑管理、网络监控、故障管理、报表管理、服务资源管理、资产管理和系统管理等。方便用户统一执行管理任务。门户功能模块可归纳为三种类型:门户基本框架和管理功能:提供门户通用服务和基本功能。包含用户管理,门户系统权限管理等。对其它系统的集成功能:主要提供对于系统监控管理,流程管理,分析报表集成。管理门户将作为这些系统的统一访问入口,并为用户提供单一登录功能。开发定制的特定服务模块:开发用户要求的日志和审计功能模块,用户访问统计模块。

数据流分析探针:监控系统的性能数据采集能够支持秒级单位的采样周期。能够提供原始采样频率的数据。监控系统经过一段时间的记录,能够通过对性能数据的对比,生成相应的阀值告警事件。监控系统通过Web访问的方式为用户展示物理拓扑结构,并通过物理拓扑结构为用户提供全网的性能和状态信息,并通过颜色表现表示出来,帮助用户及时发现网络潜在的故障隐患点,从而为用户提供管理数据的分析、诊断机制和运维管理流程。

2.1.3网络健康度评估部分

评价指标主要包括可用带宽、单双向时延、单双向时延抖动和单双向丢包。可用带宽直接影响网络业务的质量、网络对即将开展业务的支撑能力以及网络的扩容规划和设计。单向时延、单向时延抖动和单向丢包之所以不可缺少是由于业务服务器和客户终端内容交互的非对称造成的。评估方式由系统采用基于端到端的网络性能质量测试方法,指标是端到端之间的指标而不是单个设备、某一段甚至某一跳之间链路的指标。端到端的含义包括业务的起始点和业务的终止点整条路径,是业务传输的全部环节,端到端的单向时延是从一个测量点(一个具体的IP地址)到另外一个测量点的数据报文传递所用的时间,这个时间是转发时延、排队时延和传输时延的总和,通过一系列测试后可以得出现有网络健康度情况。

2.1.4运维流程部分

网络运维流程从功能上可以划分为六个模块,各模块功能如下:

任务工单管理。该模块实现临时性任务管理功能,如派发给县公司的任务工单、接收来自公司的任务工单、部门内部用于任务分配的个人任务以及部门之间用于项目管理的部门任务等。

业务流程管理。该模块实现对例行性网络运维业务流程的管理功能,如资源调度流程、故障处理流程、网络优化流程和业务开发流程,这些流程一般可分解为定义良好的任务、角色、规则和过程,通过与人和各种应用系统的交互来进行工作流程的执行和监控,达到提高网络运维效率和网络管理水平的目的。

统一工作任务列表。该模块为用户提供统一工作任务列表,包括当前任务、新建任务、已派发任务、已处理任务、阅知任务和待发任务。通过统一工作任务列表可以接收处理来自各方面的任务工单及来自工作流系统的业务流程。

工作任务统计分析。该模块实现对个人工作和组织工作的统计分析功能,包括派发任务数量、接收任务数量、不同难度任务所占比例、任务完成及时率、任务完成质量及绩效指标完成情况等。

接口适配。该模块提供与网管部分、图形部分以及资源管理平台的接口适配功能,通过系统之间的数据交换和应用集成达到部分业务流程自动化的目标。

工作流管理系统。工作流管理系统是用于定义、实现和管理工作流运行的一套软件系统,通过与人和各种应用系统的交互来进行业务流程的执行和监控。工作流管理系统是网络运维流程支撑平台的核心,包括图形化建模工具、工作流引擎、管理监控工具和工作任务列表四个主要功能模块。

2.2技术优越性

2.2.1网络故障查找直观明了,图形化网络监控管理系统的特点是实体图形的大量使用,把网络连接、设备位置、机房或房间布局、故障点描述等通过具体的图形表现出来,再与网络管理系统各个监测功能模块集成,就可以直观明了的对各类故障情况进行图形化描述,信息网络运维人员可通过该系统了解故障的等级、类别、具置,并以此得出相应的处理办法,直接节约了普通故障查找的人力和时间,提高了工作效率。

2.2.2网管系统功能全面,由六大模块组成,包括数据采集组件、综合网管服务、WEBService 应用组件、IE显示层组件、数据流分析探针、外部数据库,涵盖层次化管理、拓扑管理、网络监控管理、IP地址管理、主机服务器管理、数据流分析、故障报警管理和报表管理多项功能,还可通过相关功能模块对整体或部分网络系统健康度进行评估,以此为依据指定相应的网络整改方案。

2.2.3信息网络运维流程明确,可通过网络运维部分人为或自动进行运维工单下达,实现完备的流程化操作,包括任务工单管理、业务流程管理、统一工作任务列表、工作任务统计分析和工作流管理,从接受运维任务、任务分析、制定运维方式、资源调拨、人员派遣、运维操作、完成任务和对应不同变数选择相应调配方式完成运维流程。

3.图形化网络监控管理系统的应用

3.1系统中图形部分的应用

该部分应用包括系统本身操作界面图形和具体信息网络拓扑信息及实际物理环境图形的规划编制。首先是操作界面图形的规划编制,涵盖层次化管理、拓扑管理、网络监控管理、IP地址管理、主机服务器管理、数据流分析、故障报警管理、报表管理和系统管理,以及各大类下面具体分类的操作界面图形,如下图所示:

其次是具体信息网络拓扑信息及实际物理环境图形的规划编制,要收集公司范围内所有网络节点的信息资料和办公环境图纸,确定网络节点物理位置,具体到网络设备、网络线缆、网络通道、安全设备、服务器的布点状态,以及信息机房和办公室的布局图纸,如下图所示:

然后用具体的网络设备图形反应实际网络连接情况,如下图:

最后可根据图形的详细显示得出网络故障节点位置和严重程度等信息,极大的便利了网络运维工作。

3.2系统中网络管理功能部分的应用

网络管理功能部分是整个监控管理系统的核心组成,通过snmp协议读取和写入交换机、路由器、服务器等信息设备策略和数据信息,主要通过人工录入和自动搜索相结合的手段进行设备发现和链路获取,整合分析数据实现层次化管理、拓扑管理、网络监控管理、IP地址管理、主机服务器管理、数据流分析、故障报警管理和报表管理多项功能,再通过设定网络管理系统本身的报警策略定制报警数值和临界点等信息,以图形颜色标示、声音、短信或邮件等方式对系统管理员进行告警。

网络管理功能部分是整个系统的核心,图形部分的功能显示、网络整体健康度评价和运行维护人员流程管控,都要通过功能部分进行实现和链接。

4.结论

图形化网络监控管理系统在信息网络运维中的应用,将解决网络运维侧重于对网络设备本身或网络的维护与管理的问题,解决各类网管系统之间信息无法互通、管理内容庞杂、操作界面多样等问题带来的局限性,大大降低了信息网络系统的运行风险,提高运维工作效率,实现对全网的综合管理,包括全网故障分析、故障定位、全网性能综合分析等功能,能够从总体上提高企业的全网综合管理水平和运维工作效果。

【参考文献】

[1]张玮,唐学文,马颖.图形化校园网络监控系统的设计与实现.计算机与现代化[J],2007,5:72.

网络故障等级范文6

关键词:电力信息;网络双通道;故障自动探测

光传输链路是电力企业具有的丰富资源,并广泛应用了光传输以太链。信息网络的主通道承载在光传输以太链路上,并和ATM广域网相联;备通道主要是光纤直线的通道,并和数据通信网相联。

1.信息网络存在的问题

主备优先级的控制通过广域网和信息网络之间的两台边界路由器(H3C.SR2.H3C.HR1),经过开放式最短路径优先协议设置cost值。对于信息网络而言,其不能有效保证Ethernet接口的故障检测,特别是以以太链经过传送一些设备时,网络设备的状态不能被链路状态反映出来。同时,静态路由具有高效、稳定和安全的特点,能在接入路由之核心路由的级联很好的适用,其缺陷是反映网络动态变化的能力较差。缺省路由是SR1存在的问题,当中断上级的远端链路时,由于光传输设备的问题,导致SR1的G1/0/0端口始终UP,造成一直生效SRI这条缺省路由,继而不能正常倒换到备用通道,出现路由黑洞的情况。

2.常见故障自动探测策略

2.1BFD技术

双向转发检测是一种独立于上层应用程序的通用协议,和通道类型无关,通过对简单hello机制的应用,便能进行故障的快速检测,并可以实现毫秒级。同时,双向转发监测是基于上层协议形成的BFD对话,其机制不实现自己的发现。通过接收双向转发检测的发送和接收,对双方的状态进行判断,并对发生的故障进行判断,其机理相似于光传输中的“LOS”信号。双向转发检测的特点主要有几点,第一是单跳检测的有效时限,并能进行多跳检测;第二是能够按照实际需求设置检测周期;第三是和多种上层协议进行联合使用。联合使用快速重路由和双向转发检测。在网络结构比较复杂,或者比较大规模的网络时,一旦有故障发生,路由会在收敛和计算方面耗费很长时间。网络中指定的备份路由是FRR,其能在发生故障时实现快速的切换。而将双向转发检测和FRR进行联合使用,不仅能够让网络故障的响应时间大大提升,还能有效降低故障时间。联合使用内部网关协议和双向转发检测。通常情况下,ISIS需要一秒钟时间来检测故障,OSPE需要两秒的时间来进行故障检测。而将OSPF、ISIS与BFD快速故障检测进行联动,能够有效实现毫秒级的故障检测时间。将双向转发检测部署到网络边缘。主干网络和接入网络的互联,其一般需要两台路由器设备或两台出换机,要保证双出口网络的稳定性,则需要通过VRRP来实现。如果双出口链路状态通过BFD来进行探测,其将避免VRRP自身感知链路故障的这个阶段,不仅节省了相应的时间,还能将故障倒换通过双向转发检测联动VRRP而快速实现。一旦双向转发检测出现故障,其会显示几种情况,第一是拆除邻居会话;第二是监测会话中的链路故障或设备;第三是将邻居不可达的信息通知到本地上层协议;第四是中止上层协议邻居关系,待到条件具备时启动备用路径。

2.2NQA技术

H3C等系列设备适合使用网络质量分析,其能实现多方面性能的监测,第一是网络时延;第二是网络抖动;第三是网络丢包率等。通过周期发送测试报文,能够保证服务质量,及网络状态的有效测量,将真实的网络质量系列参数提供给用户。同时,网络质量分析能够和TRACK实现有效的联动,向TRACK反馈自身监测到的信息,促使应用程序和TRACK产生联动,以快速的反应网络状态变化。不仅如此,网络质量分析能够实现对多种网络测试类型的支持,包括并发的多测试组,如TCP和ICMP-echo等。目前,网络质量分析已经和多种应用程序实现了联动,其中包括静态路由和VRRP等。

2.3IPSLA技术

通常情况下,Cisco设备会应用到互联网服务等级协议,常在Cisco企业版IOS里面使用,其和NQA的用法有相似度。同时,其属于一种主动网络测量手段,能实现动态监测,并能采取定期测试的方法。另外,互联网网络等级协议能和Cisco.Track实现联动。IP.SLA探测的结果通过TRACK影响到浮动静态路由、PBR和热备份路由协议等,以快速实现故障的切换。

2.4TRACK技术

该技术的作用主要是联动功能的实现。监测模块和应用模块的应用桥梁需要通过TRACK联动功能来实现。如在NQA、TRACK和静态路由之间进行联动建立。如果静态路由被NQA监测到不可达下一跳地址时,TRACK会被立即触发,并将静态路由条目设为无效。这种联动方式的实现,能够保证实时判断静态路由有效性,避免静态路由无动态反应能力存在的缺陷。

3.故障检测和保护的应用办法

基于电力网络信息中存在的问题,想要准确进行其双通道故障的探测,则需要将Track+NQA+静态路由的方式采用到SR1上,当中断主通道侧光传输以太链路时,即使UP存在于G1/0/0,但经过分析,IP:10.B.B.B并不可达。此时失效SR1缺省路由,实现备通道的倒换。虽然在主通道产生故障时,发送的数据会立即倒换至备用通道,但通过对下发缺省路由的合理采用,其能够在整个OSPF域中实现缺省路由通告。所以,在最初进行电力信息网络的设计时,一定要结合当时的运行情况,对链路条件进行全面考察和科学分析,如当大量光传输设备存在于网络链路时,不能过于依赖辅助的探测方法,而需要先对动态路由协议组网进行考虑和采用,才能进一步提升其运行可靠性。基于这个问题,能够通过OSPF协议的改变,并和BFD实现联动,才能将问题妥善的解决。

4.结束语

总而言之,电力信息网络的安全运行想要得到有效保证,需要建立在信息网络双出口故障自动倒换的基础上。但在网络组网的进行过程中,网络工程师更加信赖自己的以往经验和方法,没有对故障倒换进行全面的测试。所以,根据我国电力事业的发展需求,在初步进行网络设计时,一定要对设备条件和链路进行全面的考察,严格检测各个环节,以及及时改正不足之处,并根据实际情况来完善网络设计,才能提高电力信息网络双通道出现故障时的准确性,最终提升其自动化探测水平。

参考文献