气象局集约化信息网络资源监控管理

气象局集约化信息网络资源监控管理

摘要:针对广州市气象信息网络和计算机日常管理困难的问题,提出一种基于分布式采集架构和多线程协调工作技术,实现对信息网络资源集约化监控管理,给出了设计的思路,并分析总结其在日常应用中的优势,进而提高广州市气象局综合信息网络管理效率和水平。

关键词:信息网络监控;集约化;分布式

随着气象现代化建设不断向前发展,信息网络及计算机对气象业务的基础支撑作用愈加显著,气象部门的网络拓扑更加复杂,计算资源应用更加频繁,从而导致计算机维护人员的工作压力日益增大,如何高效的管理气象信息网络的资源,是气象部门一直在不断探索的问题。本文提出了一种采用分布式采集架构[1]和多线程协调工作的技术[2],构建集约化信息网络资源监控管理系统,通过调取网络、计算机等多种设备的通用接口协议,获取各网络和服务器等设备的运行参数,从而实现对综合信息网络设备的集中监控,提高信息网络设备的管理能力。

1设计思路

广州市气象局集约化信息网络资源监控管理系统采用先进、灵活的分布式架构:数据库、采集平台和Web服务三个部分。系统整合网络设备、安全设备、服务器、虚拟机集群、存储运维管理等各种软硬件,实现一体化IT网络综合监控管理[3],还能兼容众多系统厂商不同版本的产品。系统利用Portal一体化综合IT管理平台的优势,能将网络设备、服务器及气象业务系统等监测数据集成到该系统中,使系统灵活化、业务相关化、管理智能化。利用IT网络综合管理系统提供的多种标准接口,使集约化信息网络资源监控管理系统能够很方便地与其他的业务系统进行有机的整合,业务信息可以在相关平台中畅通流转,保证系统的可扩展性。系统架构详情如图1所示。

2技术路线

2.1数据采集层

广州市气象局综合信息网络及计算机设备主要包括了当前主流的品牌的交换机、路由器、网络安全防护设备、服务器及存储器等,其中网络设备品牌包括华为、H3C、思科、天融信等、服务器品牌包括浪潮、戴尔等。这些设备和品牌均是当前IT市场上主流的品牌和通用设备。该系统采用分布式采集框架和多线程协调工作技术,支持SNMPv1[4],v2c,v3,Telnet,SSH,API,WMI,IPMI,TRAP,SYSLOG等各种方式采集,实现对广州市气象局网络设备、服务器、业务平台等监控数据的采集;成倍提高系统速度;Syslog日志服务,将采集过程分为通断指标、性能指标、扩展指标、安全指标、内建指标、自定义指标、复合指标等,完成日志的收集采集工作;方便扩展智能化轮询技术,既保证能察觉异常,又能显著减少系统负荷。

2.2数据处理层

数据处理层主要是通过接收或轮询数据[5]采集层生成的指标数据(或原始数据),并对这些指标进行统一的存储、处理与分析,将处理结果直接上传接入展现层,通过拓扑图,告警界面,报表系统等统一展示。数据处理层(业务层)是整个系统的核心。系统建立多个资源、业务、Unit集、单体资源、异常、告警、用户、权限、地域等等概念,并通过这些概念非常有效地实时监测和反映用户的整体IT环境以及管理人员、管理任务、管理目标等等的整体有效联系。通过对象化的IT基础资源、IT服务、SLA、权限和用户、业务和Unit集等等的模型,智能分析反映了从整体到细节,从宏观到微观,从业务到指标,从目标到监测的立体化智能业务体系和专家系统。业务逻辑层采用缓存所有实时数据、实时配置数据的形式来加快对于业务逻辑的处理,对于可能频繁使用到的数据,业务逻辑层实现避免使用频繁的数据库访问代码、文件访问代码;业务逻辑层设计时充分考虑到缓存后带来的数据一致性的问题,对于缓存的数据,业务逻辑层避免外部直接对于数据库的访问,由缓存统一管理。

2.3数据展现层

数据展示层使用Ajax交互式网页应用的网页开发技术[6],Ajax在浏览器与Web服务器之间使用异步数据传输(HTTP请求),这样就可使网页从服务器请求少量的信息,而不是整个页面。利用实时变化数据的页面向用户反馈IT系统的整体和各个细节的情况。被监控对象的网管数据(性能数据、告警数据、部分配置数据)通过三个层面的处理,统一展现给监控和维护人员。

3结语

广州市气象局集约化信息网络资源监控管理系统目前已经建设完成并投入业务化应用,运维人员通过该系统能够非常方便的查阅各种设备的实时运行情况和历史日志,极大提高了对整个信息网络的集约化管理能力。下一阶段还将建立触发告警的机制,通过设置告警阈值,将故障情况通过微信、短信等多种方式主动推送维护人员,进一步提升发现故障能力,提高为信息网络维护的能力。

参考文献

[1]马志强,张泽广,李昊?,等.基于分布式架构的主题信息采集系统[J].计算机工程与设计.2015(4):1094-1097,1121.

[2]张桦,吴奇.Java多线程技术的研究与应用[J].天津理工学院学报,1999(5):85-88.

[3]吴金铭.企业建设IT综合监控平台的方案及运维体系[J].信息与电脑:理论版,2017(2):72-73.

[4]张永彪.SNMP协议下的计算机网络监控管理系统开发研究[J].信息与电脑,2010(1):99-100.

[5]杨指挥,王勇,苏瑞.用于网络管理系统的智能轮循策略[J].计算机工程,2019(9):106-108.

[6]周爱华,周汉涛,王沫.AJAX技术在Web系统中的应用[J].电脑知识与技术,2010(10):8250-8251.

作者:吴贵义 黄华栋 蔡英琪 胡鹏 单位:广州市突发事件预警信息中心