大数据平台下接触网健康管理探究

大数据平台下接触网健康管理探究

摘要:随着数据体量的增加和计算机技术不断发展,研究基于大数据技术的接触网健康管理成为保证铁路安全运行的一个重要突破口。本文介绍了一种基于大数据技术的接触网健康管理方法,结合大数据的基本概念以及接触网大数据的基本特点,阐述了健康管理的主要内容,从数据获取层、数据处理层、AI健康管理体系和可视化表达层出发,介绍了基于大数据平台的接触网健康管理的架构设计流程,并对其中关键技术进行了论述,为提高接触网的安全稳定性提供了一种新方法。

关键词:接触网;健康管理;大数据;机器学习

0引言

随着我国轨道交通事业的快速发展,对于铁路的安全稳定运行提出了更高要求。接触网作为牵引供电系统的重要组成部分,为列车提供牵引动力,其稳定的服役状态是铁路安全可靠运营的关键,如何提高运行效率,降低故障发生率、运维成本和工作量,对于铁路的安全稳定运行具有重要意义[1,2]。目前我国铁路采取“计划预防修为主,事后维修为补充”的检修策略,实际应用中存在维修过度或维修不足等问题[3]。2017年,原中国铁路总公司颁发了《铁路大数据应用实施方案》[4],该方案给予了基于大数据技术的设备状态评估指导意见。接触网是牵引供电系统的重要设备之一,基于其数据的特点,运用大数据及人工智能等技术,可实现其故障诊断、预测、健康状态评估与剩余寿命预测,并提供合理的维修和优化策略以延长接触网的使用寿命,提高使用效率,同时降低运维成本。目前,PHM(故障预测健康管理)技术在航空、智能电网及含有复杂设备的制造业领域应用广泛[5~7],对于接触网的健康管理也有少量研究[8],但基于大数据技术的接触网健康管理的研究和应用较为缺乏。本文介绍了一种基于大数据技术的接触网健康管理平台设计,结合大数据的基本概念以及轨道交通大数据的基本特点,阐述接触网健康管理的主要内容,从数据获取层、数据处理层、AI健康管理体系和表达层出发介绍基于大数据平台的接触网健康管理架构设计流程,并对其实现的关键技术进行论述。

1大数据技术

1.1大数据基本概念。关于大数据的基本概念,英文中至少有3种名称:大数据(BigData)、大尺度数据(BigScaleData)和大规模数据(MassiveData),目前尚未形成统一的定义。维基百科认为,大数据或称巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到无法通过人工在合理时间内达到截取、管理、处理,并整理成为人类所能解读的信息。IDC年度数字宇宙研究报告《从混沌中提取价值》中指出,大数据技术描述了一种新一代技术和构架,采用非常经济的方式,以高速捕获、发现和分析技术,从各种超大规模的数据中提取价值。麦肯锡全球研究院(McKinseyGlobalInstitute,MGI)在《大数据:下一个创新、竞争和生产力的前沿》报告中的描述:大数据是指无法在一定时间内使用传统数据库软件工具对其内容进行抓取、管理和处理的数据集合。美国国家标准与技术研究院(NationalInstituteofStandardsandTechnology,NIST)定义的大数据是,数据大、获取速度快或形态多样的数据,难以采用传统关系型数据分析方法进行有效分析,或者需要大规模的水平扩展才能进行高效处理。随着科技的发展,全球数据呈爆炸式增长,大数据中隐藏着数据潜在的价值信息,可通过大数据挖掘技术对其提取,其中,大数据技术的重点主要是对系统的海量数据进行快速处理、存储和挖掘,最终获得有价值的应用信息。

1.2接触网大数据的基本概念。相对于大数据的技术定义,接触网大数据则是一个更为广义的概念,并没有一个严格的标准限定多大规模的数据集合才能构成接触网大数据集合。接触网数据是大数据理念、技术和方法在弓网系统的实践,接触网大数据涉及接触线状态、接触网支持装置技术参数、列车运行方式、外部环境等各因素,涉及跨单位、跨专业的数据分析与挖掘。接触网大数据不仅在于包含多大规模的数据,还在于包含哪些方面的数据,是“涵盖接触网系统全寿命周期各个环节所产生的数据,包括可在线监测的运行数据、人工记录数据、设计数据、设备出厂数据、操作记录等列车运行相关的常规数据,也包括各种动态检测监测数据及数据分析。”接触网数据具有如下特点:(1)数据动态性强;(2)由于数据来源较广,其异构性更为广泛;(3)数据具有一定规律性;(4)鉴于其行业的特殊性,对其保密性要求较高;(5)由于其分布广泛,数据具有明显的时空特性。接触网大数据建模是利用接触网系统全寿命周期产生的各种类型数据,采用大数据技术建立数学模型的过程。开展接触网大数据建模方法的研究是接触网大数据研究与发展的重点之一。2PHM技术故障预测健康管理(PrognosticsandHealthManagement,PHM)是通过安装多种传感器和其他监测设备来获取设备的状态参数,借助先进算法模型,达到对系统状态维护及管理的目的[9~11]。PHM技术一般应具有故障监测隔离、故障诊断与健康管理等功能。PHM技术将设备当前状态作为起点,根据设备的历史运行数据,结合系统的功能结构、系数参数、工作环境因素对设备的健康状态进行判断和预测,从而制定合理的设备维修与运维计划,其基本体系如图1所示。(1)数据采集。数据采集主要实现设备运行状态参数的采集,以便能够对系统状态进行准确评价,在此之中需要注意3个问题:a.需要保证静态监测点设置的合理性;b.参数传输的准确和快速性,需要借助先进信息传输技术;c.接触网动态检测数据格式的统一性,基础信息定位的准确性。(2)故障诊断。故障诊断作为PHM的一项重要内容,通过设备故障分析,提取故障特征,实现根据状态参数完成故障定位、识别和隔离。该环节需要借助先进的数据挖掘技术,基于获得接触网状态监测信息,通过接触网故障分析确定接触网故障参数的阈值,实现接触网的故障诊断,运用支持向量机、神经网络以及接触网数学故障模型,实现接触网故障类型的识别。(3)故障预测。故障预测作为PHM技术的核心,主要实现设备性能退化状态的评估以及剩余寿命的预测,目前主要包含基于模型、基于数据驱动和基于统计可靠性3类故障预测技术。其中,基于数据驱动的健康管理技术无需构建表征系统退化和剩余寿命的数学物理模型,具有较低难度成本和较好的适应性,受到科研机构和企业的热捧。(4)健康管理。通过构建健康评估模型,实现对设备健康的估计以及健康预警,基于大数据分析技术,提供维修计划的决策和剩余寿命的预测。

3接触网健康管理大数据平台架构设计

3.1总体架构简介。基于Apache基金会所开源的通用大数据平台,介绍基于大数据技术的接触网健康管理平台设计,其基本架构如图2所示。该架构主要由数据源层、数据接入层、数据计算层、数据应用层和可视化层组成,各层的具体内容如下:数据源层:数据源主要包括采用各类传感器监测的接触网状态参数、接触网检测车采集的图像数据、地面监测系统采集的环境因素、厂家给予的铭牌数据等。数据接入层:将检测的能够反映接触网健康状态的参数接入大数据处理平台。数据处理层:该层主要实现接触网大数据的数据融合、存储,目前通常基于MapReduce分布式计算技术作为该层的核心技术,该技术使得ZB级的数据存储和查询成为可能,同时借助Hive搭建数据集市,采用Pig语言进行编写,构建成大数据存储和访问框架。数据应用层:该层主要借助机器学习、关联模型和物理模型的搭建实现不同的应用需求。接触网健康大数据平台主要实现3类应用:(1)故障诊断,基于对于接触网故障特征的分析,确定实现判据,根据检测装置的检测数据及设定的各类参数极限指标的阈值实现故障的诊断和预警;(2)健康状态评估,基于健康评估模块的数据,结合待监测对象的故障诊断历史数据、维修记录以及目前工作状态,对其健康状态进行评估,即确定故障发生的可能性;(3)剩余寿命预测:结合机器学习技术和部件的失效退化模型,基于当前和历史检测数据,对其剩余寿命进行评估。可视化层:通过搭建人机界面展示所有低层功能活动,实现各功能的直观化体验。数据管控层:该流程贯穿整个大数据处理过程,主要负责对数据质量的监控以及数据安全性的保障。

3.2数据基础。基于大数据平台的接触网健康管理根据接触网各监测装置提供的海量多源异构数据,通过对接触网故障分析确定故障特征参数,实现接触网故障诊断和识别、实时状态评估及剩余寿命的预测。针对接触网健康管理的概念,其所需数据主要包括接触网原始台账信息、各设备部件的状态信息、地理信息、工作环境、监测图像信息。根据数据属性划分,可分为动态数据和静态数据两类,根据数据类型划分,可分为台账数据、运行数据、负荷数据和环境数据等四大类,如表1所示。

3.3关键技术。(1)健康状态监测技术。对接触网进行健康状态管理,首要环节是确定接触网的监测参数,根据参数的重要程度选择合理的监测参数,其中,接触网的状态信息是多维度、多层次和动静态结合的,通过健康检查、离线和在线状态监测获取接触网的状态信息,运用无线传输、有线传输、5G等通信手段实现信息高速传输,并通过信号处理、特征处理和多源异构信息融合等方法对接触网的状态信息进行处理。(2)接触网健康管理大数据可用性研究。由于获得数据集包含多种结构的数据类型,数据集庞大且复杂,夹杂着大量的劣质数据和噪声数据,如何保证数据的可用性是基于大数据平台的接触网健康管理的基础。文献[12]指出,可用的大数据集合需要满足一致性、精确性、完整性、时效性和同一性等5个原则。为此,需要对数据的可用性展开研究,研究监测数据的精确性获取、数据的多源异构融合算法、数据的筛选修复方法,以提高数据的可用性。(3)接触网大数据分布式存储研究。为了改善单台服务器进行大数据存储、读取和快速计算时性能的不足,数据存储采用分布式存储的方法,在大数据应用环节,需要满足频繁的操作访问、处理数据类型多、处理数据量大等要求。因此需要将快速查询响应作为目标,构建可扩展和具有并发处理能力的数据分区模型。(4)接触网健康管理大数据分析方法的研究。该平台需要满足故障诊断识别、健康状态评估和剩余寿命预测等功能,需要研究适应MapReduce下的机器学习和数据挖掘算法,实现数据发掘、数据分布式并行计算,获得满足需求的运行结果。(5)接触网健康管理大数据可视化研究。由于接触网健康数据维度大且基数庞大,需要采用可视化技术将数据、模型和对象进行图形化、动画化,将多维属性的数据和输出结果之间的关系进行直观展示,给予用户一种直观体验。

4结论

随着大数据时代的来临,运用大数据技术进行接触网健康管理,对于保障铁路的安全运行具有重要意义。本文结合接触网大数据的特点,运用大数据技术和PHM方法,设计了一种适用于当前接触网健康管理的大数据平台,该平台主要由数据源层、数据接入层、数据处理层、数据应用层和可视化展示层组成,通过在应用层嵌入AI健康管理应用,满足接触网健康管理需求,为接触网健康管理大数据系统的建设提供参考,以期更好地提高接触网的设备利用率,降低运维成本,保障铁路安全运行。

作者:李宏峰 单位:中国铁路沈阳局集团有限公司供电部