大数据分析的互联工厂系统架构研究

大数据分析的互联工厂系统架构研究

【摘 要】基于大数据分析的工业互联网是实现制造业生产过程分析、预测与优化的基础设施。本文首先综述了工业互联网系统架构,通过分析基于数据挖掘的智能制造用例,提供了通过机器学习优化工业设计制造生产运维的实现路径,讨论了标准化工作需求,为制造业大数据分析系统的构建提供参考。

【关键词】系统架构;标准化;大数据;工业互联网

引言

工业互联网提供了智能制造系统中人、信息、物理系统之间信息共享、交互及协作的基础设施,通过允许数据采集、存储、分发,并通过机器学习算法挖掘工业数据价值,解决在制造企业转型升级发展中所面临的设备运行状态无法有效监控、故障无法预测、产线效率低、资源能源消耗过高、产品质量不稳定等问题,提高企业质量效益[1]。随着数据种类和机器学习应用场景的不断增多,需要对系统架构进行研究,保证工业大数据的实时接入与融合,并且用于基于大数据的分析、支持决策应用。为此,本文旨在综述工业互联网系统架构方面有代表性的最新进展,及其标准化需求,从而为工业互联网系统架构的建立提供借鉴。

1系统架构综述

1.1ISO/IEC/IEEE42010系统与软件工程——架构描述

ISO/IEC/IEEE42010提供了系统结构描述的概念模型,称之为“元模型”。该标准对系统的定义非常宽泛,并未对系统做出明确定义,仅作为占位符。对于任意系统,该标准提供了有关建立、描述该系统的架构的指南。并且认为架构是系统在其环境中的基本概念或属性,体现在其元素、关系以及设计和演化的原理中。具体实现可参考工业互联网体系架构。

1.2智能制造参考架构

国际电工委员会IEC/TC65(工业过程测量、控制和自动化)于2017年3月了可公开提供的技术规范IEC/PAS63088《智能制造——工业4.0参考架构模型(RAMI4.0)》。该文件是智能制造概念提出后公布的首个国际标准化规范,各国智能制造相关参考模型在国际标准化文件中形成了统一的参考模型。RAMI4.0使用三个轴组成的层级模型,展示了资产主要元素的结构。用每个点上的三个轴表示资产全生命周期中相关的各个方面,由此复杂的相互关系可以被分解成更小、更易于管理的部分。三个轴分别是:(1)“层级”轴,共有六层,表示与资产角色相关的信息;(2)“全生命周期和价值流”轴,基于IEC62890,表示资产的全生命周期和增值过程;(3)“层次”轴,基于IEC62264-1和IEC61512-1标准,为特定层次分配功能模型。

1.3ITU-TY2060IoT参考模型

国际电信联盟电信标准化组织(ITU-T)编制了ITU-TY.2060IoT参考模型标准,以识别未来标准化工作为目的对物联网(IoT)进行了概述。标准中,认为当前ICT技术已经能够提供“随时”与“随地”的连接,IoT赋能“所有物体”的连接,并提出了应满足的基础及高级要求。如图2所示,IoT参考模型共有四个层次和两个跨层能力,四个层次由应用层、服务支持和应用支持层、网络层和设备层组成。跨层能力是管理能力和信息安全能力。

1.4NIST架构

图3所示的架构基于以下四个部分:(1)EclipseMosquitto(MQTT),(2)ApacheKafka(包括ApacheKafkaConnect),对于符合MTConnect协议的数据源利用RESTAPI收集数据,(3)MongoDB(NoSQL数据库)用于持续提供数据存储,以及(4)Docker(容器服务)以简化部署。该架构不仅可以接入支持MTC协议的PLC,也可以接入支持MQTT协议的传感器。虽然这种架构在数控机床等领域应用广泛,但仅支持数据的上传,暂未解决如何将大数据分析的结果应用于现场这一问题,上层用户仅具有读权限,而且架构的实现大部分依赖于开源的ApacheKafka。

1.5微信PaxosStore系统架构

微信为了支持其全面的业务而开发了PaxosStore[2]这一具有高可用性的存储系统架构。该架构的最显著特点是它显式的将基于Paxos算法[3]的共识协议抽离出来作为中间件,并作为服务广泛提供给存储引擎及应用,使得各种存储引擎均可以访问。这有助于数据存储的调整、维护和扩展。根据其在实践中的经验,认为实现数据强一致性最为复杂和关键。微信对原始的Paxos算法[13]进行了一定简化以方便部署和维护。Paxos算法及其变形被广泛应用于在线平台的系统架构中,以保证存储在大量节点的数据的读写一致性。

2基于机器学习工业应用用例分析及标准化需求

2.1用例分析

在IECTR63283-2《智能制造用例》草案中,列举了通过机器学习优化生产、基于机器学习优化设计与工程,以及生产资源自优化用例实现路径,三种用例的本质是一致的,可以合并称为基于机器学习的设计、工程与运维优化,笔者根据某两家PCB智能制造企业调研及钢铁企业项目咨询经历,将文本草案进行修改,并以表格表示以上三种用例的实现路径,见表1。

2.2标准化需求分析

数据挖掘是一门新兴学科,其技术更新速度快,在工业应用场景中需要与OT、IT技术相结合,企业为了降低试错成本,大量采用了开源软件工具,例如ApacheHadoop[4],这就对标准化的工作提出了新的要求。机器学习的工作流程及机理需要标准化,最重要的是保证数据清洗、数据标签、算法选择的合理性,同时大数据软件在工业场景中如何使用、更新以及销毁也需要标准化。根据用例的角色分析,标准制定过程至少需要有工业用户、IT开发商以及数据基础设施提供商的参与。从系统架构角度来看,机器学习的数据来源于工业金字塔架构的各个层级,因此,IEC62443系列标准以及网络专用、横向隔离与纵向认证等原则是必须满足的。还需要满足各控制层级数据周期时空映射及非结构化数据(视频、音频等)关联,兼容工业通信协议、跨厂区数据的时间同步、数据强一致性、流式数据高可用等要求。从硬件角度来看,机器学习算法需要图形处理器(GPU)、现场可编程逻辑门阵列(FPGA)和专用集成电路(ASIC)等新式处理器的使用来提高性能,即机器学习相关设备运行环境的标准化,包括设备所能提供的计算能力以及软件应用所需的资源的标准化。

3支持大数据分析的工业互联网架构

来源于科技创新、能源转型、质量提升等方面的竞争压力推动着制造业转型升级,根本目的是创造更多的附加值、降低成本并融入全球价值链[5],需要如图5所示的系统架构实现网络协同制造的跨国互操作,推动企业进行智能制造和产品协同创新。在系统架构的各层级上,数据是互联工厂的核心资产,欧洲推动的欧洲云和数据基础架构(GAIA-X),通过制定标准、测试规范,创建数字生态系统,建立并完善用户和提供商之间的信任和互操作性,通过建立国际数据空间(IDS),创建基于标准化通信接口安全的数据共享结构,将分散的数据转换为一个可信的数据网络空间。

4结语与展望

全球制造业正在向数字化、智能化时代迈进。为应对新工业革命下的国际竞争,发达国家不约而同地将智能制造作为制造业未来发展的重要方向。基于大数据的互联工厂系统架构是实现智能制造的基础设施,体现出制造与数学、材料、通信等多学科融合交汇的骨架,需要以系统架构的角度出发,将不同学科领域的标准、方法合理的融入工业制造应用场景。通过智能制造用例梳理和总结先进经验是分析智能制造标准缺失的重要手段,需要进一步征集用例、分析功能需求,从而为技术规范的制定与实施提供基础。未来工厂发展的大趋势是形成一个系统之系统,其可靠性超出传统工控、机械系统的可靠性范围,还包括IT系统的信息安全、以及数据方面的容灾/一致性等多种特性,但似乎仍然可算为系统的可信性范畴[6],因此不论是借助实验还是结合利用故障树或贝叶斯网络等机器学习算法分析系统可信性都是值得研究的课题。

作者:冯夏维 李天佑 丁露 单位:机械工业仪器仪表综合技术经济研究所 工业和信息化部人才交流中心