媒体资产管理系统运维中故障处理分析

媒体资产管理系统运维中故障处理分析

摘要:本文结合笔者工作经验,介绍陕西广播电视台媒资系统的主要功能模块,并且根据工作中遇到的故障问题,通过介绍排查工作原理及设备连接方式,梳理总结出运维经验。

关键词:大洋媒资系统;工作流程监控;EMB监控;故障处理

陕西广播电视台在2012年开始新建中心媒资系统,它具有电视剧上载、归档、回调和备播等功能,通过中心媒资统一B/S界面对外提供检索和下载服务,而后台服务是保证媒资系统稳定运行的重要支撑。系统硬件采用FC+以太的双网架构,由核心服务器、业务工作站、在线盘阵和近线带库等部件组成,大洋媒资系统通过全台网的ESB+EMB互联平台与子系统进行交互。本文讲述ESB流程监控及EMB监控在日常工作上的应用及故障处理方法。

1ESB在大洋媒资系统中的应用

在媒资系统中的每一条文件,相应都会有一条ESB流程,代表实际业务的一个软件实现,由活动、连接、流程变量这几个主要元素组成。通过节点与节点之间连接,不同节点(或不同系统)之间的信息通过数据进行传递,数据包含源变量、目标路径和一些格式转换。通过ESB的调度来完成媒体资源在各系统之间的信息交换和传输。故障分析:通过流程监控,可以看到流程实例中每个节点的颜色为绿色、蓝色、红色,分别代表任务节点完成,任务节点正在执行、报错任务。媒资系统中电视剧上载流程,文件已经完成上载和QC环节并且,编目还没有分配给人员。EMB已经完成计算MD5任务,节点停留在归档报错。说明数据已经传递到归档(一般指数据流磁带库),带库已经接到归档任务,但是因为一些原因没有执行,可以先从带库排查报错原因,例如:写磁带时读取数据异常、执行任务时只完成单归档、驱动器原因造成任务执行失败等,这些都会引起归档节点报错。处理方法:此条报错的归档节点通过以上问题排除确切原因后,通过点击右键此条任务的ESB流程报错节点的前一个节点,在“更新MD5”节点,选择“回退到该活动实例”让消息重新传递给归档节点,使磁带库重新执行此条写磁带任务后,ESB流程会自动完成后面节点任务。通过ESB流程监控可以处理文件的消息传递,可以重新执行报错节点任务,还可以通过检索和高级检索查询文件所有信息。

2EMB的组成及工作原理

EMB是由Manager、Actor集群和配置管理工作站组成,工作原理是:由Manager负责任务的接收、拆分及把任务下发给Actor等多项工作,Actor收到接到任务并执行具体文件迁移、转码、MD5计算等任务后,向Manager汇报进度信息及完成结果。通过转码监控中心来对转码服务器、转码进程、转码任务列表和日志进行实时监控。通过监控界面可以进行手动删除任务、暂停转码任务、重新执行任务等操作。故障分析:通过EMB监控可以看出EMB具体执行什么任务,当点击单条任务时,就知道Manager把任务下发给哪个Actor执行,一条任务可以同时由多个不同的Actor共同完成。大洋的EMB报错类型可分为传输、转码、技审校验等三大类。传输时的报错原因一般是由路径引起,首先可以通过排查网络连接后,再检查文件是否正确和完整性等。转码的报错原因是由重新对视频进行格式转换造成的,视音频参数类型是由大洋媒资控制台提前配置好的,如果没有进行配置就进行转码,就会造成EMB转码报错。如果文件的视音频参数在控制台无法识别也会造成转码报错,又或者需要转出的视音频没有提前配置,同样也会在转码时会报错。技审报错大多数是由于计算MD5值等原因造成。当然有时EMB报错也只是偶然发生的现象,并不是之前介绍的那些问题引起,遇到类似的这种故障只需要通过右键点击报错任务,重新执行转码任务就可把这类故障排除掉。但是如果单独在EMB重新执行任务时,ESB不会自动完成整个流程。

3ESB下载任务故障处理

下载流程原理:媒资系统提供系统之间的下载服务,是通过ESB+EMB的方式经主干与外系统进行互联,通过系统间的接口信息交互进行调用。每提交下载任务就会产生一个ESB流程,如图1。通过这个任务的ESB流程,可以了解下载过程中需要执行任务中的每个节点,因为下载是两个系统之间的调用,所以把除媒资系统之外的节点用紫框画出。首先解释当提交下载任务时每个节点任务具体完成工作。下载任务提交后ESB流程开始“启动”,通过主干到目标系统、磁带库的近线回迁、通过信息传递ESB流程定义中目标系统中查询下载用户是否有权限,再到EMB文件传输,外系统主干再通过自己的EMB把文件从媒资系统搬迁到目标系统,然后通过接口进行文件信息的传递,最后把文件落地到目标系统的消息通过主干再反馈给媒资系统,完成整个ESB流程下载任务。排查故障原因:通过此图可以看出节点在“调用主干入库服务”报错。通过点击节点就可以查找出节点格式转换中涉及到的变量,变量包含一些消息传递及文件信息,每个节点都通过“请求”发送信息和“响应”对消息的反馈,都是通过XML语句进行统一书写格式。通过XML语句可以看出此报错节点是媒资系统通过“请求”经主干调用子网系统,子网系统通过主干的“响应”再给媒资反馈目标文件消息。人们可以通过请求与响应的信息发现是由于子网没有给主干反馈消息而报错。此ESB流程是跨系统之间的交互,所以不能通过回退或重置次数来解决下载报错,这种因系统间接口与接口之间消息传递引发的错误,如果是偶然发生的现象时,只是通过重新提交下载任务解决即可,如果是多条大面积的报错就要看系统间接口服务是否异常。在媒资系统中,通过ESB流程监控可以查看每条任务详细信息,也通过监控可以排查报错原因及处理故障节点。因为媒资系统中所涉及的硬件和软件部件众多,所以只是浅谈了ESB和EMB报错流程中遇到的问题和处理方法。陕西广播电视台媒资系统充分利用现有设备构建生产及下载网络监管平台,故障实时报警及流程状态显示,确保系统运维中的安全性、稳定性,提升下载任务的成功率,从而更好地为节目生产而服务。

参考文献:

[1]程岳.浅谈教育新闻节目的编目、分类方式及未来发展方向——以中国教育电视台新闻节目为例[J].西部广播电视,2017(2).

作者:刘耀平 单位:陕西广播电视台