谈广播电视新闻节目智能分析简报系统

谈广播电视新闻节目智能分析简报系统

摘要:湖南省广播电视系统共有33个自办电视频道,已经通过现有监测系统对各频道节目进行了存储,湖南省广播电视局监听监看中心利用该存储资源便利对全省广播电视的传播内容进行了监测。为进一步提高监测智能化水平,降低监评人员工作强度,我们自主研发了一套智能分析简报生成系统,通过对全省主要广播电视新闻节目进行大数据分析,形成数据简报,为广播电视节目监评提供技术手段。本文阐述了该系统的设计目的以及实现方式。

关键词:节目监测;智能分析;简报

1引言

广播电视是党和政府的喉舌,是维护社会稳定与国家安全的重要舆论工具,是党和政府联系人民群众的重要纽带,是人民群众获取信息服务的主要渠道。湖南省共有33个自办电视频道(省属2个,地市31个)和15个自办广播频道,湖南省广播电视局已经通过现有有线数字电视监管平台系统对自办频道节目进行录音录像,省局监听监看中心利用存储的视音频资源进行分析,对广播电视节目、广告等开展评议,并通过《媒体监管简报》进行反映,推优控负。但监测巨量的电视节目内容对于监评工作人员来说是一个很大的负担,为进一步发挥有线数字电视监管平台作用,湖南广播电视网络传输中心自主研发了一套人工智能简报自动生成系统。其利用人工智能技术对新闻节目进行分析处理,自动生成统计报表,为《媒体监管简报》编辑提供数据支撑,可有效提高省、市两级监管中心工作效率,为宣传管理机构提供重要的依据和参考。

2项目建设内容

本次项目具体建设内容主要包括两个方面。一方面,系统利用语音转文字、人脸识别、OCR识别、新闻拆条、关键词生成、智能分析等技术,实现对省属湖南卫视的《湖南新闻联播》和《午间新闻》、湖南经视的《经视新闻》、湖南人民广播电台的《全省新闻联播》等主新闻栏目,14个市(州)新闻综合、公共、电台等31套电视频道、14个电台的主新闻栏目进行智能分析,能够实现按照预定的模板要求自动生成监测统计报表等功能,为《媒体监管简报》编辑提供数据支撑。另一方面,系统支持对上述要求的33套电视和15套广播的主新闻节目内容具备一年以上的存储能力。

3系统设计原则

立足自主研发。采用先进和具有创新性的监管技术手段,满足各项监管业务需求及技术系统关键功能及性能要求。技术可靠。在系统的研发过程中选择满足监管工作要求且应用性强、技术成熟度高的产品。同时,系统具备高可靠性,能够保证每天24小时连续正常工作。安全性。系统能够有效杜绝、限制黑客非法进入系统,以确保系统安全。同时,监测系统建立系统级备份,配置关键设备时考虑冗余备份。可扩展性。系统建设采用易于扩展的体系架构,便于硬件系统的线性扩容和软件系统的平滑升级,以适应未来节目增加等情况的发生。可管可控。系统使用的硬件设备具有完善、健全的网络管理接口,可通过网管的统一控制对设备进行实时全面的监测和控制,提供完善的故障报警机制;所提供的软件可对业务、用户进行方便快捷的查询和管理,根据软件系统的重要程度,可以提供不同级别的访问设置权限。

4详细解决方案

4.1工作流程

人工智能简报自动生成系统工作流程如图1所示。现有监测系统对全省自办频道节目进行录像,首先需要和现有监测系统进行对接,才能实现自办频道节目录音录像下载、存储和统一管理;其次,基于节目录像对自办频道进行便捷化的监听监看,实现内容快速定位、便捷监看,设置新闻节目入点和出点,截取各频道新闻节目录像;再次,利用人工智能技术对节目内容进行智能分析,通过新闻报道分段、新闻标题提取、关键词提取和重点人物发现来实现新闻主题提取;最后,根据新闻主题提取的信息,自动化生成智能简报。

4.2软件功能

4.2.1录像管理

(1)信源采集

通过流媒体服务器对接现有监管系统,从现有平台中提取已存储节目流,实现全省33个电视频道(省属2个,地市31个)、15个广播频道中新闻节目录音、录像下载。

(2)统一存储

对下载分析后的新闻节目录音录像及相关数据进行统一存储和集中管理,支持按频道、时间进行查询检索。

4.2.2内容监管

用户按需通过C/S端和B/S端灵活操作,可以实现节目内容快速定位、快捷监看、智能识别提示、内容标注、内容下载和录像编目等功能。

(1)快速定位

支持自定义时间、自定义栏目对内容进行快速定位。

(2)快捷监看

支持录像单画面和多画面比对监看,可应用于不同频道录像文件的同时回放,也可应用于同一节目在不同传输环节的录像文件的比对监看。支持4、9或16画面实时回看。录像查看过程中,可进行播放、暂停、停止、静音/声音恢复、上一帧、下一帧、快放(1、2、4、8倍速)、慢放(1、1/2、1/4、1/8倍速)、定点播放、拖动、单画面双击全屏等操作。

(3)智能识别提示

通过人工智能引擎对节目内容进行人脸识别、语音识别、OCR识别,对识别后的结果进行标注,点击后可以直接跳转到对应节目片段。

(4)内容标注

支持关键帧标注、关键人物标注、语音文字标注;支持通过音频文字摘要、视频关键帧摘要、关键词进行检索。

(5)内容下载

为了对审核监看中发现的重点节目进行备案取证和备份存储,支持对分析后的节目内容进行下载,可以自由设置录像的入点和出点,可以进行批量下载和合并下载,形成重要视频库,便于查询共享以及做进一步的审核分析。

(6)录像编目

将录像素材编目入库,支持添加评论和描述。要求对入库的录像提供搜索功能,可查看入库录像的各类统计信息及缩略图预览。

4.2.3新闻内容分析

(1)新闻分段

应用转场识别技术,通过分析新闻节目关键帧的变化、新闻标题的变化、语音内容的变化等,有效识别新闻节目的转场画面,判断转场出现的时间点,进行新闻拆条。对节目中的字幕、标题进行识别。当字幕和标题内容出现变化时,判断节目内容变化,以此为依据进行分段。

(2)新闻标题提取

应用智能识别技术,自动识别、提取节目画面中的挂牌专栏和新闻标题内容,支持对主标题和副标题进行区分。对节目画面中的文字区域进行自动识别、标注、存储,后续即可利用关键词识别技术进行筛选,快速检索到目标数据。

(3)关键词提取

如图2所示,应用语音识别技术,自动识别节目中播报的语音内容,转换为文本形式。系统自动对采集到的新闻类别的音频、视频节目进行分析,自动生成文本。可以通过文本方式对音视频节目进行查询;通过对图文信息中的文本内容进行关键词比对进行分类编目索引。对文本内容进行分词和聚类,并和关键词库进行匹配,智能提取新闻片段的关键词。

(4)重点人物识别

应用人脸识别技术,自动识别新闻节目画面中的重点人物,将该人物姓名作为新闻片段的关键词之一。对新闻节目画面中的人脸区域进行自动识别、标注、存储,能够快速、准确发现新闻节目当中出现的重点人物,对重点人物出现时间进行标注。

(5)专题管理

系统具备专题管理功能。系统支持对省级和地市的电视频道、电台频率新闻时段的播出内容中涉及的相关报道信息进行管理,通过AI识别引擎完成对专题(如建党百年、新冠肺炎疫情等专题)的精准识别与智能分析,识别分析后生成包含相关信息的数据报表。可通过专题库(事件)管理模块显示入库的专题(事件)信息,可进行专题(事件)的创建、修改、增加、删除、查询等操作。在创建专题(事件)时,可定义专题(事件)的关键词组。

4.2.4智能简报要素生成

系统以智能识别分析业务为基础,接收各类引擎生成的分析结果,汇总形成各类定制化报表,支持用户对系统智能分析生成的报表进行预览、下载。系统具备简报要素管理功能,提供统计报表,编辑人员对生成的统计报表进行复核、加工后形成简报。系统支持按照任务、周期、生成时间等多种检索条件进行简报查询、检索、下载、打印等。如图3所示,根据新闻主题提取的信息,按照表格模板,自动生成统计报表,主要包括序号、日期、播出时间、频道名称、节目名称、新闻标题、时长、关键词。统计分析报表支持以Excel、Word、PDF等格式输出,可预览、下载、导出或打印。图2语音转文字操作界面图3简报要素生成表

4.2.5任务管理

(1)系统支持统计报表周期管理(按年、季、月、周、日等任意时间段统计)、区域管理(按地市统计)等功能。

(2)可对指定频道的新闻时段创建监管任务或临时监管任务。根据事件、频道、任务类型、监测起止时间和处理状态,用户可查询任务所对应的新闻时段,并对任务可修改、删除,对设置好的任务可进行启用或禁用。

5编辑简报

根据系统获取的简报数据要素,编辑人员按照简报版块填写数据,如党史学习教育版块的内容为“市州综合频道新闻联播本月共播发了多少条党史学习教育相关新闻,标题内容是什么,新闻时长是多少,市州其他频道有无相关报道,等等”。按照简报对具体板块数据的需求,我们可以设置关键词等指针,从而在海量数据中获取必要信息,填充板块,完善简报。

6结语

广播电视监测工作是我国广播电视事业重要的、不可缺少的组成部分。广播电视节目内容监测监管是各级领导了解广播电视播出质量和内容导向、完善广播电视系统自我监督机制不可缺少的耳目和助手,我们开发的广播电视新闻节目智能分析简报系统为广播电视监测监评提供了重要手段,经过测试和试运行一段时间以后,得到了监评工作人员的好评,为他们节省了大量时间和精力,监测也更加精准和高效。省中心建立的智能分析系统也通过远程分享为各市州监测平台提供了帮助。

作者:姜忠 单位:湖南广播电视网络传输中心