智媒传播下播音主持发展路径探索

2022-09-21 16:31:40 来源:写作指导

智媒传播下播音主持发展路径探索

在科技赋能的智媒时代,AI已然走进电视并重塑传播格局。数字科技入侵实体世界,真人主播将如何应对人工智能的挑战?未来电视节目将发生何种改变?本文基于目前人工智能技术在播音主持行业的应用现状,预测“人工智能+”播音主持的未来发展路径。

一、技术概览:“人工智能+”播音主持的应用现状

1.智能语音技术:智能传播的前置条件。“听”与“说”是播音主持专业的基本要求,人工智能主播的专业基本功有赖于智能语音技术的加持,包括语音识别技术(ASR)和语音合成技术(TTS)。早在上个世纪70年代,语音识别的研发已经出现,但是在其漫长的发展历程中一直默默无闻。直到苹果公司在2011年收购siri.inc公司的语音应用程序,智能语音助理siri才走入公众视野,通过聊天、对话的方式完成用户指令,从而实现便捷、高效、人性化的用户体验。2016年,科大讯飞、搜狗、百度的语音识别准确率已达到了97%,为虚拟主播与观众的互动打下了基础。①近来,百度和腾讯公司均推出了个性化的文本语音转换系统(TextToSpeech,以下简称“TTS”),事先系统存入声音,根据准备好的文本即可轻松完成语音合成和输出。在参数设置上,目前的TTS技术是先通过学习真人的声音数据,把发音中的不同语气现象包括停顿、重音、单音节时长等标注出来进行语气建模。新华社AI合成主播就是以真人主播的视频为样本,通过提取其声音、唇形、表情动作等特征,运用语音、唇形、表情合成以及深度学习等技术联合建模训练而成。然而,大多数TTS系统都依赖于大型且复杂的神经网络模型,由于这些模型难以训练,因此很难进行实时语音合成。为克服这一困难,IBMResearchAI团队开发了一种基于模块化体系结构的神经语音合成新方法,可以更有效地学习说话者的语音和说话方式,因而极大地改善了语音合成系统的开发。就目前应用效果来看,AI主播能够基本做到语音标准。然而,朗读过程中语言表达不够流畅、重音、声调抑扬和语速停连不自然、语势单一呆板等问题仍有待改进。2019年9月,国际语音传播协会第20届年会发表的17篇论文分享了当前AI语音技术的最新研究成果,相信未来随着智能语音技术的不断优化升级,上述问题有望得到解决。

2.自然语言处理技术:人机对话的核心基础。自然语言处理是人工智能的核心领域,包括自然语言理解和自然语言生成,旨在研究机器人和人类如何实现语言沟通。著名的图灵测试就是重点检视AI掌握语言能力的流畅度以及对人类文化的理解力。该实验假设未来机器人与人类能够进行自主对话,如果有超过30%的人不能判断对方是机器人还是真人,则证明机器具有一定程度的人工智能。然而,图灵测试的有效性、意义以及与人工智能的相关性饱受诟病。就目前情况来看,人工智能并没有深入参与人类文化并通过正确语言测试的能力。当前,业界以机器人是否具有自主意识为标准,将人工智能分为弱人工智能和强人工智能。语音识别与语音合成尚属弱人工智能,然而语义理解需要推理能力,而推理能力需要大量人类无意识状态下积累的大量通识常识,因此相对发展较为缓慢。

3.情感计算技术:人机互动的关键技术。情感计算是实现智能化人机交互的关键技术。人工智能主播最难攻克的技术问题是:机器人不具备人的心智和情智,无法同人类在情感上达到高度融合。AI专家正在进行人类行为情感分析研究,以期实现人机情感对话。然而,情感计算目前在发展过程中饱受争议。根据第二代认知科学的“具身认知理论”,认知依赖于真实身体,并且受环境影响。换言之,身心是不可分离的,身体和社会环境共同影响人的思维和情感。马克思主义历史观也认为人类只有通过社会的历练和历史的积淀才更有人性。“人的眼睛、人的耳朵作为人的生理器官具有自然的性质,但能听懂音乐的耳朵、能发现美的眼睛却是社会的与历史的。”②“所谓的‘情感计算’,实际上是指‘计算表情’而非‘计算情感’,两者最多只有概率意义上的对应。在此对应基础上,大致可以建立人机合作关系,但是计算机无法去复制和模拟人的情感。”③费尔巴哈人学观认为,思维力、意志力、心力是构成一个完善的、有血有肉的人的绝对本质,同时也是使人成为诗意的存在。这充分证明,AI主播虽然能拥有相似的真人外形,但是无法具备人类自主的大脑意识、灵动自由的思想、真实的情绪、真挚的情感,因而无法真正取代人类。

二、趋势展望:“人工智能+”播音主持的发展路径

1.未来AI主播可完成非重要场域的新闻播报。AI主播突破了人类的生理局限,可以连续工作24小时而无需休息,既不会出现口误,也不会受到情绪干扰。就目前应用效果来看,AI主播能够基本做到语音标准,然而重音不准、停连生硬、语势呆板等问题仍有待改进。相信未来随着深度学习的不断突破,AI主播可在非重要场域完成常态化的新闻播报:例如平台App、微信公众号的音视频以及午夜新闻和突发灾难事件新闻报道,以降低节目成本,提高生产力。

2.AI最难驾驭电视新闻节目。电视新闻类节目担负着国家喉舌的重要功能,要求主持人知识面广、心理素质强、语言功力扎实。在形象方面,目前虚拟机器人的形象拟真度仍有局限,1970年,日本机器人专家森政弘提出了恐怖谷理论,指在特定阈值内,机器人与人类仿真度越高人们越有好感,然而超过临界点后,好感度会突然降低,越像真人越让人反感甚至恐惧。虚拟人偶缺乏了人类主播的权威加持,机器感可能伤害新闻公信,因此不大可能由AI担任。机器人专家汉斯·莫拉维克提出“人类能力地形图”,海拔高度代表目前对于人工智能的难易程度。其中,艺术在图中显示为最高山峰,AI难以胜任。2019年5月13日,康辉播报的《国际锐评》得到了业界一致好评。这段播报之所以堪称艺术作品,在于康辉不仅达到了有声语言艺术创作的基本层次:即声音的圆润饱满和语义的明白晓畅;更达到了艺术层次:基于稿件全篇和党的政策方针,心系对祖国人民的真情挚爱,高瞻远瞩,驾轻就熟,体现了同仇敌忾的勇气,展现了真正的大国风范。这种分寸感和目的性促使他光荣地完成了党的喉舌的使命,同时也提升和引领了广大受众的审美情趣,达到了声音艺术美学的境界。因此,强化思想性、人文性、艺术性是智媒语境下对播音员主持人的时代要求,将被提升到空前重要的位置。AI主播目前只能完成传媒生产链弱人工智能技术的部分,而真人主播由声音的力度、情感的细腻度、语气的分寸度、表达的精准度所创作出的有声语言艺术作品,是AI主播无论如何也无法媲美的。

3.虚实相生电视科技秀,强化观众沉浸式体验。人类的记忆和储存信息的能力是有限的,但是人工智能在计算和搜索方面的强大优势,恰好可以弥补真人主播的短板,未来各种类型节目的前期选题都可利用大数据和云计算技术进行智能评估,选定受众最感兴趣的话题。类似现象已在现有的节目中显露头角:2017年3月,上海广播电视台推出史上首档人工智能直播新闻节目《小冰摇摇吧》。在湖南卫视《我是未来》节目中,虚拟主持小冰实时统计现场观众的心动值,高科技元素的加入给节目增加了很多趣味和娱乐话题,也能充分刺激受众的新鲜感。如今,依托于虚拟形象生成技术(PTA)的虚拟主播分身纷纷霸屏。无论是在2019央视网络春晚首次亮相的撒贝宁分身“小小撒”,还是2019央视主持人大赛的“千人虚拟大众评审”,都依赖于偶邦智能公司提供的3D虚拟人技术。在“AI+5G”的双重技术驱动下,打造AI科技感的节目将成为未来电视潮流,虚实相生有助于强化观众的沉浸式体验,带来视觉惊艳效果和全新互动模式。

三、因应策略:“人工智能+”播音主持的发展路径

1.人机协作,各有所长。如果说新媒体时代是对播音主持职业发展的一次震荡,智媒时代则是对播音主持职业生存的二次冲击。当前,智能语音、自然语音处理和情感计算技术均以惊人的速度不断进化,人工智能给我们的未来提供了无限可能和想象空间,这既是危机,也是转机。在AI主播挑战下,人类主播可能会陷入自我专业发展“迷思”的困境。未来科技的发展难以预测,但至少可以肯定的是,以往那些安于现状、固步自封、没有个人魅力、缺乏深度思考,只会充当“传声筒”角色的播音员主持人一定会被智媒时代毫不留情地淘汰。而对于那些勇于创新、锐意进取的传媒工作者来说,AI科技赋能只能如虎添翼,提高工作效率、增强创作品质、提升自我效能。在智媒时代传播语境下,未来电视节目“AI主播+真人主播”会成为常态,人机协作将重塑播音主持行业的传播格局。

2.内容为主,技术为辅。在2019央视主持人大赛中,选手果新禹和虚拟分身主播“小果果”联手主持,然而AI主播在节目环节形同摆设,并没有真正发挥其传播价值。文艺组选手龚凡用AI编码为撒贝宁作诗,也有过度包装之嫌。德国思想家本雅明在《讲故事的人》和《机械复制时代的艺术作品》中表达了新旧文化交替时代的矛盾复杂情绪,一方面深情缅怀传统讲故事的艺术,另一方面又对机械复制时代的艺术满怀期待。其实,AI科技只是辅助工具,节目内容才是根本。科技不应只是噱头,如何能够将人工智能技术应用到内容本身,实现与节目意义的完美结合,才是未来努力的目标。

四、结语

人工智能技术的发展对播音主持行业来说,既是危机,也是转机。未来AI主播和真人主播之间不会是取代关系而是共生关系。在“AI+5G”的双重技术驱动下,未来电视节目“AI主播+真人主播”会成为常态。AI科技感综艺节目将成为未来电视潮流,虚实相映有助于强化观众的沉浸式体验,带来视觉惊艳效果和全新互动模式。新科技与旧传统相互激荡,在新技术面前,与其裹足不前,不如积极适应,取长补短,做到人机共存共荣。

参考文献:

①[德]路德维希·费尔巴哈著,荣震华李金山译:《费尔巴哈哲学著作选集上卷》[M],商务印书馆,1984年版

作者:刘丹 单位:华侨大学海峡两岸传播创新研究中心 台湾世新大学