人工智能发展和有声阅读平台创新探索

人工智能发展和有声阅读平台创新探索

摘要:互联网大数据、深度学习等新技术正在引领人工智能发展的新浪潮,并催生可提高众多领域生产力与经济效益的新应用。有声阅读平台作为视听媒介的新兴代表,注重将人工智能技术运用到内容创作、分发、管理、反馈等关键流程,让声音在新技术助推下成为更智能的数字化产品。通过调研荔枝等音频平台并分析人工智能技术与平台的发展现状,本文探析人工智能对平台的创新推动以及面临问题,以期为有声阅读平台的持续创新提供可行建议。

关键词:人工智能;有声阅读;互联网平台;音频传播

互联网广泛普及带来的数据电子化,推动着以大数据、深度学习、自然语言处理等为代表的人工智能技术发展新浪潮。依托移动互联、智能终端的有声阅读平台为拓展创新空间,将人工智能技术运用到创作、分发、管理、反馈等流程的多个维度。在新兴人工智能技术助推下,有声阅读平台正加速向个性化、智能化、精准化发展,但也存在隐私泄露、数据标注等问题亟待解决。

一、人工智能技术与移动有声阅读平台的发展

人工智能技术发展日趋成熟,深度学习、自然语言处理等相关技术已经进入大规模应用期。有声阅读平台的崛起与信息传播技术息息相关,每次技术革新都会带动有声阅读领域的创新突破。人工智能技术在有声阅读平台的广泛运用,正推动平台在内容、功能、设备等方面的智能化发展。

1.实现智能化内容。有声阅读平台通过人工智能技术对内容进行智能处理,能够实现内容创作的智能化。大多数有声阅读平台属于内容型平台,人工智能相关技术的有效运用,可以帮助平台探索个性化、风格化、便捷化的内容创作,在塑造平台品牌风格的同时提升互联网用户黏性。

2.打造智能化功能。有声阅读平台正运用人工智能技术,围绕互联网产品的重要功能尝试优化升级,以期实现平台功能的智能化。有声阅读平台当前重点探索的智能化功能,大多聚焦搜索关联、内容推荐及搜索结果排序等方面。平台期望通过广泛的信息组织和提取,推进基于互联网大数据的算法优化与深度学习,进而对各类用户实现更为精准的目标触达。

3.开发智能化设备。有声阅读平台作为视听媒介的新兴代表和互联网音频传播的典型应用,在注重平台自身发展的基础上,也在积极延伸产业链。例如,有声阅读平台借助相对成熟的人工智能技术寻求外部合作,开发智能音箱、可穿戴设备等智能化终端,探索内容的多终端传播与跨平台消费,进一步实现“耳朵经济”的更多场景布局。

二、人工智能助推有声阅读平台内容生产个性化

互联网大数据、深度学习、自然语言处理等人工智能新技术的发展与应用,正助推有声阅读平台内容的生产、管理、传播等方面变革创新,其中平台的内容生产已经朝着个性化定制、个性化社区等方向发展。

1.用户声音的个性化定制。媒介资源的富足提升了受众的审美品位,使得受众在满足基本需求的基础上,开始追求更能彰显自我的个性化需求。有声阅读平台以往千篇一律的机械合成声音已不能满足用户需求,声音的“定制化”成为新趋势。人工智能技术在声音商业化探索中扮演了重要的支持角色,通过对海量音频信息的处理以及在此基础上的认知深化,为受众提供多元个性化声音模板,并通过语音合成技术实现即时的个性化声音呈现,变换出声音新玩法。以专业的音频分享平台荔枝为例,用户原创内容(UGC,User-GeneratedContent)是荔枝平台的核心优势。荔枝在声音定制层面利用人工智能研发多种技术来重塑声音,使人工智能有效赋能UGC内容生产。AI在线音频技术如美声、调音台、魔音(录音棚、演唱会、小黄人等)、百变音效(欢呼、魔性笑声、掌声等),成为荔枝平台每位用户都能触手可及的声音美化工具,满足了广大受众丰富多样的个性化需求。

2.创新玩法的个性声音社区。人工智能技术在诸多领域的前沿应用,已经引发一系列颠覆性的变革与创新。它在声音娱乐层面不仅仅是形式上的技术“玩具”,更是已具化为实在的创新引导——通过AI研发的各类声音互动玩法成为音频平台发展的利器,商业化的成功促使有声阅读平台搭建个性声音社区,深入挖掘音频传播的娱乐性与社交性。荔枝平台通过开设“听声音找朋友”、“交友娱乐厅”、“声鉴卡”、“声音缘分”等板块,利用用户声音开发新玩法,促使用户发掘自身声音的个性。如“声鉴卡”玩法,用户可录制5秒以上的声音进行一句话挑战,平台利用AI技术识别用户的音色如大叔音、正太音、女王音等,由此呈现给受众专属的声音鉴定卡及最佳声音CP、声音迷人度等属性,同时提供用声音交朋友等功能,形成基于内容与关系的个性声音社区并提升产品的趣味性、娱乐性和社交性。

三、人工智能助推有声阅读平台内容管理智能化

以有声阅读平台为代表的互联网音频应用,每天会产生百万千万量级用户的海量UGC自制内容,人工智能技术能帮助这些平台实现内容管理的智能化,实时进行风险内容的审核识别以及优质内容的挖掘推荐。

1.多模态分析技术保障内容合规性。网络视听是互联网重要业态之一,也是主管部门重点治理的领域。多个音频平台近年因违法违规被约谈、下架或关停,这使得早期“野蛮生长”的有声阅读平台认识到网络视听领域趋严的监管治理等变化,平台作为把关人也需不断促进自治机制的与时俱进。人工智能尤其是多模态分析的应用,从技术层面创新完善着内容管理流程。多模态用传感器技术和机器学习建立并处理过程性数据的信息模型,目前在内容创作、识别与合成等方面取得显著成效。偏重UGC的荔枝平台针对海量用户自制内容应用多模态(音频、图片、文字)分析技术,对上传内容进行全面风险检测并高效识别风险内容以确保合规性。

2.建立音质模型进行优质内容挖掘。人工智能技术的运用,还能帮助有声阅读平台建立相对完整的评价体系,在用户声音大数据中挖掘优质内容继而实现声音的传播价值。音质模型作为代表性技术在声学领域已提出多年,如今在媒介智能化的趋势下正被引入互联网音频平台成为内容挖掘的利器。例如,荔枝为了筛选优质声音设立多个评价维度,并利用人工智能技术建立对应的音质模型,以质量为指向从人声、背景音、喷麦、噪声等维度综合评价,筛选出平台的优质声音。荔枝还建立了专业的数据标注团队,结合自动语音识别和自然语言处理技术对优质内容提取特征进行机器学习训练,持续提高数据池中优质内容的推荐比例。

四、人工智能助推有声阅读平台内容传播精准化

以互联网大数据为基础的人工智能技术还可以通过更有效的用户画像,帮助有声阅读平台实时触达目标用户,并融合丰富的信息消费场景实现平台更多内容的裂变传播与精准传播。

1.数据迭代更新实现用户画像。用户画像是行为大数据挖掘的基础工作,通过从多角度描述并细分互联网用户,为后续智能化的精准传播提供支持。有声阅读平台运用人工智能技术,设定画像目标、建立标签体系,并进行数据采集和行为建模,实现用户画像可视化及数据迭代更新。结合算法更有效地实现内容分发和业务运营的智能推荐,是有声阅读平台用户画像的重要目标。

2.内容场景植入推动裂变传播。移动时代的传播场景正变得越来越重要。通过场景与声音服务功能的有机结合,有声阅读平台可以深入挖掘并细分消费市场。懒人听书APP通过调研发现,“上下班通勤”与“睡觉之前”这两个场景是平台收听的峰值,于是结合不同场景特点进行内容推荐的优化。5G时代万物互联,声音可触及穿戴设备、智能音箱等更多终端,有声阅读平台借助全场景布局能使多种智能终端切入不同生活场景,实现多元化的裂变式传播。

3.混合推荐系统助力精准传播。互联网平台常见的推荐系统,主要有基于内容特征推荐、基于用户评价推荐以及综合二者优点的混合型推荐。由于用户的复杂性快速变化,目前大多数平台会使用混合型推荐系统。荔枝平台从可量化的指标入手,综合运用点击量、播放量、完播率、点赞、评论、转发数等正负反馈行为作为特征,进行深度学习训练并调整和优化模型,以提供更符合用户体验及期待的精准传播内容与服务。

五、人工智能发展及移动有声阅读平台面临挑战

人工智能的发展正在模糊甚至消解人与机器间的界限,带来越来越多信任和道德层面的挑战与隐患。有声阅读平台的创新发展在充分利用技术红利的同时,也产生了用户数据泄露、数据瓶颈以及人机抗争等问题。

1.用户数据运用易导致隐私泄露。大数据、算法和模型是人工智能的核心要素。目前人工智能所需数据主要来源于学界业界共建的通用数据集和各行业的专业数据集,而有声阅读平台的数据多来自后者以及平台累积的数据。人工智能技术对用户数据的运用贯穿平台运作全过程,包括数据输入、处理、输出等环节,但这些关键节点都有暴露被攻击导致用户数据泄露的可能。目前国家明确规定互联网平台需保护用户隐私,不可泄露和非法获取用户隐私数据,但不可控因素仍导致大量侵权事件、用户数据被扩散传播甚至产生经济损失。这是有声阅读平台在运用人工智能技术过程中,尚未解决的难题和需着重关注的焦点所在。

2.数据标注成为智能化发展瓶颈。“以‘深度学习+大规模数据训练’为主要模式的人工智能系统,需要足量数据、足够的运算资源,才能不断优化性能,具备更加显著的问题解决能力,产生有意义的结果。”有声阅读平台对有效数据的筛选需耗费大量资源,存在一定困难和滞后性,同时数据清洗也是难题。音频内容识别首先难在没有直观的视觉呈现与画面比对,违规内容隐蔽难以察觉,而音频原始数据还存在多层叠放等问题,背景音乐、方言、外语等内容的技术攻关也尚未完成。荔枝平台在音色识别中,尝试过将声谱数据转换成图像数据进行频谱识别,虽然较容易提取到数据特征,但对音频转文字的应用以及音乐等背景音影响显著的类型,算法转换的准确率仍差强人意。

3.技术声音与艺术声音持续抗争。“声音渠道不仅传递信号,同时也传递所有伴随而来的理解、深思、同情和宽容。声音中潜藏了能唤起感觉的信息。”随着人工智能技术的发展,内容创作成为新技术进入的热点,喜马拉雅、懒人听书、荔枝等有声阅读平台都出现了机器阅读的有声书。几万到十几万字的作品在既定技术模型下可轻易被创作出来,机器声音虽能提升创作效率、降低创作成本,但机器“冰冷”的声音从不是传递情感的最好方式。经过数据计算的情感表达只是符号和代码,技术声音目前只能作为辅助而不应成为信息传播的主力。在人工智能未广泛普及的今天,单纯机器声音的阅读还没能达到预期,但技术声音成本和效率上的优势,仍会导致其未来与人类的艺术声音持续抗争。在人工智能技术迭展并加速普及的趋势下,移动有声阅读平台朝着个性化、智能化、精准化的方向变革创新,但不可避免地会面临更多新的问题与挑战,尤其需要关注艺术与技术的竞合关系。技术声音仍是冰冷无生命的,艺术工作者面对人工智能要发挥主观能动性创作更多有温度灵性的艺术声音。有声阅读平台在继续利用人工智能技术时,要注重做技术的引领者而不是服从者,从而推动音频传播领域更加健康、有序地创新发展。

作者:余苗 赵文聪 单位:暨南大学新闻与传播学院