网络直播评论动态预警系统设计

网络直播评论动态预警系统设计

摘要:通过分析网络直播的发展现状,指出目前直播行业存在的诸多乱象,网络直播的大环境亟需有效改善。通过对网络直播用户评论进行采集,构建基于评论文本和情感词典的情感分析语料库,利用SnowNLP算法进行情感分析,据此进行可视化输出和预警提醒,进而设计出网络直播评论动态预警系统。该系统的设计可以实现对网络直播中不良信息的实时监管与预警,并加强对直播过程中网络舆情的正确引导与管理,有利于维护良好的网络环境与社会秩序。

关键词:网络直播;情感分析;动态预警

1研究背景

随着互联网技术的日益发展和对大众生活的渗透,网络直播这一交互性极强的新型媒介出现并得到了迅速发展。据统计,截至2018年6月,我国网络直播用户规模达到4.25亿。然而,网络直播行业在蓬勃发展的同时,也存在诸多乱象。部分主播为了博眼球和快速“吸粉”,甚至进行“平台造娃娃”“生吃蛆虫”等低俗表演,还有直播掐死女儿、直播自杀、直播骚扰女生等,负面事件层出不穷,造成恶劣的社会影响。同时,由于直播平台用户的匿名性以及直播的强大互动性,广大观众在发表言论时随心所欲,很多人出口成脏,网络直播弹幕评论中存在着各种污秽下流、诅咒的词汇,严重影响网络直播环境,误导用户的思想价值观念。这既不利于网络直播行业的持续发展,也会对网络环境与社会秩序产生不良影响。面对网络直播存在的问题,目前,有关部门已经出台相关文件并对直播平台进行了整治,但监管理念升级并不能有效解决直播乱象,监管技术亟待提高。对于网络直播平台问题,不仅要完善相关立法规定,更需要在技术上有所创新,实现对直播平台的实时监控与管理。

2研究综述

不少学者关注到网络直播这一新兴热潮,并从用户参与互动行为、弹幕信息特性等角度对直播中存在的问题进行研究。丁家佳以映客直播为例对直播用户的互动行为进行研究,对直播乱象的治理提出了建议。喻昕等深入研究弹幕信息特性和弹幕用户信息参与行为,构建网络直播平台中弹幕用户信息参与行为的理论模型。徐向东分析直播乱象的表现与根源,从政府管理、行业自律、技术支持等方面提出构建网络直播治理体系的建议。在综合的网络舆情预警领域,有很多学者展开了研究。石鲁生等基于模糊综合评价法提出一种网络舆情的动态预警方法。张扬等针对网络信息的特点优化情感识别策略,提出一种基于朴素贝叶斯模型的网络负面信息预警策略。在高校的网络舆情领域,牛兵等通过典型案例对网络舆情的传播特征和路径进行剖析,构建高校网络舆情的研判与预警机制体系。在旅游网络舆情领域,杨艳霞针对旅游网络评论信息,实现了一个基于本体的旅游网络评论情感分析和预警系统。综上所述,对于网络直播这一新兴热潮,不少学者已关注到其中存在的问题,并提出了相关监管方法与政策上的建议,但缺乏实质性的解决方案。本文基于所构建的网络直播评论情感倾向分级机制,对网络直播评论进行情感分析,并搭建网络直播评论动态预警系统,进而实时监管网络直播中的不良信息并加以预警,以期营造一个清朗的网络直播环境。

3系统设计

3.1系统设计框架

一般而言,大数据的技术体系框架包括数据采集、数据处理、数据分析与应用服务四个环节。本系统的设计目标是对网络直播用户的评论进行情感分析,及时发现、提取不良信息并加以预警提醒。通过对系统的需求分析,并借鉴已有大数据技术体系及相关网络舆情监测预警系统,提出网络直播评论动态预警系统结构图。

3.2模块实现

3.2.1数据爬虫模块

对于网络直播用户评论信息的采集,本文选取国内直播行业具有代表性的斗鱼直播平台。据统计,游戏直播类APP排行中,斗鱼直播活跃人数达到2023万人,排名第一。斗鱼直播是综合性的直播平台,涵盖游戏、电竞、二次元、娱乐、综艺等多种直播内容。因此,斗鱼直播平台的用户评论数据适合数据分析的需要。利用socket模块设计针对斗鱼直播平台的爬虫程序,爬取了37349条用户评论数据。采集数据的维度包括用户ID、用户昵称、评论内容。采集的用户评论中,包含一部分无实际意义的评论,如符号评论、刷屏评论等,需要对数据进行清洗。本文利用Excel工具,去除无用评论,得到初步可分析数据集,共25000条数据。

3.2.2情感分析模块

情感分析模块通过Python程序实现,主要利用SnowNLP算法和Jieba分词算法进行编程。情感分析的第一步是构建网络直播领域的语料库。由于针对网络直播评论分析的研究很少,目前尚无较为完整的语料库,本研究基于词典和评论文本相结合,进行情感分析语料库的训练。通过对知网情感词典、台湾大学整理的中文情感词典、网络流行语等词汇集进行整理去重,形成新的情感词典。此外,将人工标记的数据与情感词典中对应极性词汇,分别写入正负极txt中,一同作为训练文本,载入情感分析模块进行训练,构建情感分析语料库。在此训练结果的基础上,将通过Jieba分词算法得到的高频词写入训练文本,高频词的持续添加使情感分析语料库更加丰富,有利于提高情感分析的准确率。同时,随着训练评论数量的增加,语料库也得到不断丰富。情感分析语料库构建完毕后,开始对用户评论进行情感分析。将情感>=0.6的归为积极情感,将情感<0.6的归为消极情感,在本文的研究中为了明确显示情感极性,实现分级预警,进一步对评论的情感极性进行详细划分。根据以上情感倾向分析的结果,将负面评论整理出来,用Jieba进行分词处理和词频计算,将高频词提取出来,整理并补充到训练文本中。同时,根据词频计算结果制作词云,词云能清楚直接的显示出当前直播间的负面舆论点,可提供给管理人员,以及时进行有效的预警干预。

3.2.3预警推送模块

预警推送模块的功能是:根据评论情感值、对应ID累计预警次数等指标,适时向用户、直播间、平台管理者推送预警消息。对于预警指标界限的确定,本研究采用德尔菲法。本研究邀请领域专家对预警指标进行预判,经过多轮征询,专家认为情感值0.1应该作为预警极性的界限,即当情感值小于0.1时,认为该负面评论极大可能产生不良影响,需要及时进行预警干预。根据专家意见,建立了针对网络直播负面评论的预警分级机制。结合分级机制赋予各个数据模块指标相应的权重,计算预警结果并进行可视化反馈。将词频、词云、预警等级进行可视化输出,呈现给用户、直播间、平台管理者三个接收端,并进行预警提醒。在轻度预警情况下,对用户进行消息提醒警告;对于中度预警,需要进行一定的违规惩罚,如禁言、封号一定时间;而对于重度预警,需要引起重视,通知平台管理者及时进行人工干预。

3.3系统的工作流程

3.3.1系统的实施流程

基于网络直播评论预警系统的整体结构设计,结合其他领域较为成熟的预警逻辑,形成网络直播用户评论预警流程。系统对网络直播中的用户ID、评论内容、评论时间等信息进行收集,经过预处理,形成可分析的数据集,利用大数据分析技术和语料库进行情感分析,计算权重化的预警结果,并将其进行可视化输出,将预警结果反馈到用户端、直播间以及管理端。当结果值超过预警指标时,系统需要实施干预,以实现有效的预警与监管。系统自动收集分析数据、实施干预等,省时省力,弥补了大量人工监管中不及时、不全面、耗费大等缺点,但系统处理有时会过于客观、机械,也需要一定的人工参与,使数据收集分析、干预更加科学合理。此外,重度预警也更需要人工的参与,进行重大事件决策处理。

3.3.2系统的可行性分析

该系统的实现具有可行性。首先,基于文本挖掘的舆情预警在旅游、网络社区等其他领域已经有了成功的尝试,为网络直播舆情预警提供了有力的借鉴,说明舆情导向的预测具有现实的可能性。其次,文本挖掘、大数据技术日益发展,为网络直播舆情分析预警系统的实现提供了有力的技术保障。最后,该系统的应用能帮助网络直播平台进行有效的监管,提高直播业的产品服务水平,有利于增强用户黏性和对投资吸引力,从而促进直播平台的稳定与持续发展。

4结语

通过对网络直播用户评论的采集,基于评论文本和情感词典进行语料库的构建,利用SnowNLP算法进行情感分析,并搭建网络直播评论预警系统,进而实时监管网络直播中的不良信息并加以预警,实现对直播过程中网络舆情的正确引导与管理。本研究实现了直播用户评论分析与负面评论动态预警系统设计,可供网络直播平台管理参考借鉴,从技术上对直播间舆情进行有效监管。本研究的情感语料库还需要进一步的迭代优化,以提高情感分析的准确率,从而实现更加稳定有效的系统预警效果。

参考文献

[1]丁家佳.从“映客直播”看泛娱乐网络直播互动[D].安徽大学,2017.

[2]喻昕,许正良.网络直播平台中弹幕用户信息参与行为研究——基于沉浸理论的视角[J].情报科学,2017,35(10).

[3]许向东.我国网络直播的发展现状、治理困境及应对策略[J].暨南学报(哲学社会科学版),2018,40(3).

[4]石鲁生,陈林,李凯.一种网络舆情的动态预警方法[J].天津师范大学学报(自然科学版),2012,32(2).

[5]张扬,崔晨阳.基于朴素贝叶斯模型的一种网络负面信息预警策略研究[J].图书馆杂志,2014,33(8).

[6]牛兵,范君晖.基于传播阈值的高校网络舆情预警体系构建[J].统计与管理,2016(2).

[7]杨艳霞.基于本体的旅游网络评论情感分析与预警系统[J].计算机与数字工程,2016,44(4).

作者:窦倩 陈彩蓉 林琳 单位:江苏大学管理学院