新时代网络舆情大数据技术应用

新时代网络舆情大数据技术应用

摘要:文章先简单介绍了网络舆情,随后介绍了新时期大数据技术在网络舆情中的应用机制,包括机器学习和内容分析,最后介绍了网络舆情管理中大数据技术的应用策略,包括数据采集技术、数据集成技术、数据挖掘技术和可视化技术的有效应用,希望能给相关人士提供有效参考。

关键词:网络舆情;大数据技术;应用策略

1网络舆情分析

网络舆情主要是广大网民对于社会中的各种热点事件提出的意见、阐述的观点和发表的看法等。网络舆情同时也是新时期社会舆论的全新形式,其主要以网络作为基础载体,主要特征包括匿名性和开放性,全面聚合广大网民,形成一种多元多变、较高分散度和较强倾向性的网络言论,因此拥有影响力较大、传播力强、速度快和时间短等特征。

2新时期大数据技术在网络舆情中应用机制

2.1机器学习。立足于数据分析角度层面,机器学习主要将探索人学习机制作为主要任务,倾向于科学性而非技术性,主要利用机器算法,联系语意分析技术,实施关键字匹配,深入挖掘网络舆情信息,有效还原事件原貌。借助机器学习,对19年阿联酋亚洲杯的网络舆情走向和趋势进行对比分析,例如在1月20日的1/8决赛中,泰国和中国对抗赛中,网络舆论下PP体育和新浪微博信息量远远超出传统足球报和体育报,而其中信息量最多的便是新浪微博,同时于亚洲杯专栏中,国足得到了较高点赞量,特别是在比分被扳平的新闻中,转发数和评论数呈直线上升趋势,广大网民形成了强烈反响。评论内容以正能量词语居多,纵观亚洲杯阶段,网络舆情内和国足相关的内容占据74.1%,同时占据主流舆论的是支持态度。

2.2内容分析。研究网络舆情的主要目的便是为了能够在短时间内快速得到具体的舆情内容,同时对整个事件的发展过程进行分析,准确预测发展趋势和走向。在结束机器学习后,便需要详细分析具体内容,准确发现其中的深层原因。在内容分析中融入大数据技术,可以合理设置多重关键词,针对概念进行合理引申,进一步提升了内容筛选准确性,同时于编码中还可以实时监测编码结果。比如政府推出某项政策,网民的意见各不相同,为此需要针对政策内容和范围进行持续细化,同时详细划分网民不同态度,包括完全反对、大体反对、保持中立、大体认同和完全认同五种层次,如此能够更为清晰掌握网民想法[1]。

3新时期大数据技术在网络舆情管理中的应用策略

3.1数据采集技术收集数据信息。大数据和网络舆情在特点层面存在对应特征。大数据涵盖海量数据和部分的数据处理方法和技术。网络舆情也不是网络内直接存在直接应用的数据,而是通过挖掘、提取数据得到的信息。网络舆情采集分析工作和大数据正好互相契合。大数据技术是网络舆情管理数据的基础性内容,大数据舆情分析也是以数据挖掘和分析为基础,网络舆情相关数据整体价值密度较低,只有对其进行大数据详细分析才能够顺利达到更加准确、详细和全面的网络舆情。大数据也为采集海量数据信息提供了基础工具,可以选择的数据采集技术包括全文检索系统、社交网站信息采集、RSS(简易信息聚合)摘要搜集等。借助上述技术能够针对知乎、豆瓣、天涯论坛等各种知名论坛实施数据采集。全文检索系统是借助全文搜索引擎,通过协议接口针对某个网站内的多样数据类型实施合理检索和采集。以大数据技术为基础的全文检索系统还可以借助特定协议接口,创建动态化的全文检索中间库,符合非结构化数据和结构化数据检索采集需求。在网络中针对某个事件出现讨论热潮后,借助系统自身搜集能力,可以直接扫描、抓取和搜索网站内的文件和数据库,促进网络舆情实现有效的信息采集。社交网络信息采集,主要是面向提供社交网络服务的媒体平台进行信息的实时采集和抓取。比如新浪微博相关API(ApplicationProgrammingInterface,应用程序编程接口)借助分布式微博爬虫程序,能够利用社交网络服务API采集信息,同时对微博中的个人评论、微博和用户之间关系等信息数据实施爬取。进一步扩展了网民社交信息采集的广度,提高了采集效率,为下一阶段舆情分析提供有效数据来源。RSS摘要搜集即借助RSS种子摘要信息针对博客类网站和新闻类网站实施数据采集工作。同时还可以针对和采集目标密切联系的各种种子聚合,能够全面、快速感知某个事件的发展动态。

3.2数据集成技术整理舆情数据。在借助大数据技术针对海量原始数据信息实施抓取后,需要实施创建索引、转换、过滤、去重、聚类等初步处理,同时针对采集的数据信息实施有效补充和清洗。为下一阶段的数据挖掘、舆情研究分析和研究奠定良好基础。大数据技术下的信息处理技术主要是以HDFS(HadoopDistributedFileSystem,Hadoop分布式文件系统)存储为基础支持,借助数据仓库工具以及关系型分布式数据库完成。通过创建关键词汇库和数据索引,形成舆情数据仓库,将全部的数据信息储存到数据库内。大数据内涵盖了集成技术和数据分类技术,能够针对网络舆情实施分类分析、聚类分析。聚类分析针对数据集内全部数据信息根据相似性进行合理划分,分解成多种类别过程。借助该种操作,能够针对拥有较高相似性的数据实施有效聚集,帮助不同数据集合理划分界限。当下的聚类方式主要包括两种形式。过程聚类能够呈现出网民的观点态度和情绪变化,合理把握整个舆情变化过程,避免产生突然性的舆情危机。观点聚类主要是聚集网络中的同类观点,对主体意见和态度之间的比例分布进行合理分析。分类分析则是针对聚类分析后所得的数据信息,根据事先设定好的管理指标实施科学分类。比如可以立足于当下的工作需求,针对原始数据信息实施有效筛选后进行合理分类。具体可以分成医疗卫生、教育、司法、环境保护等类型,为下一阶段网络舆情分析奠定良好基础。

3.3数据挖掘技术掌握网络动态。数据挖掘技术属于大数据技术中的核心,即在随机、零碎、残缺和海量数据信息中,挖掘出尚未被发现的价值信息值。统计技术、人工智能和数据库属于数据挖掘技术中的主要组成内容,拥有关联分析、研判、预测以及误差分析等功能。能够进一步提升数据利用、提取效率,从最大程度出发,分析数据中所隐含的舆情走势,准确把握网络舆情的最佳处理时机,提升网络舆情处理速度。此外,还可以在以往数据信息中合理总结适合相同类型事件的发展规律,借助专业模型,对未来该种事件舆情演变进行合理把握。数据挖掘技术和网络舆情紧密联合的便是意见挖掘法,该种措施通过对特定领域创建文本本体,提取其中的主题观点。随后通过创建极性词典,分析关键词的情感倾向,考虑多种方法,最终了解目标文本情感倾向性。大数据技术条件下,情感词汇相关获取工作以及极性定量分析进一步从人工判定转化成借助语料库计算词汇倾向相似度。同时还可以借助语言学知识,针对词汇构成特征实施定量分析。预测和时序功能即在出现某个事件后,能够快速梳理热门话题和讨论,掌握当下的民心和民意,及时发现各种不良舆情苗头和舆情危机导火线。通过准确把握网络舆情实时走向,对各种虚假信息进行合理封堵,避免出现二次舆情问题。促进管理工作顺利从事中处置转化为事前预警,进行快速应对。

3.4可视化技术展现舆情演变。将大数据技术融入网络舆情报告当中,可以在传统模式下的文字叙述基础上,合理选择应用其他更加直观、生动的图片、表现呈现出事件全貌。比如舆情走势分析图、热度直方图、分布散点图、评论百分比饼状图、关系网状图等多样的图表工具。促进舆情报告和大数据技术融合,能够全面解释整个社会关系。为后期的研判决策处置提供较为直观的参考信息。从网络舆情数据相关发送呈报层面分析,可以促进大数据和多种网络媒体全面联合,不但能够提升信息安全性,同时还可以借助APP智能推送、RSS订阅和邮件等方式进行呈报。准确上报整合后的舆情信息。借助大数据技术还可以提供定制舆情报送、个性化推送等服务。

4结束语

综上所述,国内的舆情环境相对而言十分复杂,借助先进的大数据技术,能够针对网络舆情实施科学分析与有效管理,帮助顺利化解各种舆情危机,提升整体舆情控制能力,创造良好的舆情环境。

参考文献

[1]王茹月.新时代网络舆情大数据技术应用与研究[J].中国报业,2019(14):16-17.

作者:冯秀清 单位:川北医学院