大数据技术在网络舆情管理中作用探析

大数据技术在网络舆情管理中作用探析

摘要:舆情作为信息传播现象,属于新闻传播学科和情报学科的交叉领域,明确技术在网络舆情课题中的作用有助于深入研究该问题。通过辨析网络舆情、大数据技术概念及特征,探究大数据技术对网络舆情发展及管理的影响。文章基于此分析如何将信息管理经验与技术相结合,为大数据技术辅助网络舆情管理提供方向。

关键词:网络舆情;大数据技术;大数据时代

0引言

随着互联网的飞速发展,网络舆情问题成为我国治国理政中的重要组成部分。以信息传播为根源的网络舆情,在大数据时代带来的海量数据下愈发壮大。如何将技术与管理相结合,使二者彼此辅助共同解决网络舆情问题成为网络舆情领域的研究热点。本文通过对大数据、网络舆情的概念辨析,总结两者特点,探究大数据与网络舆情的关系,从而为未来网络舆情管理提供方向。

1概念及特点辨析

1.1网络舆情概念及特点

网络舆情是指各种不同情绪、态度和意见以信息为载体,通过互联网表达和传播,从而传达出人们对于某事件的认知、态度、情感和行为倾向。随着互联网的发展与普及,人们可以快速直接多维度地参与政治,对于事件发展起到不可预知的作用。网络舆情是依托于互联网存在的信息传播现象,因此其特征与互联网信息特点有相近性。第一,共享性。随着科学技术的不断提高,互联网已经成为新时代中最重要的社交平台。在这个覆盖全世界的大型平台中,人们通过虚拟的网络空间实现了真正意义的信息共享。第二,匿名性。基于对于个人信息和网络空间的自由,互联网具有匿名性。因此信息和传播信息的人都可能无迹可寻,这使得网络舆情比传统舆情更加难以监管和惩处。第三,偏差性。根据2015年中国互联网舆情报告,网络舆情往往围绕“斗”字,这个“斗”无关利益,是为了斗而斗,常有情绪引导的现象产生。缺乏理性、情绪至上的信息传播往往会使信息失真,与其实际意义产生偏差[1]。

1.2大数据技术概念及特点

大数据技术源于移动互联网、物联网和云计算技术高速发展带来的“大数据”的处理需求。2008年美国计算社区联盟发表的一份有影响力的白皮书《大数据计算》中首次提出大数据概念。2010年2月,肯尼斯库克尔在《经济学人》上发表了大数据专题报告《数据,无所不在的数据》,旨在提醒和呼吁世界重视日益增长的巨量数字信息。仍以极快速度增长的海量信息已经影响到世界的各个领域,如经济、政治,甚至包括艺术等人文领域。普遍认为,大数据有着4“V”特征,即Volume(数据规模巨大)、Variety(数据类型多样化)、Velocity(传播速度快)和最重要的Value(价值密度稀疏)[2]。结合这些特征,大数据技术具有以下特点。(1)巨量数据的处理能力:随着Web2.0时代的到来,以用户需求为核心的互联网模式导致信息输出源骤增,大数据技术需满足爆炸式的信息增长需求。(2)多样化数据处理能力:大数据组成复杂,除传统的结构化数据,还包括许多半结构化和非结构化的数据,通过大数据技术可将不同类型信息进行分析处理。(3)处理速度快:与传统数据挖掘技术不同,经大数据技术处理信息几乎可以达到实时传递。通过分布式系统基础架构Hadoop等技术可以在秒级时间范围内给出分析结果。(4)实现价值提纯:大数据的价值总量很大,但价值密度通常较低。通过大数据技术去除信息冗杂等问题,从而实现价值提纯。所谓大数据技术,其本质即面对信息时代海量数据的处理技术,包括海量数据收集、数据存储、数据挖掘、图像视频智能分析等多方面。根本在于为满足信息处理需求,利用技术手段挖掘和运用海量数据,从而辅助决策。

2大数据技术对于网络舆情管理的影响

随着网络快速发展,网络环境已经成为重要的公民环境之一。通过对网络信息的及时监测了解公民思想,把控网络舆情走向引导公民精神建设,借用网络监督促进政府决策的科学化,从而形成全方位的网络舆情管理,保证我国网络空间的安全及国家利益[3]。2.1大数据与网络舆情的关系大数据所指的是在有限时间内无法使用常规手段来获取、整理并且处理的海量数据的集合[4]。如前文所说,所谓网络舆情管理就是对于这些信息的分析处理。要从海量信息中寻找核心价值时,需要利用先进的科学技术手段来对信息进行处理与分析。网络舆情基于大数据时代带来的海量数据而产生,而网络舆情管理也要依靠大数据技术来辅助,两者相辅相成。

2.2大数据技术对网络舆情管理提供可能性

在当前网络舆情管理中,大数据技术为网络舆情管理提供无限可能,面对网络中纷杂的数据来源和庞大的数据量,拥有可以处理海量数据能力的大数据技术成为舆情信息处理分析平台的基础和核心。2.2.1大数据映射社会关系。在过去人类上千年的历史中都通过文字、图画、书籍等记录世界变化,后人通过这些留存的史料窥探过去历史的发展,访求前人的思想。而大数据技术的进步,为互联网中的海量数据提供存储、分析、处理于一体的可能性。这些存在于互联网的海量数据记录着不同时期人们的观点看法、情绪倾向和民生需求等,映射出当代的社会关系。近年来,社会科学逐渐重视对社会关系的研究,通过大数据技术对用户行为的采集,可以关注网络社交媒体上体现的广泛社会交往方式,从而对舆情内容所反映出的整体网民社会关系进行研究分析[5]。2.2.2大数据技术成为网络舆情管理工具。大数据技术分别从舆情数据的获取、舆情信息的测量、舆情预测分析3个方面多维构建网络舆情治理方法体系。

3舆情数据的获取

互联网时代提供了数据产生方式,舆情信息的获取也不再依赖于传统数据采样,大数据技术通过采集用户的网络行为获取舆情数据。传统的抽样调查是静态信息获取,信息获取范围有限,个体倾向严重容易忽略细节问题,造成舆情分析结果的偏差。针对静态页面,可以利用URL直接请求下载整个HTML页面,对网页内容有效分类。再使用XPATH确定规则,对页面进行解析以及筛选,进而获得数据。但网络舆情更多是动态的信息传播产物。利用大数据技术获取的网络搜索记录、浏览记录和社交媒体工具使用记录等用户行为数据,可以为舆情研究提供更为全面的数据基础。针对使用动态加载技术的网页,可以通过Selenium工具以及浏览器WebDriver模拟HTML页面的用户行为,运用事件函数判断动态页面的实际加载情况,最终获得所需数据。此外,还可以通过对数据传递形式为JSON类型的数据进行路径分析,通过修改其所对应的URL直接请求网站获取格式为JSON的数据[6]。大数据技术对于海量信息的收集处理能力可以有效降低个体倾向对于数据分析的影响。同时,不断优化大数据算法技术,提高大数据挖掘信息的效率,更准确地进行关键词提取以及信息匹配也能有效地提高舆情分析结果的准确度和可信度。

3.1舆情信息的测量

如前文所述,互联网的数字化记录为网络信息的存储提供可能。大数据技术以分布式的方式存储数据,主要包括GFS,Hadoop等信息管理系统。以GFS为例,其开源版本HDFS将数据分成小的等大数据块,并辅以副本用以容错,系统支持巨量数据体量(PB级),可以实现一次写入、多次读取的需求[7]。通过这些数据的存储技术,在网络上的行为都会被记录保存。通过对行为信息的分类提取,汇总形成我国舆论数据信息数据库。政府想寻找具备舆论研究价值的信息,就可以以此为数据源。通过对数据的量化研究,可在一定程度上掌握用户群体的行为、兴趣以及习惯,用于评估网络舆论的关注点、扩散情况以及群体态度。如通过对高频词的搜索与阅读,了解该话题对网络群体的吸引力;相关事件的评论与回复通常体现着某个议题引发的某一网络群体的思考;转发与分享等网络行为可作为舆情监测的重要指标,以评估舆论的扩散程度[8]。

3.2舆情预测分析

对比传统的舆论预测,大数据分析能有效提升舆论结果的预测准确度。不断更新的信息能为舆论预测提供更多的变量,避免数据分析的滞后性。通过数理分析,在关系分析和因果分析等实证方法上降低了传统的经验主义、传统主义等主观性分析,有效提升对非结构化数据的处理能力,依托复杂网络分析、数据可视化和语义分析等研究方法提升分析技术的科学性。3.3大数据技术全方位提升舆情监测指标利用大数据技术可以对于网络数据进行有效整理,提升信息质量、真实有效的网络数据信息是舆情监测的基础。舆情监测最大的困难在于数据挖掘的过程中需要面对繁杂的信息,容易产生分析结果精度降低、偏差值过大的问题,导致对于舆情态势不能准确判断[9]。当前大数据技术算法主要包括数据分类、内容摘要自动抽取、IP地址追踪、观点挖掘和情感计算等。在这些算法的作用下形成了我国网络舆情监测指标,即规定某一需求标准,以此标准为核心视角对所圈定范围内的数据进行分析。此外,网络舆情是社会性问题,其监测指标应满足社会性需求,可以根据该标准判断某事件对某区域社会是否会产生影响,波及范围有多大,舆情发展趋势是什么。不同地区对于同一事件的反应各不相同,这是因为不同地区的网民性格特点不同,关注的角度和倾向也不同。利用大数据技术可对不同网络情感进行判断,以情感主客体、情感倾向和情感强度为指标系统地进行监测[10]。情感主体即为参与事件讨论的网民,包括普通民众意见领袖和官方主流机构等,通过测量该话题的讨论量,可用来判断该话题的实时热度、网民的情感倾向以及政府对此事件的回应及态度。情感客体划分百姓民生、国际政治、全球经济等具体领域。根据某一时期内该领域话题被讨论的次数来判断舆情热点集中在哪些领域,热点话题都包括哪些。在情感倾向上分别设立支持、中立和反对的指标。对互联网上的信息进行定量研究,比较不同情感倾向人数的差异,支持不同观点的人数,从而预测出未来舆情走势。在情感强度上利用关键词抽取技术抽取信息中的关键词,对情感激烈程度进行分析,从而判断该话题的情感强度。另外要利用网络社交平台的互动统计,如点赞数、评论数、转发数等指标辅助判断。

4思考与建议

大数据环境下,网络信息具有数据量大、传播速度快、形态多样化的特点。面对海量数据,传统的数据统计和舆情监测方法存在缺陷。新时代的网络舆情管理必须依托大数据技术实现高效准确的数据搜集和挖掘分析[11]。我国网络舆情管理才刚刚起步,结合大数据技术管理模式还需要逐渐融合探索,未来需要注意以下几点。

4.1明确当前网络舆情管理中会面临的挑战

大数据技术的发展受限于各地区条件的差异,由于不同地区经济水平、受教育程度、互联网普及程度、信息技术发达程度甚至文化都有所差异,因此导致大数据技术在实际应用中表现出显著的地域差异性[12],而其中经济发展决定着地区资金富裕程度。大数据作为海量数据提取分析技术需要足够资金支持,地方政府和中小企业能否重视网络舆情分析系统的构建,投入资金支持是个严峻的问题。此外,对于网络舆情数据的收集,大数据技术的优势更多体现在数据规模的庞大,而非质量的优秀。即使随着相关算法技术不断地提升,相比于过去已经有效过滤无效重复信息,大大提高了舆情分析的准确程度,但是由数据良莠不齐造成的偏差仍然不容忽视。

4.2完善网络舆情监管体系

要着手建立以大数据技术为核心的网络舆情监管体系,充分挖掘数据价值,精准分析网络错综复杂的舆情,从而达到对于网络舆情监管能力的提升。要不断革新技术,实现监测手段的不断创新,从而提高数据的准确度。网络舆情管理部门需要不断提高辅助决策的水平,降低预测与实际结果的偏差[13]。

4.3善用大数据思维创新网络舆情管理

首先,要改变传统理念,将大数据思维充分融入网络舆情的管理工作中。要从网络舆情源头展开治理工作,透过网络舆情看到隐藏在其中的民情民意,重视社会治理工作与网络舆情管理的相关性。提高网上政务信息公开程度以提高政府的公信力,提高主流媒体的影响力,加强对于舆情的引导作用。其次,要拓宽舆情管理范围,合理利用大数据开放共享机制,掌控公民日常网络生活中的动态信息,从而实现更全面的舆情监控。最后,要提高对于舆情事件的应对能力,及时发现及时处理,避免因对舆情信息监管不及时、对于舆情态势不重视而造成的舆论危机。

作者:张安琪 单位:黑龙江大学信息管理学院