群体性突发事件通信技术论文

群体性突发事件通信技术论文

一、群体性突发事件概述

(一)信息传播速度快

当今的信息传播渠道丰富,传播成本低,传播程序高效,潜在的传播主体多且分布面广泛。

(二)形式与群体特殊

由于互联网应用发展迅速,无地域限制,加之我国网络监察管控机制起步较晚,致使无法全面的监管网络群体,使得网民(包括手机上网用户)成了一个人数巨多,具有很大不确定性的群体。某些境内外“利益组织”乘机发挥,肆意宣传,夸张事实,恶意引导,最终导致群体性事件的发生。

(三)信息传播全面且多元

群体性突发事件所包含的信息量大,新媒介的信源总量多且十分丰富。而手机、电脑等电子通讯设备除了信息,更多的是因为其超强的互动能力而带动各类信息资讯的转发和复制,在各种新媒介的相互交叉中会使信息的传播量得到大幅度提高。

二、现代通信技术在群体性突发事件中的监测作用

对此我们需要积极应对,利用好现代通信技术与IT技术的结合,以计算机网络监控技术为防范群体性突发事件的主要手段,做到事前有效预防,实时监管可控,尽量减少或制止正在发生的群体性突发事件的破坏后果。群体性突发事件所采用的网络管控技术是对数据的进一步进行处理,其中网络管控技术主要有两种:一是对特征值信息检测、审核和过滤,通过防火墙、入侵检测等软硬件系统保护网络或个人PC,进行动态监控,可阻止不实信息在网络中恶意传播,涉及网络协议与网络结构的研究。第二,对敏感信息的碰撞与电子取证,可以及时保护被入侵、破坏的网络环境,对可疑网站、服务器存储的数据文件、安全日志进行分析和提取,依照相关法律程序固化、收集电子证据,为以后进一步的取证行动提供技术保障。这不仅涉及数据挖掘技术中的关键词搜索和文本信息比对技术的研究,也相关于电子证据合法固化技术。通过大量样本研究发现,对于群体性突发事件的网络管控,事前做到对其进行敏感信息安全等级分类、信息特征值描述、特征值提取、特征值数据库的建立是最为关键的环节。这能为群体性突发事件的发生起到了良好的管控、预防作用。对群体性突发事件网络监控系统建模分析,应该对其模块功能描述如下:(1)数据获取模块。其功能是根据初始URL,利用特征值数据库的存储下载页面,可以从定位网页中提取有效网址。(2)有效特征值提取模块。主要是利用特定训练,根据经验,确定集合中物体描述、形状、内容、颜色等向量值,自动生成相关信息特征数据库。(3)智能分析模块。根据上一步骤信息特征数据库的内容,智能分析下载的网页内容,具体判断阀值可由训练集合和特征数据库手动设定。(4)人机交互界面。可为用户提供使用良好的操作界面,有统一接口,可在不同系统应用实现,具体包括能够显示数据比对、用户审核、历史数据、设置监控信息、特征库管理、网站管理、输出监测结果、审核日志等功能。

(一)基于文本信息过滤的关键技术

对群体性突发事件进行监测的过程中,信息过滤技术是其关键。大部分信息过滤系统都是采用网络侦听的方法来获取原始数据,通过设置路由器的监听端口并利用以太网广播数据包的特性来实现。文本信息过滤技术主要有基于规则判断和基于概率统计两种方法,主要应用在基于文本信息的网络通信手段中,如QQ聊天、论坛发帖、电子邮件文本等。文本信息过滤的实现机制可以分解为三个步骤:一是首先建立需求模型,用来描述对文本信息过滤的具体要求;二是数据挖掘进行文本信息匹配,根据用户模板与文本匹配程度进行阙值判断。所以文本信息过滤流程描述如下:首先根据群体性突发事件的相关特征值,建立需求模型,然后在被监控的文本流中搜索符合条件的信息;三是模块因具备自我学习、反馈优化功能,可以利用用户的反馈信息优化需求模型。

1.汉语分词。

汉语分词是对中文句子进行合理分割,是中文文本最重要的预处理技术。自动分词过程是指从用户需求出发,按照中文语法规范,对中文语句不确定性匹配,按自然分词单位进行划分的信息处理过程。自动分词是我国汉语特有的特点,西方的英法语、拉丁语等语种,词与词之间存在着自然的分割,分析过程中一般不需要特意进行分词处理。对文本信息进行汉语分词的实施效果取决于系统采用的分词方法。目前正在研究和所采用的主流分词技术主要有三种。机械分词法:这是我们目前采用最为广泛的方法,包括正向最大匹配法、逆向最大匹配法、设立标志法、逐词匹配法、部件词典法、词频统计法等。最大匹配法是在实际应用中最常见的,其中又有正向、反向之分。“正向”就指我们从左至右搜索,“最大”就是我们每次都取最大词长进行匹配(由于中文有单字成词的特点)。而反向最大匹配法顾名思义就是从右至左搜索。相比较而言,反向最大匹配法的切分精度略高于正向最大匹配法,遇到歧义的现象也较少。语义分词法:它引入了语义分析,可以结合文本信息中上下文对自然语言本身包含的语言信息进行分析。包括扩充转移网络法、知识分词语义分析法等。其中扩充转移网络法是一种在数据库自然语言查询中普遍应用的方法,其实现过程是对句子语义进行分析时,由一个递归网络进行信息传导;寄存器用来保存短语或单词被监测和分析的结果,在寄存器内进行特征比对;测试条件是用来判断是否与检查弧上的标识匹配,通过测试条件集合完成。要实现该方法需要建立一个语法知识库,从而进一步提高分词的精度和深度,但是这也加大了该方法实现的难度。人工智能法:包括神经网络、专家系统等方法。

2.过滤模型。

信息过滤系统的效率和准确度,主要依赖文本信息模型的完善程度。布尔模型、向量空间模型、概率推理模型是目前描述文本信息的主要模型。目前使用较多的是向量空间模型(VSM)。它最大优势是知识表示方面效率较高:文本被抽象描述成多维空间中的不同向量,将文本内容的文字处理转化为向量空间中的数学矢量运算,极大降低了问题复杂度,有效提高文本处理的效率和速度。考虑一个向量空间模型构造的信息过滤系统,可用字项向量来取代文本。比如一个包含敏感信息的文档T可用一个n维向量组取代,其中n用来表示文档T中分词的总数。按照语法规定或用户设定,可以根据每个分词的重要性对其赋值即权重,用来表明它的重要程度。文档T的向量数组描述为D={T1,T2...Tn},其中Tn表示第n个分词的权重。进行文本信息过滤时,首先对发出请求的文本进行合并处理,转换为一个由n个分项组成的向量组X,然后比较向量组T和向量组X两者之间的权重相似度。计算两组权重的余弦值,值越小,夹角越大,根据它们夹角度来判断是否要过滤掉该页面。把文本以向量的形式映射到数域空间的做法大大提高了文本信息处理速度,因此向量空间模型被广泛采用。向量空间模型不足之处是:它忽略了特征项之间的顺序,损失了大量的文本结构和本身的语义信息;此外VSM是基于所有分向量两两正交假设基础之上,没有考虑特征值向量两两之间关联性,其假设过于简单,不能很好地反映自然语言(中文)内涵的丰富语义特征。如果只是用简单的数学运算来代替语义分析,误差总会存在。

(二)基于图像信息内容的识别分析技术

基于内容的图像识别技术是目前国内外研究和应用的主要手段。其原理是把图像中不同色彩区域分割出来,然后进行提取分析,从而判断该色域是否为特征需求区域,最后根据识别结果进行拦截和过滤。把图像信息的识别比对技术应用在群体性突发事件中,能够更加有效的掌握监控图像的内容,从而对其进行拦截和过滤,保护良好的网络环境以及公共安全。

(三)基于视频信息的识别分析技术

对网络视频进行文件结构分析,通过慢放对视频每帧进行划分,获取关键帧,同时也可以结合视频字幕文字和语音信息做多数据整合的分析技术,用来进行视频内容的监测,实现网络视频内容的过滤和识别,重点解决网络中视频识别系统自适应性、实时响应和可操作性,以便对实时视频进行有效监控,并对可疑的视频信息进行记录,按照可疑程度进行分级。本文对当前群体性突发事件的特点进行了归纳分析,由现代通信技术入手,对其特征值进行了归类总结,并针对不同领域给出了研究重点和实施手段,可对群体性突发事件进行有效的监测、预防、引导,尽可能的减少群体性突发事件的发生以及降低群体性突发事件发生所带来的损失和危害。可以预见的是群体性突发事件也会随着信息化发展而有所变化,这样导致应对群体性突发事件的解决方案也是不断变化发展的,这需要我们不断的改进和完善。

作者:刘蔚 欧阳伟 单位:湖南司法警官职业学院 湖南警察学院信息技术系