大数据下计算机信息处理技术研究

大数据下计算机信息处理技术研究

摘要:分析“大数据”时代及计算机信息处理技术的内涵,从数据分析、关联计算、分布存储、数据挖掘及遗传算法与数据索引等方面总结了大数据背景下计算机信息处理技术的应用途径,并在“大数据”时代下对计算机信息处理技术的发展进行了展望,为计算机信息处理技术的发展与研究拓宽思路。

关键词:“大数据”时代;计算机信息处理技术;信息安全

利用现代化计算机信息处理技术处理数据,可使研究人员获得隐藏在数据背后的一般性结论[1],这些结论的运用范围十分广泛,不仅能够投入到科研领域,帮助科学家深化其研究内涵,还能投入到制造领域,使产品设计师研发的产品更符合人们的需求。

1大数据及信息处理技术

1.1大数据内涵。大数据时代是指在充分获取信息的情况下集中处理和分析各类数据信息[1],所获取的信息可以是社会某个领域的数据集合,也可以是用户在互联网上产生的行为数据,当这些数据在计算机上进行分析和统计时,技术人员便能够获得相关的结论,这些结论具有十分重要的作用和意义。一方面其能够对人类的行为或即将发生的事情进行预测,一方面也有利于新技术的研发。例如人工智能技术,是在对人类海量的行为数据进行分析和处理的基础上发展而来,通过将人们的言语习惯数据化,使人工智能机器获得“与人交流”的能力。

1.2信息处理技术内涵。计算机信息处理技术是指对系统中获取的信息进行分类和匹配[2],该技术与传统的信息处理技术有很大的差异。第一,在处理信息速度上,当代计算机信息处理速度需要与系统获取信息的速度相匹配,实现即时即刻。第二,在处理信息数量上,传统计算机信息处理技术要处理的信息数量有限,而当代计算机信息处理技术面对的是庞大的用户群,每个系统终端的用户,每时每刻都在向系统传输着数据,称之为海量数据。大数据背景下,计算机技术实现对信息进行快速处理,主要依靠的是信息传输与信息收集技术[3],其次是计算机对信息的存储能力和计算机系统的网络安全防护技术。

2大数据背景下计算机信息处理技术的应用

2.1数据分析与可视化。数据分析是计算机信息处理技术的基础应用类型之一,具体包含人类行为与情感分析、时域序列分析及相关回归分析等[4],所得结论可运用到地理、购物、技术改进等领域中。可视化运用指的是利用计算机对数据分析处理得出的结论构建对应特征的图片、图表等,使抽象的数据具象化,使数据内隐藏的规律性表现得更加直观,便于提高技术人员获取信息结论的效率。

2.2关联计算与聚类分析。聚类与分类分析指的是在对旧有数据进行归纳分类的基础上得出新的数据,以合理的结构假设为依据预测用户后来的行为,将可能出现的限制因素进行归类和分组处理[5]。由于该技术对数据分析的较为仔细,得出的结论也较为系统,因此,常用在大数据挖掘的相关运用中。关联计算指的是在统计分析数据时寻找不同类型数据间可能存在的关联性,该技术可以运用于人工智能领域,使搭载该技术的机器具备“学习”的能力,通过对人类行为不断的模仿,使其内在系统更加完善。当前,计算机相关技术已开始朝着云计算的方向构建,使计算机信息处理技术既要关注硬件设施建设,也要加强网络之间的连接。

2.3网络分布存储。网络分部存储基于GFS(扩展分布的文件系统)[6]上发展起来,广泛运用于我国的互联网公司,如百度、腾讯等。网络分布存储技术与传统的存储技术相比,能够实现数据的压索及加快其循环速度,对于提高数据处理与加工效率、开发磁盘的应用空间及缩短目标内容搜索的时间方面具有十分重大的意义。此外,网络分部存储技术还可与深层网络空间技术产生协同作用,使信息集合的规模较大、分布具有自身的特性、访问途径趋向复杂等,有利于提高集合与处理信息的速度。

2.4遗传算法与数据索引。技术人员从生物进化中获得灵感,结合现代计算机信息处理技术创造出遗传算法。其本质类属于随机搜索技术,通过自动调整系统内部的搜索方向[5],获得相对应的信息,遗传算法广泛运用于信号处理、设备的自我学习及工程项目的选址中。当前,研究人员探索数据索引技术的重心在于聚簇与互补索引两个部分,前者要结合索引顺序,实现相关数据的存储,后者需根据不同的副本制作成相对应的索引序列,以此建立互补索引表。

2.5数据挖掘。数据挖掘技术的研究重心在于技术与实体间的关联及网络搜索[7],技术与实体间的关联可以利用网络搜索技术来实现。在使用网络搜索技术的过程中,设计排序学习的相关算法是成功运用数据挖掘技术的关键,主要目的是为了提高海量数据信息的获取与加工。因为社会媒体主要用短文本的方式呈现其获取的关键资料,如何对这部分短文本进行处理,如何提高短文本数据处理的速度等问题,加快了排序学习算法的诞生。通过逐列逐点逐对的计算,对社交媒体平台产生的海量短文本信息进行处理。

3计算机信息处理技术在大数据背景下发展展望

计算机信息处理技术需要先进的计算机硬件设备作支撑,在某种程度上限制了计算机信息处理技术的推广与普及,其功能因为受到硬件设备的限制而无法发挥全部作用。因此,计算机信息处理技术在大数据背景下的总体发展趋势是突破硬件的枷锁,使其向着云计算、智能化的方向发展。具体内容:①云计算技术将大量的数据上传到互联网中,对计算机存储、读取等设备的要求较低,技术人员随时都可在该技术承载的网站上直接查询与传输数据,实现多设备的联动。②计算机信息处理技术在数据传输方面需要由较为封闭的传输方式转向较为开放的传输方式,建立多项上传渠道,分解单一计算机设备承担的压力。③虽然计算机信息处理技术已向着云计算的方向发展,但所有技术都要依靠实体硬件来实现,因此,在计算机领域仍然要加强硬件设备与技术的建设,提升整体运行性能,使其满足当前信息处理对硬件设施的各项要求。

4结语

探究大数据时代计算机信息处理技术。既是计算机行业使用的需要也是计算机信息处理技术的发展需求,海量的数据堆积促进了计算机信息处理技术的发展,无论是处理速度还是处理质量,都较之前有了明显的飞跃。随着大数据概念的广泛普及,计算机信息处理技术的运用范围也得到了进一步扩大,其在人们生活的各个领域发挥着前所未有的作用。

作者:汪雅丹 单位:仙桃职业学院