大数据云计算技术范例6篇

前言:中文期刊网精心挑选了大数据云计算技术范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

大数据云计算技术

大数据云计算技术范文1

【关键词】云计算 大数据 网络

计算技术是基于网络,提供数据计算服务、存储服务的新型网络管理调度技术,统筹的将网格计算、并行计算以及分布式计算加以实现,应用到了网络数据管理中,并结合其他软件、硬件提供给用户多种服务。利用云技术,可以大幅度的提高资源利用率,这一新型的超级计算其数据非常密集,能够实现集数据存储、数据计算、服务器功能、应用软件功能、IT软硬件设备资源虚拟化。当今全球互联网的流量也在爆炸式的增涨着,云计算与大数据的应用是数据处理的重要技术。并且,随着网络技术、软件技术的发展,云技术在数据的处理中展现出了越来越多优势,如表1所示。

大数据是在云技术之上兴起的新课题,大数据往往具备以下四个特征:

(1)大量的数据;

(2)多种类型的数据;

(3)数据生成及处理速度快;

(4)大数据的巨大价值;这也就是大数据的4V特征。

并且S着基于云计算技术的大数据不断的发展,还提出了大数据的第五点特征及要求,便是强化大数据处理分析中的准确性(Veracity),目前的大数据处理已经进入了5V时代。

1 大数据的特点

大数据技术对比传统数据的诸多特性来分析,具有非常明显的差异。这些差异主要体现在数据的计算、存储以及检索等多方面。传统的数据线性特征显著,对比离散型显著的大数据而言,大数据的发散性、随机性、爆发性显得更为复杂,但是这种复杂的数据能够体现出更为客观的现象,具备更有效的价值。

2 关键技术

2.1 数据存储技术

信息数据在进行存储时的可靠性、安全性以及读写时的效率是云计算技术的基础,利用云计算技术在存储时,往往采用分布式存储,将大量的数据进行汇总并储存到集群服务器中。这种存储技术往往会对数据进行备份储存,利用先进的数据加密技术配合冗余存储能够确保数据的可靠性、安全性。以HDFS为例:

HDFS是一种分布式文件存储系统,被广泛应用在通用硬件中。这一系统具备较高的容错功能,能够在廉价设备上实现应用,并且其对数据访问的吞吐量也很大,适合应用在大数据集的处理上。HDFS系统可以进一步的实现文件系统中的数据流式读取,在大数据处理中,HDFS常被设计成能够实现平台间便于迁移的系统,这就令大数据集的应用更便捷,如图1所示。

2.2 虚拟化数据管理

云计算的主要功能在于针对大量的数据进行分布式的分析处理,并且为用户提供高效的服务,这就需要强大的数据管理能力作为支撑,而基于云计算的大数据技术在数据管理中具备虚拟化特征。将数据处理的计算机系统转换成了虚拟层,利用硬件设备资源,配合操作系统建立了这样一个虚拟的空间链接数据处理的各层级。令上下层的配合更灵活,极大程度的缩减了开销,提高了资源利用率。

3 大数据与云计算的关联

大数据的处理是将云计算技术视为一种技术平台,大数据在进行数据处理时的首选处理形式则是云计算技术,云计算为大数据的处理分析提供了最适的存储空间及计算能力,可以令大量的数据信息迅速的分析出结果,便于使用付诸现实。而云计算技术的主要功能在于计算能力,大数据则可以视为接受计算处理的对象,前者对于计算能力更为注重,后者则是更倾向于存储功能。将存储的大数据付诸应用的重点在于数据处理,而云计算恰好满足了这一功能性要求。

4 总结

大数据处理技术与云计算在信息处理中展现出了极大的潜力,结合这两种技术能够实现信息传递的高效性、准确性、大容量。在很多领域,应用基于云计算的大数据处理技术表现出强大的功能。随着网络信息技术的高速发展,信息数据的传播数量及速度都亟待提升。基于云计算的大数据处理仍需进一步的开发,并对这一新技术加以应用,相关技术的研究也是当前学术界的关注点。

参考文献

[1]丁有伟,秦小麟,刘亮,王涛春.一种异构集群中能量高效的大数据处理算法[J].计算机研究与发展,2015(02):377-390.

[2]李贞强,陈康,武永卫,郑纬民.大数据处理模式――系统结构,方法以及发展趋势[J].小型微型计算机系统,2015(04):641-647.

[3]李敏,倪少权,邱小平,黄强.物联网环境下基于上下文的Hadoop大数据处理系统模型[J].计算机应用,2015(05):1267-1272.

[4]彭建华,李臣明,邱军林,李晓芳,徐立中.接收与处理分离的实时大数据处理模型[J]. 计算机科学与探索,2015(08):906-913.

[5]张少敏,毛冬,王保义.大数据处理技术在风电机组齿轮箱故障诊断与预警中的应用[J].电力系统自动化,2016(14):129-134.

大数据云计算技术范文2

[关键词]云计算;大规模图数据;处理技术

计算机技术中比较常用的抽象数据结构就包括图,相比较树和线性表来说,语言以及结构变得更复杂,存在一定表示能力,实际生活中不少领域都在合理应用图结构,到处都能发现与图有关的应用以及处理,例如传统应用,科技文献引用、预测疾病爆发路径、确定最合理运输线路等。新应用,生物信息网分析、分析语义Web、分析社交网路等。虽然已经过很长时间的发展和应用,但是随着不断发展科学技术,使得出现更多、更大的图规模,需要不断完善理论基础,确保可以高效处理大规模图。

一、云计算简介

在高速发展互联技术的基础上形成了云计算技术,属于全新计算方式,主要核心就是互联网。在2007年云计算被美国IBM提出,这也是第一次提出云计算,依据此,云计算主要就是用来描述一种类型或者一个系统平台中的应用程序,具备数据存储量大、处理能力强、灵活性高以及可扩展性和通用性的优势和特点,目前已经得到广泛应用[1]。

二、云计算环境下大规模图数据处理技术的

图实际上是非线性数据结构,具备一定多对多关系,在图数据中,可以通过零个或者多个直接后继和直接前趋构成相关元素,相比较其他形式结构来说,图数据具备相对更加丰富的语义,已经被大量运用到工程、科研等方面,因为图数据具备非常多的数据量,因此,分析和研究对大规模图数据处理技术已经逐渐发展成为广泛关注的重点。通过不断的研究和分析,已经具备一定水平的图处理技术,日益完善相关技术理论,为应用大规模图技术提供基础和保障,但是由于不断发展信息技术,促使快速发展多种多样的信息,导致存在越来越大规模的图数据,因此,需要适当提高研究而大规模图数据处理技术的力度,为有效处理大规模图数据提供平台[2]。可以从以下几方面进行分析:

(一)云计算环境下存储图数据的方式

在充分研究和分析大量资料和文献之后得到,目前,在应用以及管理大规模图数据处理技术的时候,其中主要包括超图数据模型、单图数据模型两种常用数据模型,上述两种数据模型都可以在一定程度上对无向图和有向图进行相应处理,但是两种方式最根本区别就是不同的存储格式。大规模体数据进行存储的时候,最基本的就是云计算分布式存储系统,可以把云计算分布系统分为分布式数据库以及分布式文件系统两种形式。分布式文件系统中最重要就是HDFS和GFS,能够直接存放临接矩阵和对接表;分布式数据库,也就是说NoSQL,其中最重要的就是Hbase和Big Tabl。分布式数据库可以分为以下将基本数据模型:主要包括KV存储模型、CFS列族存储模型、DS文档存储模型。DS模型具备方便、灵活的优势,比较适合使用存储结构化数据,此模型不适合对图数据进行存储。经过大量数据分析研究表明,KV存储模型十分适合存储大规模图数据,KV存储模型存在支持哈量存储、高并发查询以及模式结构简单的特点,在处理Page Rank等图数据的时候,一般情况不会出现复杂操作,能够符合数据处理的基本需求,如果是利用邻接表的方式形成图数据,Key就是图的源顶点,Value就是出边信息和点的值,可以更加方便的迁移和合并数据,增加空间局部性,大幅度降低处理查询过程中读取数据的次数,可以在一定程度上提高效率[3]。

(二)云计算环境下分割图数据

一般来说,云计算环境中处理大规模图数据,处理方式应该是分布式并行,因为图计算存在一定强耦合性、图数据具备连通性,为了能够更加高效的处理图数据,应该适当降低子图数据之间耦合度,图分割是有效实现目标的主要方式。基本流程是:首先需要分给具备相对比较完整逻辑结构的大图,然后在分布存储系统节点中分别放置分割部分,进行适当处理,并且每个子图启动以后都需要能够具备与之对应的计算服务,在处理完子图以后,就达到处理大图的目的。在上述处理过程总,分割大图以后,能够得到相对比较好的分割效果,但是在对大图进行分割的时候,需要重合分析图规模均衡性以及内部连通性,保证能够降低子图连通性,增加内部连通性,可以在一定程度上影响分布并行处理大数据机制的运行。此外,也应该降低子图规模均衡性,不能形成比较大的偏斜,避免由于过大时间差距影响系统同步性[4]。

(三)云计算环境下的图数据计算模型

现阶段,基于云计算基础上具备两种应用广泛的模型,包括BSP模型以及Map Reduce模型。

1、Map Reduce模型

Map Reduce模型主要包括由多个reduce、map共同形成的并行处理方式,可以把执行任务阶段分为两部分,一是Reduce阶段,在此过程中,Reduce任务会聚集处理接收到的数据,从而得到相关输出结果,并且能够在分布式文件中保存数据。二是Map阶段,此过程中,Map任务会合理计算分配到系统的数据,输出与之对应的key值,然后在reduce任务中映射出相对应的数据信息。

2、BSP模型

BSP模型主要就是说在并行执行消息通信的时候,具备好、数据竞争以及免锁死的运行特点,在云计算环境下处理大规模图数据需要合理使用上述模型,在迭代处理的时候,相比较Map Reduce模型来说,BSP模型具备相对比较高的执行效率。

(四)云计算环境下处理查询图数据

基于云计算基础上,主要存在两种能够支持处理查询大规模图数据的驱动模式,也就是被动遍历模式和主动遍历模式。上述两种模式具存在图顶点是操作对象的共同特点,也就是说操作处理技术的基本关键就是图顶点。第一,被动模式。上述处理模式能够不进行调用处理函数,可以适当降低处理不必要顶点,大量节约资源。第二,主动遍历模式。上述处理模式,具备比较强实用性,但是应用在特定情况下,会形成浪费资源的问题。

结束语

总之,依据云计算为基础,充分分析和研究大规模图数据处理技术,可以发现,在处理大规模图数据中应用云计算技术,能够有效提高处理效率。

参考文献

[1]于戈,谷峪,鲍玉斌等.云计算环境下的大规模图数据处理技术[J].计算机学报,2011,34(10):1753-1767.

[2]李健,黄庆佳,刘一阳等.云计算环境下基于粒子群优化的大规模图处理任务调度算法[C].//2012年第三届中国计算机学会服务计算学术会议论文集.2012:1-8..

大数据云计算技术范文3

关键词:云计算技术 电力大数据 MapReduce技术 属性约简

中图分类号:TP18 文献标识码:A 文章编号:1674-098X(2017)04(c)-0158-02

身处于当今的大数据时代,电力企业信息化程度和智能电力系统的建设,将促使电力数据的体量实现指数级增长;在电力大数据应用方面,对于行业内外各方面的数据分析均会导致电力数据计算与处理类型成本增多。充分挖掘软硬件资源的潜在价值,减小投入支出,更多的从海量的数据信息当中发掘出其中有价值的数据,促使相关的管理人员能够获得更加多元化的知识内容,将是在大数据时代开展电网管理与控制工作最为重要的一项难题。

1 概述

在具体的电网数据分析工作中,对于最终决策起到主导作用的因素很可能仅是其中的某一部分,而要将这些最为关键的因素及时寻找出来将会对于缩减数据处理规模、提升数据处理效率意义重大。有研究人员就通过应用经典粗糙集理论将对于风力速度有可能产生影响的属性进行了约简处理,同时在对风力速度的预测过程之中也达到了较为满意的效果。一般的数据约简处理方法尽管在减小时间复杂程度、提升效率上价值明显,然而,此类属性所采取的约简算法都是假定将所有的数据内容一次性录入系统内,很明显这无法适用于电力大数据系统。还有研究采用传统关系数据库技术属性约简方式,来处理小规模属性约简问题,尽管在时间性能方面取得了较为满意的效果,然而采取此类方法所能够应对处理的数据规模及时效性均会受制于硬件限制。

而将云计算技术应用于电力大数据预处理当中,则能够给予其软件及硬件资源和相关的数据处理提供以新的途径方式。在本次研究中重点就针对美国谷歌公司所提出的MapReduce编程模型展开了深入的分析与探讨,具体就粗糙集相对正域理论和现行的知识约简计算方式展开了深入剖析,结合其模型设计与计算最终对基于云计算技术的电力大数据预处理属性约简方法的正确性,及其对节点数目的影响展开了实证分析,最终的实验结果显示,此项计算方法不当可大幅度提升电力大数据集的属性约简计算效率,同时还可达到较为优异的可拓展性效果。

2 基于MapReduce技术的电力大数据预处理属性约简

将一个电力大数据集视作为是一项电力知识表达系统,相应的便需求出对指定决策属性集的条件属性,也就是将这一电力大数据集的属性约简问题转归成计算正域势的问题。应用MapReduce计算以上问题,其具体方法为:map函数同时对于多个数据分片进行访问,依据实际需求,将属性及属性值取出,并以此产生出键值对(其所代表的意义即)。Reduce函数接收来自于各个节点map所发送出的key值所对应的键值对序列,并以此来求出相同等价类的具体数量。

Hadoop在进行复杂任务处理之时是对任务数量的增多,而并非是提高map与reduce的复杂性,因此基于云环境下进行电力大数据预处理属性约简,则可设计出多个函数及主程序。在此方面的约简处理过程当中,可将某项具体的电力大数据集视作为是一项电力知识表达系统,并基于这一基础之上,再开展属性约简处理,并可将其视作为是对正域势的计算,具体的计算方式如下所示:

(1)map函数位于同一时段内针对多项数据分片各自独立展开访问,同时依据实际要求规范来获取属性和属性值,进而产生出键值对;

(2)Reduce函数对即为各节点处的map与所发送的key值所相对应的键值对序列,同时还需针对相应的等价类个数予以计算处理。

应用Hadoop针对复杂任务予以处理之时,其主要侧重于对任务数量的增多,而并非是针对map以及Reduce函数复杂性的加强。因而,在基于云计算技术的电力大数据预处理属性约简方面,针对性设计出两项map,三项Reduce以及call job函数,同时还可携带一项主控程序,最终再结合以实际需求,各自给定算法,即可针对大数据预处理属性展开约简计算。

和传统约简方法相对比来看,基于云计算的约简方法不但可促使无法针对大数据集进行处理的情况迎刃而解,同时还能够显著提升整体简约处理的效率,大大减小简约复杂性,可同时实现对空间与时间的双重精简。鉴于此,在目前的电力企业发展过程之中,这一技术已成为电力大数据预处理属性约简的核心手段之一。

3 验证分析

现就针对基于云计算的电力大数据预处理属性约简方法,由算法正确性和节点数据的影响两方面来探讨其在电力大数据预处理之中的效用价值。

3.1 正确性

采用某一电网故障诊断决策表来阐明基于云计算的电力大数据预处理属性约简方法的正确性。下表1为由6个样本所构成的电网故障诊断决策表。

采用伪分布模式进行Hadoop程序的运行,便可获得决策表核{CO2,CO3}和一项约简{CO2,CO3,CB1,CO1}。经验证表明,结果正确。

3.2 节点数目的影响

在本次研究中选用Hadoop平台搭建了一个集群实验环境,其中的Hadoop版块为Hadoop-0.20.0,应用临均值针对缺失数值予以填补,促使数据离散成一系列的0,1列表,以促进数据处理效率的提升,并由此获得13项条件属性及1项据测属性电力知识表达系统S。

(1)可拓展性

这一特性是依据节点数量并按照特定比例来提高并行算法精确性。为验证算法的可拓展性,选取四个节点值来充当测试数据集,即2,4,8,16四个节点。如下图1所示,观察图1可发现,尽管因为硬件与平台运行资源耗损因素导致节点数上升到16之后算法能力有所降低,然而各作业的运行时间基本相当,此即表明了并行算法的良好拓展性。

(2)加速比

加速比即为在数据规模保持恒定不变的前提下,持续增多节点数量并行算法能力。较为合理的加速比往往是线性结构的,然而因为各项计算机设备间的通信、任务调度等因素影响,具体的加速比常常是要小于理想状态的。如下图2所示,测试数据集为20GB,同样为2,4,8,16四个节点,经观察约简时间与节点数量关系可表明,本次研究所提出的算法可达到较为优异的加速比性能。

4 结语

总而言之,在电力行业高速发展的当今时代,应大力加强对于相关云计算技术的深入研究及应用,同时在云计算技术的基础之上来开展关于电力大数据预处理属性约简,促进电力大数据处理效率能够得以大幅度的提升,并为企业的管理人员提供详尽、可靠的参考依据。

参考文献

大数据云计算技术范文4

1云计算简介

1.1概念

云计算是通过将大量计算分布到分布式计算机上,实现虚拟化的计算机网络系统,使得数据的计算运行与互联网类似,能够按照需求访问资源和系统。但是云计算并非通过本地计算机或远程服务器进行计算,而是像计算机网络内部一样实现分布式处理计算,这种方式就好像电厂集中供电模式,将低成本的运算单元组织在一起,能够大幅度提升计算能力和数据处理能力。云计算的这种计算模式对用户完全透明,用户只需要向系统提交自己的要求,云计算软件和平台会自动进行处理,用户不需要了解云计算的具体方法就能够实现快速、高效的大数据处理。

1.2结构

云计算是借助虚拟技术,将大量分布服务器上的资源整合起来,然后根据用户需求进行分配和处理,是一个虚拟的、庞大的计算机网络辅助系统。因此其体系结构也十分复杂,可以大体上分为用户、服务要求、管理系统和服务器集合等四个部分。用户提出服务要求,然后由管理系统向服务器集群发出请求并整合和接收反馈,然后以一个完整的形式将结果反馈给用户,形成一个完整的虚拟计算机网络处理结构。

1.3特点

云计算具有虚拟、高效、资源共享度高等基本特点,同时,目前由于云计算技术还没有完全成熟,大部分企业和个人使用云计算技术需要付费。云计算是一种虚拟概念的计算,也就是说其计算过程并不是通过实际的物理方式实现的,因此不仅能够实现大量数据的运算,也能够提高资源之间的共享度,同时这种分布式处理方式也更大地保证了数据的保密性和安全性。重要数据大量分布在所有分布式终端中,不能简单地从一台终端中提取,提高了数据的保密性,并且如果某台终端处理机出现问题,也不会影响其他终端,极大地提高了数据的安全性,使得大量数据的保存管理成为可能。

2云数据管理技术类型简介

云计算是对海量的、分布性的数据进行计算处理,因此对于数据的管理要求很高,采用的数据管理技术必须能够高效地管理海量数据,于是云数据管理技术也随着云计算的广泛应用而出现,并且目前已经成为众多企业和研究机构研究的重要课题。目前已经存在了许多不同的云数据管理技术,这些云数据管理技术各有特点,但是都以不同的方式实现了对海量数据的有效管理。

2.1GFS技术

GFS技术即谷歌文件系统,是一种为谷歌云计算技术提供数据管理的系统。在这种技术中,所有资源文件以一种库文件的形式存在,并且有系统提供给用户一个专用的程序访问接口,用户提出请求后,由一个逻辑上唯一的管理者对整个库文件进行调度和统筹管理。这种文件系统管理技术不仅能够为谷歌云计算提供海量数据的存储管理,同时也可以进行云计算,满足各种用户要求,目前GFS技术已经成为云数据管理技术的主要技术之一,并且得到了非常广泛的应用。2.2BigTable技术BigTable技术也是谷歌开发的一种数据管理技术,这种技术是建立在谷歌文件系统的基础之上,通过将大量数据组织在一张虚拟的表格中进行管理。这种技术将云数据组织在一张巨大的表格中,从而实现数据的结构化管理。在使用时能够根据要求更加快速地进行数据查找和处理,合理进行资源的分配。这种方式比起文件系统更能够实现数据的架构化,对于结构化云数据的管理会产生更好的效果,取得更高的管理效率。

2.3Dynamo技术

Dynamo技术是一种分布式存储系统,具有数据库和分布式Hash表的特征,以分布式Hash表作为基本存储结构和理念,实现数据在环中的均匀存储形式。这种技术的主要特点是提供了三个参数:N、R、W,技术规定,有N个副本,如果有R个读取一致就可以认为是读取成功,如果有W个写入成功就认为是写入成功,即系统不要求N个全部读取或写入成功,只要能够保证R+W大于N,就能够确保数据的一致性,这种技术增加了数据读取的复杂性,但是降低了数据写入的复杂程度,实现了更加高速的存储管理。

3云数据管理技术特点分析

3.1提供可靠的数据存储管理

云数据管理技术尽管各有特点,但总体都采用了分布式存储管理的思想。这种数据存储管理方式能够为企业提供海量数据的存储管理,同时能够极大地提高数据的保密性和安全性。同时,云数据管理技术一般都具有较高的容错性,大量分布式服务器的支持也可以实现对数据的错误分析和报告,避免因失误产生的数据错误。云数据管理技术最大限度地降低了人为管理因素对数据管理的影响,从而更好地提升了数据管理的可靠性。

3.2实现数据的并行处理和分析

云数据管理技术是将数据进行分布式处理,尽管在逻辑上看来许多云数据管理技术是将数据整合到了一个统一的机构中,但事实上数据是分布存储在大量分布式服务器上,在对数据进行处理时,就可以按照用户的要求从各个服务器中调取数据。在这种技术支持下,就能够有效实现数据的并行处理,系统根据用户要求自动检索分析用户需求,迅速缩小范围,锁定用户关键词,迅速对用户命令做出处理和反馈。同时,多个用户如果提出同一要求,也能够迅速通过这种管理技术实现信息共享,将同样的信息返回不同的用户终端。云数据管理技术还能够根据用户提供的关键字对数据进行初步筛选和分析,节省用户的分析时间,对于需要进行大量数据分析的企业来说可以极大地提高工作效率。这种强大的数据提供和分析处理能力正是云数据管理技术得到广泛研究和应用的主要原因之一。

4云计算和云数据管理前景展望

4.1云计算技术发展前景

云计算技术目前正处于快速发展阶段,不论是个人、企业还是国家都十分重视云计算技术的研究和创新。同时,随着更多的“云”概念的提出,云计算也被赋予了更多的功能和含义,大数据等概念的提出也为云计算带来了新的发展方向。国际社会已经有越来越多的专家学者研究出了更多创新的云计算技术,并且提出了概念含义更加广泛的云计算概念。国内对于云计算的研究也正日益火热,科研机构也在进行新技术的研究,国内个人和企业也逐渐了解了云计算的概念和特点,并且有更多的企业单位开始运用和研究云计算技术。可以说,云计算技术发展前景大好,并且很可能会成为未来一段时间内计算机研究和应用的重点方向。

4.2云数据管理技术的发展

伴随着云计算概念和技术的更新,云数据管理技术也必然要随之更新,云数据管理技术是为了给云计算提供强大可靠的数据存储管理支持,为云计算技术提供数据基础,因此其发展也会随着云计算技术的需求而不断改善。在目前的发展趋势看来,正有着许多新技术和新思想不断涌现,不同概念和云数据管理概念的结合创造出来更多的云数据管理技术。目前云数据管理技术发展趋势正倾向于将不同学科、不同领域的概念与之相结合形成新的管理技术,这种发展不仅能够促进云数据管理技术的创新,也加强了云技术与其他学科技术的结合发展,促进了不同技术的融合与共同发展。

5结束语

大数据云计算技术范文5

【关键词】云计算技术 发展现状 应用

云计算也被称为云服务,是信息技术发展下的新型计算方式。云计算能够共享计算资源,将计算资源提供给其他的信息设备。并且,云计算以网络为依托,能够为计算机用户提供计算资源。另外,互联网为云计算提供了条件,使得云计算能够在服务器上完成计算。尤其是大型企业数比较分散的时候,企业能够根据自身的计算要求来访问数据,进而获取相应的数据信息。由此可见,云计算的服务范围十分广泛,可以为多数服务器提供云计算服务。并且,云计算没有固定的形式,人们能够在各种智能终端上使用云计算服务。而且,云计算的可靠性较高,能够有效保护信息安全。在这种情况下,人们积极运用云计算技术进行生活与工作,云计算在国内外的使用十分广泛。云计算技术的应用受到了信息技术人员的高度关注。研究云计算技术发展现状及应用不仅能够提高云计算技术的要应用效率,而且对人们的生活和工作方式的转变有着深刻意义。

1 云计算的主要技术

1.1 虚拟化技术主要指云计算在虚拟环境中进行

云计算能够运用虚拟化技术简化计算机软件的配置,集中闲置的计算资源,进而减少计算成本,提高云计算系统的性能。

1.2 分布式计算

云算中的分布式计算具有较高的灵活性,能够平衡计算负载,并对计算任务进行分割后再计算,之后再将计算结果合并起来。

1.3 效用计算

云计算中的效用计算主要指按照计算机用户需求进行计算的模型。云计算中的效用计算主要为用户提供计算资源,提高计算资源的利用率。

1.4 集群技术

云计算中的集群技术主要指将云计算过程中分散的计算资源整合起来,进而优化计算机的性能,增强计算机的可靠性。

1.5 网格计算

云计算中的网格计算与传统的集群技术不同,能够支持不同型号计算机的计算资源几何。并且,网格计算的功能强大,能够为用户解决大量的计算难题,提高系统运行效率。

2 云计算技术的发展现状

2.1 国外发展现状

美国、日本、欧盟等国家的云计算技术比较成熟。在上世纪初期,美国已经制定了云计算技术的长期发展规划,并制定了云计算技术对美国经济成本支出的目标。目前,云计算技术在美国市场中的市场地位十分突出扮演中重要的技术角色。欧盟国家对云计算技术做过详细的报告,并指出了云计算技术在社会生活和经济中应用的重要性,建立和云计算管理框架和管理结构体系,以促进云计算技术的发展。而日本也已经建设了大规模的云计算基础设施,为云计算技术的发展提供了物质条件。

2.2 国内发展现状

现阶段,我国对云计算技术的研究仍处于初级阶段,云计算技术的研究程度较浅,并且,云计算技术的应用设备不足。虽然,我国不断推出云计算机服务,但是,云计算技术核心结构体系还不够完善,云计算技术服务还不能满足客户和市场的技术需求。而且,我国对云计算的商业价值和云计算的应用还存在着一定的误区,云计算应用范围有待扩大。另外,我国的云计算技术服务商之前利益矛盾冲突明显,双方缺乏交流与沟通,严重制约着云计算技术的发展。在这种情况下,我国应重视云计算技术的国内发展和应用现状,积极探索促进云计算技术应用和发展的科学方法。

3 云计算技术的应用

3.1 云存储

云存储作为云计算技术的重要要应用,是云计算技术的延伸服务,主要借网络技术、文件管理和集群应用,将网络中各种各样的设备用相关的应用程序几何起来,进而实现数据信息的存储。并且,云存储的数量比较大,需要严格的安全标准,以保证云存储数据的安全性和可用性。目前,我国比较成熟的云存储服务主要由腾讯微云、百度云盘、谷歌云存储等服务。云存储已经成为云计算技术的重要发展技术,随着科学技术的不断完善,云存储的安全性、便携性和兼容性的特点会越来越明显。具体来说,云存储的安全性主要指云存储会对密码、账户名等敏感信息进行保护,并对较大的文件进行收藏,避免文件信息的丢失。便携性主要指用户只需要下载云计算软件,使用要用户名和密码就可以登录,不必准备专门的存储设备,具有较强的便携性。兼容性主要指运存储对不同磁盘中的数据进行兼容,有效提高信息存储的效率。

3.2 云产品

云产品主要指云计算技术所研发的产品,主要包括运阅读器、服务器、操作系统、桌面云等部分。比较有代表性的云产品是微软公司的Azure,这款云产品以微软数据中心为运算基础,所有的应用程序都能够在微软数据中心运行。另外,亚马逊也研发出了云阅读,读者能够将云端的书籍下载到手机或电脑上进行阅读。阿里巴巴、谷歌等企业也随着云计算技术的发展逐渐推出了云计算服务产品。

3.3 云桌面

云桌面是基于云计算的桌面技术,能够将个人电脑桌面上存储的数据信息转移给服务器处理,之后再将处理后的信息反馈给用户,以优化用户的本地桌面。并且,云桌面服务器中有对应每一个用户的虚拟桌面,用户能够通过云计算机书保证桌面数据的完整性和安全性,进而降低计算机用户的安全维护负担。

3.4 云安全

云安全是网络安全研究领域的热点问题。云安全主要保护用户数据的完整性和安全性,防止用户数据被泄露,避免计算机系统遭受黑客攻击。云安全是对云计算技术的补充,云计算的过程中会存在着各种各样的安全问题,而云安全就是为云计算解决安全问题。目前,应用比较广泛的云安全措施主要有身份认证技术、数据加密技术、访问限制技术、入侵检测技术等。

参考文献

[1]杨燕.云计算技术发展现状及应用探讨[J].硅谷,2015(01).

[2]赵田全.浅谈云计算技术发展现状及在企业的应用[J].计算机光盘软件与应用,2012(23).

[3]杨立博.云计算技术发展分析及其应用探讨[J].网络安全技术与应用,2014(04).

作者简介

贾文杰(1980-),男,重庆市人。大学本科学历。讲师。研究方向为高校信息化,大数据云计算,安防技术。

大数据云计算技术范文6

【 关键词 】 云计算;虚拟化;海量数据;存储;管理;服务

【 中图分类号 】 TP393 【 文献标识码 】 A

1 引言

随着互联网的发展,人们对网络的需求越来越多,网络提供给人们的服务也越丰富,而这些网络服务需要海量数据的存储和强大计算能力来满足日益增长的业务需求,云计算的理念就这样应运而生,它是直接产生于企业计算、互联网领域,它更关心如何扩展系统、如何方便IT管理。

2 云计算的概念

云计算是一种动态的易扩展的且通常是通过互联网提供虚拟化资源的计算方式,用户使用相关资源时不需要了解云内部的细节,也不必具有云内部的专业知识。云计算的概念可以从狭义和广义两个方面来看。狭义云计算是一种IT基础设施的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的资源(包括硬件、平台和软件),提供资源的网络就是“云”,“云”中的资源在使用者看来是可以无限扩展,并且可以随时获取,按需使用,随时扩展,按使用付费,这种特性被人们形象地称为像使用水电一样使用IT基础设施。广义云计算是指服务的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的服务,这种服务可以是IT和软件、互联网相关的,也可以是任意其他的服务。

3 云计算的体系结构

云计算的基本原理是利用非本地或远程服务器(集群)的分布式计算机为互联网用户提供服务(计算、存储、软硬件等服务),这使得用户可以将资源切换到需要的应用上,根据需求访问计算机和存储系统的资源。云计算的体系结构如图1所示。

云端用户是提供云用户请求服务的交互界面,也是用户使用云的入口;服务目录是云用户在取得相应权限后可以选择或定制的服务列表;管理系统是提供对用户、资源管理和服务;部署工具是对资源进行智能调度、使用、配置和回收等;资源监控是监控和计量云系统资源的使用情况;服务器集群是虚拟的或物理的服务器,由管理系统管理负责高并发量的用户请求处理、大运算量计算处理、用户Web应用服务,云数据存储时采用相应数据切割算法、采用并行方式上传和下载大容量数据。

4 云计算中的关键技术

按需部署是云计算的核心,要解决按需部署,必须解决资源的动态可重构、监控和自动化部署等,而这些又需要以虚拟化、高性能存储、高效数据处理、高速互联网等技术为基础。所以云计算除了需要仔细研究其体系结构外,还要特别注意研究资源的动态可重构、自动化部署、资源监控、虚拟化、海量数据存储、海量数据管理、编程模式及云平台管理等关键技术。

4.1 虚拟化技术

虚拟化技术是指计算元件在虚拟的基础上而不是真实的基础上运行,它可以扩展硬件的容量,简化软件的重新配置过程,减少软件虚拟机相关开销和支持更广泛的操作系统等多个方面;通过虚拟化技术可实现软件应用与底层硬件相隔离,它包括将单个资源划分成多个虚拟资源的裂分模式,也包括将多个资源整合成一个虚拟资源的聚合模式;虚拟化技术根据对象可分成存储虚拟化、计算虚拟化、网络虚拟化等;在云计算实现中,计算系统虚拟化是一切建立在“云”上的服务与应用的基础;虚拟化技术目前主要应用在CPU、操作系统、服务器等多个方面,是提高服务效率的最佳解决方案。

4.2 分布式海量数据存储技术

云计算系统由大量服务器组成,同时为大量用户服务,因此云计算系统采用分布式存储方式存储数据,用冗余存储的方式(集群计算、数据冗余和分布式存储)保证数据的可靠性。冗余的方式通过任务分解和集群,用低配机器替代超级计算机的性能来保证低成本,这种方式保证分布式数据的高可用、高可靠和经济性,云计算系统中广泛使用的数据存储系统是Google的GFS和Hadoop团队开发的GFS的开源实现HDFS。

4.3 海量数据管理技术

云计算需要对分布的、海量的数据进行处理、分析,因此,数据管理技术必需能够高效的管理大量的数据;计算系统中的数据管理技术主要是Google的BT(BigTable)数据管理技术和Hadoop团队开发的开源数据管理模块HBase;由于云数据存储管理形式不同于传统的RDBMS数据管理方式,如何在规模巨大的分布式数据中找到特定的数据,也是云计算数据管理技术所必须解决的问题,同时由于管理形式的不同造成传统的SQL数据库接口无法直接移植到云管理系统中来,目前一些研究在关注为云数据管理提供RDBMS和SQL的接口,如基于Hadoop 子项目HBase和Hive等。另外,在云数据管理方面,如何保证数据安全性和数据访问高效性也是研究关注的重点问题之一。

4.4 编程方式

云计算提供了分布式的计算模式,客观上要求必须有分布式的编程模式。云计算采用了一种思想简洁的分布式并行编程模型Map―Reduce,Map―Reduce是一种编程模型和任务调度模型,主要用于数据集的并行运算和并行任务的调度处理,在该模式下,用户只需要自行编写Map函数和Reduce函数即可进行并行计算,其中Map 函数中定义各节点上的分块数据的处理方法,而Reduce函数中定义中间结果的保存方法以及最终结果的归纳方法。

4.5 云计算平台管理技术

云计算资源规模庞大,服务器数量众多并分布在不同的地点,同时运行着数百种应用,如何有效的管理这些服务器,保证整个系统提供不间断的服务是巨大的挑战,云计算系统的平台管理技术能够使大量的服务器协同工作,方便的进行业务部署和开通,快速发现和恢复系统故障,通过自动化、智能化的手段实现大规模系统的可靠运营。

5 结束语

云计算真正实现了按需计算,从而有效地提高了对软硬件资源的利用效率,云计算的出现使高性并行计算不再是科学家和专业人士的专利,普通的用户也能通过云计算享受高性能并行计算所带来的便利,使人人都有机会使用并行机,从而大大提高了工作效率和计算资源的利用率,云计算模式中用户不需要了解服务器在哪里,不用关心内部如何运作,通过高速互联网就可以透明地使用各种资源。

参考文献

[1] 王佳隽,吕智慧,吴杰等.云计算技术发展分析及其应用探讨[J].计算机工程与设计,2010(20):4404-4408.

[2] 孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,50(1):146-169.

[3] 王元卓,靳小龙,程学旗.网络大数据:现状与展望[J].计算机学报,2013,36(6):1125-1138.

[4] 张新玲,张东,曹玲玲等.云计算虚拟化平台性能研究[J].软件导刊,2013(11):1-3.

[5] 吴华芹.基于云计算背景下的数据存储技术[J].计算机光盘软件与应用,2013(7):28-29.

[6] 宗平,周明.云计算中的数据安全存储和加密模型的设计[J].计算机技术与发展,2013(10):137-140.

基金项目:

甘肃省教育科学“十二五”规划课题(GS[2013]GHB1097)。