大数据环境下网络信息论文

大数据环境下网络信息论文

1大数据背景下网络信息资源的特征

就如同在信息时代信息研究的重要性一样,研究大数据时代的大数据特征也具有重要性。大数据产生和发展的特点可以归纳为“4V”,即Volume(海量)、Velocity(高速)、Variety(多样)、Value(价值)。特征一是数据量大。进入Web2.0时代后,人们可以随时随地大量信息,因此,大数据的起始计量单位不仅仅是人们现在熟知的G、T,还可能是P(1P=1024T)、E(1E=1024P)或Z(1Z=1024E)这些数量级。特征二是速度快,时效性强。要快速有效地从实时的、动态的数据里挖掘有用的信息是大数据的特点。特征三是数据类型多种多样。随着当下流行的社交网络的应用,用户生成内容如各种音频、文本信息、视频、图片等非结构化数据出现了,多样性的数据要求对数据的分析处理能力的方法也要多元化。特征四是数据价值密度低、精确性不够。如随着物联网、云计算的广泛应用,信息量变大,但价值密度较低,这就需要相关的专家找出更好的技术算法去快速完成信息价值的增值。

2大数据背景下国内网络信息资源管理现状

与网络信息资源管理和利用水平先进的国家相比,由于我国互联网起步较晚,网络信息资源管理研究内容还不够系统,一般是从理论上研究网络信息资源的特点、网络信息资源管理体系结构、网络信息资源的利用中存在的问题及对策等内容。信息资源作为信息时代的战略资源,发达国家对于大数据的研究极为重视。2012年,美国政府五大部门耗资2亿美元,开始了“大数据研究和发展计划”的项目,用来提升美国的教育、科研以及国家安全能力,并大力发展与大数据相关的数据采集、整合、储存、分析和利用等技术研究,从中可以看出美国已经把大数据作为国家发展战略。从大数据时代的现状来看,我国也不屈居于后,是顺应时展潮流的,邬贺铨院士就曾表示:“我国将产生全球最大量的数据,要重视大数据的开发利用和管理。”工信部于2012年2月的物联网“十二五”规划上也指出,在此期间,中国将以加快转变经济发展方式为主线,更加注重经济质量和人民生活水平的提高,亟须采用包括物联网在内的新一代信息技术改造升级传统产业,提升传统产业的发展质量和效益,提高社会管理、公共服务和家居生活智能化水平。作为4项关键技术创新工程之一的信息处理技术被提了出来,涵盖了海量数据存储、图像视频智能分析、数据挖掘等信息处理技术都是大数据技术的重要组成部分。我国对于网络信息资源的管理利用一直沿用其他国家的方法和技术,自主创新度不高。我国在大数据背景下所面临的挑战也非常多,尤其是大数据安全管理能力、大数据存储及处理能力、大数据应用能力等方面。技术上,我国目前主要围绕数据仓库、数据挖掘等高水准方面研究,包括搜索引擎技术、元数据、专业指引库技术。但现今,我国很难提出符合系统要求的切实可行的网络信息资源管理建设方案,许多研究成果的理论性较强,但实践可操作性不足。

3大数据背景下国内网络信息资源管理内容

作为人类历史上第三次革命的信息革命对人类社会发展影响是十分巨大的,大数据背景下,无论是政治、商业或是其他各个领域,都面临着怎样迅速理解、如何运用大数据,进而研究、组建有效的大数据时代信息管理模式的挑战。面临这一现状,大数据背景下的网络信息资源管理必须依靠强大的信息储存、数据分析和数据挖掘能力,尤其是要构建一个科学、合理、有效的框架,才能合理利用数据,获取有价值的信息,发挥其实践价值。网络信息资源管理应用于各行各业,与信息技术发展紧密相关。学界对其管理方法和技术应用进行了研究,网络信息资源管理的方法有技术手段、经济手段、法律手段和行政手段四大类,按其管理范围,网络信息资源管理的方法分为网络信息资源的宏观管理方法和微观管理方法。未来网络信息资源管理的发展,应以网格技术为基础平台,围绕知识发现和信息开发利用等目标,进一步解决信息整序、数据挖掘、隐性知识的显性化和信息资源的知识管理等问题。网格技术有信息集成功能,能将各种资源联结起来,可把全球信息资源有机结合以实现个性化、专门化服务。信息网格可应用在信息资源整合方面,是传统的信息资源管理技术和理念在网格时代的具体呈现方式,进而达到推陈出新和迅速提高网络信息资源管理水平的效果。

3.1网络信息资源的采集

我国作为世界第一人口大国,产生的数据量理应非常庞大。但是据调查,截止到2010年,产生的新数据量为250PB,相对于发达国家而言只有日本的60%,美国的7%。当前我国网络信息资源收集主要任务就是通过多渠道、多方法来尽可能收集更多的数据。瑞士达沃斯论坛在2012年的《大数据大影响》报告指出,数据就像货币或黄金一样,已成为一种新的经济资产类别。鉴于网络信息资源的分布特点,以万维网形式存在的网络信息资源检索工具已经被广泛地普及。比如搜索引擎和各种数字图书馆,除此之外,有偿的网络信息服务平台和电子商务信息网站也逐渐为网民所认知和接受,从而能够实现大数据时代原始数据量的积累,进而完成从量变到质变的这一过程。

3.2网络信息资源的整合

网络信息资源整合首先要面对用户提出的有关各载体、各渠道的网络信息资源的查询与使用的问题,要充分了解各类信息资源的情况、查询技巧,努力掌握对用户提供参考咨询服务的各种技巧。其次,网络信息资源整合并不是简单地累加网络信息资源,而是需要经过专业技术的再加工,通过对网络信息的分类、鉴别后优化重组而成,因此对工作者的信息素养有很高的要求。

3.3网络信息资源的储存

在网络信息资源管理活动中,数据库技术具有非常广泛的应用领域。它是实现资源共享、节省开支和提高系统反应能力、工作质量以及服务水平的重要手段和技术保证。近年来我国自主研发的数据库包括:重庆维普公司出版的“中文科技期刊数据库”、万方数据集团公司建成的“万方数据库”以及中国学术期刊(光盘版)。电子杂志社推出的“中国学术期刊光盘数据库”等标志着我国的网络信息资源开发工作迈向了新阶段。但从全球范围看,我国数据库的数量只是全球数据库总量的1/10,容量约是世界总量的1/100,产值只有世界总量的1/1000。除此之外,在开发数据库时,应该按照特定学科、用户以及专题的要求,确定开发的重点,开发对象应该是具有实用价值的资源,最后建成满足目标用户需求的序列化网络信息系统、专题信息产品全文、题录型或文摘型数据库。

3.4网络信息资源的共享

信息孤岛效应是我国城市发展的一个瓶颈,各级政府与部门间不愿公开、分享信息,这就造成信息与信息之间的孤岛,无法实现信息资源的价值。关于这一现状,有些政府部门也有明确的认识,开始积极寻找解决方案。在美国的引领下,全世界目前已有30多个国家在互联网上开放共享本国的公共信息。我国也会随着信息开放这个趋势,由政府带头,面向全社会开放公共信息,逐渐消除各部门、各领域广泛存在的“信息孤岛”现象,促进信息的公开与自由流动。例如,原来一些政府部门不愿公开自己的数据,但现在开始寻找数据交换伙伴,因为他们逐渐意识到消除数据孤岛已经成为一种发展潮流,无论是对自身还是对其他共享者而言,都是有利的。同时,随着各方面政策的引导,打破数据壁垒对大数据的共享是有力的支持。

3.5网络信息资源安全与产权保护

由于互联网的开放性与共享性,网络信息资源安全与保护给人们带来巨大利益的同时也带来了很多的弊端。网络上信息获取方式的便捷性使信息资源在存储、利用和传输过程中都有被盗用、泄露或篡改的可能。关于网络信息资源的安全,我国要建立统一规划的安全管理体系,迅速完善信息资源系统。在技术上要注意运用多样的信息安全防护技术和工具,注意使用先进的防火墙软件,加强对网上入侵的检测控制,保障信息网络使用安全。为保护著作者的合法利益不受损失,对于产权的保护,我国要更多地依靠产权立法和网民信息道德的培养。我们要利用法律手段来保护网上信息资源的安全,使得大数据时代的信息资源更好地为网民服务,朝着正确的轨道发展。全球著名的管理咨询公司麦肯锡是最早提出“大数据”的,该公司在报告中指出:数据,作为重要的生产因素,已经渗透到当今各个行业和业务职能领域中。网络信息资源的管理与利用是大数据背景下的一个综合性问题,涉及政治、技术、经济及文化等多种因素。在大数据时代,深度开发、利用网络信息资源,使网络信息资源服务于网络协同创新,促进知识创新和技术创新。未来,大数据正在对每个领域造成影响,在商业、经济和其他领域中,决策行为将基于数据进行,而不再是凭借经验和直觉。大数据正在成为政府和企业竞争的新焦点。随着网络技术的不断发展,网络信息资源的管理与利用方式一定会越来越完善,并朝着更有利于人类的方向发展。

作者:黄双颖 单位:南京邮电大学管理学院