大数据技术论文范例6篇

大数据技术论文

大数据技术论文范文1

关键词:图书馆 大数据 体系构建 学术环境 战略思考 分析 探究

中图分类号:G250 文献标识码:A 文章编号:1672-3791(2017)02(c)-0003-02

随着我国信息技术以及网络化的不断发展,信息量的增加和数据类型的增长已经逐渐超出了人们的承受范围。这样一来造成的后果就是全球近80%的数据都没有得到真正的利用,而70%的数据都是非结构化的数据和半结构化的数据,最关键的是这一比例仍旧在不断增长当中。信息量也逐渐呈现出了指数级的增长,数据结构的复杂化逐渐脱离了人们的实际控制。在这样的一种大背景下,对图书馆的知识服务体系进行变更和完善是非常有必要的,而且对其进行更新也有助于以大数据为基础的科学研究和新型知识服务范式的形成,但是从目前的实际情况来看,现阶段实行的信息技术以及信息管理模式并不利于大数据的获取和形成,最主要的是它还面临着技术落后、人员队伍不适应重大灾难性危险等问题。

再加上已有数字图书馆的相关建设需求以及构建模式都面临着被新知识服务需求与服务模式所取代的危机。数据量的不断增长也使得数据的结构变得日益复杂化,使得图书馆的知识服务体系逐渐成为半盲区。因此在这样的时代背景以及图书馆发展背景下,开展图书馆大数据体系构建的基础理论与实践研究工作是非常有学术价值的。

1 大数据体系构建的学术环境

1.1 发展历程

大数据这一概念由来已久,其发展历程非常独特,我们这里所说的大数据并不是指海量的数据和超大规模数据,但是从字面上分析的话,其实二者之间的区别不是很大,从数据管理技术发展的角度来分析二者之间的联系,对于研究人员进一步理解大数据的概念以及相关的技术问题都是非常有帮助的。

1.2 大数据理论与应用研究发展

从数据发展的历程角度就断定大数据的出现是不客观的,研究人员还需要从更多的角度和层面来考虑大数据这一全新的理论技术,笔者此次主要对大数据理论与应用研究发展进行详细的分析,以此来感受大数据体系构建所处的学术环境。虽然说大数据技术与实际理念之间的冲击的确能够让图书馆知识服务受众、供应者以及运营者本身得到充分的体现,而且还能够通过对结构化以及非结构化数据的常规分析,实现对图书馆知识服务创新能力的有效性分析。但是大数据对于图书馆来说,并不意味着所有,也不是一蹴而就的,一般大数据处理以及管理技术都是处于诱发阶段,距离真正投入到实施中还有很长的一段时间,也就是说二者并不是等同的,这段时间是研究人员建立图书馆大数据体系的重要阶段,同时也是图书馆研究人员非常重要的缓冲时期。

2 图书馆大数据体系构建战略思考研究

2.1 大数据对图书馆的影响

在对大数据进行分析和应用的时候,研究人员就要首先考虑图书馆大数据体系构建以及图书馆的信息职能服务问题,目前我国对大数据工程技术的研究已经领先于大数据科学研究,而大数据科学研究也走在了大数据知识服务体系的前面。当前,很多工程领域专家都是以自我的认知为中心来处理图书馆领域的大数据信息。而信息领域的专家则起到辅助的作用,在与应用领域的科研人员进行合作的时候,主要解决的是应用领域大数据处理的相关技术问题。而信息服务领域的专家则暂时独立于大数据知识服务体系之外。这样一来也就使得大数据知识服务体系的运用被推迟了5年左右。也正因为如此,图书馆大数据问题成为了当前研究的热点问题。

由此可见,如果想要研究大数据对图书馆的真正影响,就绝对不能简单地将图书馆看做一个单独的个体进行分析和讨论,而是要结合图书馆当前所处的学科背景以及研究背景等多个方面进行综合考虑。

大数据对图书馆的影响并不是单纯地体现在技术手段上,由于图书馆所处的时代背景和学术背景都属于有机整体,而大数据理论与应用研究对整个图书馆的影响是由内而外的,所以说大数据对图书馆的信息资源以及图书馆领导以及管理者甚至建筑设备都会产生直接的影响。

2.2 图书馆的相关应对措施

在大数据的引领下,图书馆运营体系也迎来了全新的机遇和挑战,图书情报领域要从自发到自觉、局部到整体,全方位地实施管理应对措施。只有这样才能够有效地应对当前图书馆大数据体系构建的实际社会需求以及科研发展带来的挑战。图书馆要想合理地构建大数据生态体系,就一定要做好以下应对措施。

第一,图书馆的领导层和管理人员在制定大数据的全局战略规划时,一定要根据不同的情况来创建大数据战略角色定位,并结合图书馆所处的实际地理位置,综合各方面因素来制定分层、分级的实施策略,进而有效协调,创建大数据知识服务纲要。

第二,图书馆一定要在思想意识形态以及技术手段、服务技能等方面进行全面的提升,我们的图书管理人员除了要掌握图书馆学、信息管理学等专业的理论知识以外,还要熟练地掌握信息科学、教育学、心理学等学科知识,尤其是大数据、云计算、移动互联网等基础的理论和技术。进而树立一个嵌入式的知识合作服务理念。

第三,研究图书馆大数据体系构建的要素以及驱动因素主要是从环境架构、战略架构以及业务架构等方面来探索图书馆大数据体系构建的相关理论及应用研究,探究图书馆在促进大数据科研发展中应该发挥的具体作用和地位。

第四,研究人T还要研究支持图书馆大数据体系的知识服务环境。作为集数据、工具、平台等于一体的知识服务环境,除了具备学术搜索、知识服务行为分析以及决策等功能以外,还要实现与传统图书馆自然环境、人文环境以及技术环境的无缝对接。

第五,按照图书馆大数据的数据全生命周期来进一步实现图书馆大数据的获取、存错、组织、分析等功能,结合大数据的来源以及用户的实际服务需求来解决主要的技术型问题,进而提出科学系统的基础理论体系。

第六,我们还要研究图书馆大数据的技术型人才以及服务型人才的主要培养方案,着重分析这类人才的知识结构以及专业技能,将培养计划真正付诸实践,为今后图书馆大数据体系构建提供有用的人才,除此之外,还要从大数据的源头抓起,进一步提高全民的数据素养以及数据的方法和方式。

2.3 ν际楣荽笫据体系构建的几点思考

从客观的角度来说,目前还是有很多人对大数据产生质疑,正如图书馆技术出现之后,图书馆界也出现了很多质疑的声音,认为图书馆技术在今后的发展中不会占据任何优势,而图书馆人员在研究大数据的时候也同样遭受到了此类质疑,基于此,笔者针对图书馆大数据体系构建阐明以下几个观点:(1)大数据体系只是一种全新的图书馆管理体系,它并不代表对图书馆所有的传统信息服务模式和信息技术都进行替换,大数据体系主要是在已有的信息服务模式基础上,对信息技术和人文情怀进行完善和补充,就好比我们将当前的数字图书馆、移动图书馆以及云图书馆进行整合。大数据体系作为信息资源管理技术的标准,并不意味着后续的技术会完全取代传统技术手段,技术体系以及人文情怀的渗透和融合在大数据体系中的运用也是非常有意义的。(2)在面对大数据的挑战时,图书馆领域有责任承担起图书馆大数据体系构建的重任,尤其是图书情报领域中处于一线的科学技术研究人员以及图书馆情报学家,他们的贡献和付出使得图书馆的整体发展有了极大的进步。

3 结语

我们这里所说的大数据不仅是数据量的增长,而是信息技术的更新和人类对客观世界认知程度的不断提升,对大数据基础理论知识的应用进行有效的分析和研究将会极大地推动图书馆情报学等学科的发展,而且也为社会以及所服务的机构提供了更加先进的知识服务机会,但是需要注意的是,我们所面对的不仅仅是图书馆新型知识服务体系构建上的变化,还要综合考虑由量变到质变,由局部到整体的图书情报领域观察模式的转变,大数据有可能会引起图书馆生存方式以及生存方法上的改变,所以我们一定要充分发挥自身的知识水平,支持图书馆大数据体系构建的基础性研究,不断增强学科内以及学科之间的学术交流。

参考文献

[1] 冯晴君.“云图书馆”环境下的地方文献工作新模式――以“贵州数字图书馆”和“珠江三角洲数字图书馆联盟”为例[J].贵图学刊,2012(3):1-3.

[2] 蔡津津,郜新鑫,付建俐.基于业务元数据标准化的金融财经数据仓库及服务系统架构探讨[C]//中国新闻技术工作者联合会2012年学术年会、五届四次理事会暨第六届“王选新闻科学技术奖”的“人才奖”和“优秀论文奖”颁奖大会论文集.2012.

[3] 张丽丽.科学数据与数据科学小议[C]//安徽首届科普产业博士科技论坛――暨社区科技传播体系与平台建构学术交流会论文集.2012.

[4] 王红会.图书馆动态WEB数据库应用[C]//图书馆改革与发展――陕西省社会科学信息学会第六次学术讨论会论文集.2003.

[5] 张侠.浅谈现阶段图书馆的数字化建设[C]//陕西省图书馆学会第五次会员代表大会暨学术研讨会与全国图书馆部室主任工作、学术研讨会论文集.2003.

[6] 闫贵恩.回顾与展望――中国图书馆事业百年――图书馆数字化与现代化服务[C]//中华医学会第十次全国医学信息学术会议论文汇编.2004.

[7] 贾怀忠.高校图书馆电子阅览室的建设与管理[C]//拓展与深化――全国民办高校图书馆与图书馆地方文献工作研讨会论文集.2005.

[8] 支晓红.新建高职高专院校信息资源建设的策略[C]//拓展与深化――全国民办高校图书馆与图书馆地方文献工作研讨会论文集.2005.

[9] 郭嘉.浅谈新时期高校图书馆网页制作[C]//图书馆与人文精神――陕西省社会科学信息学会第八次学术讨论会论文集.2006.

大数据技术论文范文2

了解和把握查新课题的科学技术要点是保证查新质量的重要环节,其中包括以下几个步骤。1.1了解课题所涉及的技术概况通过如百度文库、词典、维基百科等互联网资源,是获取信息技术相关信息的捷径。重点了解该类课题相关概念的涵义、特点、所涉及的关键技术、发展进程等。1.2明确查新项目的核心内容此类课题更多地为新信息技术在生物医学中的应用,因此查新人员必须弄清应用范围、待解决的核心问题。1.3与委托方交流讨论通过与委托方的交流讨论,构建检索思路。1.4必要的文字修订与表述规范新的技术名词很多为国外引进,国内可能尚未规范,因此要考虑全部可能的表述形式,必要时对技术要点进行相关修正[8]。

2准确、全面选择检索资源

信息技术类查新项目具有一般生物医学查新项目的共性,同时更多体现出学科交叉的特殊性。因此选择检索工具除常用的生物医学数据库资源外,应重点关注综合性数据库、专利文献及信息技术专业信息资源。

2.1必检数据库

一类为常用的生物医学数据库,如CBMWEB、CMCC、PUBMED、EMBASE、BIOSISPREVIEW等。但由于此类查新项目涉及多学科,仅仅检索上述生物医学类数据库是远远不够的,必须扩大检索资源范围,特别是一些综合性数据库。国内综合性数据库主要有CNKI系列数据库、维普《中国科技期刊全文数据库》、万方《数字化期刊全文数据库》。这3个综合性数据库中不仅包含生物医学期刊专辑,还有电子技术及信息科学专辑,是查找此类课题必不可少的资源[9]。国外综合性资源库(如Webofscience)及工程类数据库如美国工程索引数据库(EI)、英国科学文摘(INSPEC)等。学位论文所研究的课题在本专业领域具有新颖性与开创性,信息技术类的学位课题大多是针对解决某一特殊问题而开展的,且博士学位论文在研究深度上尤其见长。上述特点与信息技术在生物医学中的应用特性相吻合,因此,可以把学位论文作为信息技术类项目查新的重要资源。国外学位论文数据库以PQDD数据库为主,国内学位论文主要依靠万方数据的《中国学位论文数据库》。CNKI的学位论文数据库则以收录有博士学位授予权单位的博硕论文为特色,此外,尚有中科院系统的学位论文数据库、CALIS系统的学位论文数据库。

2.2辅助数据库

一是专利文献数据库。信息技术类课题中相当一部分为产品或实物,因此专利文献检索工具是不可或缺的。如“便携式近红外脑血氧监测仪的研制”、“心理素质选拔与心理健康测评咨询平台研究”、“社区医师培训管理信息系统”,或为信息技术装备的实物,或为独立的信息管理系统与平台,均需查询专利文献。中国专利的检索主要依靠国家知识产权局提供的专利文献检索服务,该网站权威性高,且可免费提供专利全文。国外专利检索主要依靠世界专利数据库、美国专利数据库、欧洲专利数据库及日本专利数据库等。二是其他专业数据库。如IEL全文数据库和ACM(美国计算机学会)期刊数据库。

2.3检索思路与技巧

检索信息技术课题,检索词的选取非常重要。信息技术的发展日新月异,而主题词的发展有时滞性,因此检索策略中应更多地采用关键词。如课题“基于Multi-Agent技术的医疗信息整合研究”中,Agent是人工智能领域的专业术语,它是指驻留在某一环境下,能持续自主地发挥作用,具备驻留性、反应性、社会性和主动性等特征的计算实体。Multi-A-gent技术又称为“多Agent”,在人工智能领域翻译为“多智能体”,主要是研究多个Agent之间如何相互协作、相互支持以完成系统的共同目标,它特别适用于物理分布或逻辑结构上具有分布性特点的应用领域[10]。因此,“Multi-Agent”、“多Agent”和“多智能体”都是该课题的关键词。医疗信息整合(Integra-tingtheHealthcareEnterprise,IHE)医用信息系统集成、医疗企业整合等是一项推进整合现代医疗保健机构信息系统的倡议。但是通过对该课题的研读,我们发现课题中并没有涉及这方面的内容。也就是说,医疗信息整合在该课题中并非专有名词,因此,需要将医疗信息整合拆分为医疗和信息整合。信息整合又可表达为信息资源整合、信息集成等,这些都是关键词。在该课题中,我们需要采用Multi-Agent、多Agent、多智能体,医疗和信息整合、信息资源整合、信息集成这些关键词进行组配检索。

大数据技术论文范文3

关键词:计算机;数据库;信息管理;应用

信息时代飞速前行,因而单位或个人都有很多数据进行系统化管理,故而数据库管理技术成为比较常用的技术之一。该技术有广泛的应用前景,能够使用在经济、政治和文化领域内,在发展中给人们生活带来诸多便利。因此,需高度重视计算机数据库的信息管理应用要素,不仅将数据库看成是一项管理技术,更要将其看成是一种管理方法,通过应用该技术能有效提升工作效率,让工作更高效和准确。

1计算机数据库技术特点

1.1组织性

数据库的构成不是杂乱无序,而是有一定内在联系,相同数据库之间的文件有着内在的联系,并按照一定的关系形成组织结构。故而从总体角度考虑,认识同一个集合中的数据都有着相似的特点。

1.2共享性

共享作为数据库的主要特征之一,更是数据库建立的关键性要素,如果数据库不具备共享性能,那么数据库存在的价值将会大大打折[1]。具有共享性能的数据库,不但能够为单位内的各个部门以及个体提供数据共享资源,并且这些资源可以被不同的单位、地区与个体共同享用。

1.3独立性

数据库的独立性主要涉及两大方面:一方面是逻辑独立性和物理独立性,另一方面是逻辑独立性让数据库的总体结构产生质的变化,能够变革数据库的逻辑关系,其中包括于数据定义的修改、新数据类型变化、数据之间的逻辑变更,但是这些都要在修改原有数据程序的基础上进行;另外,物理逻辑性主要是指数据存储结构产生的变化状况。例如,更换物理的存储设备、位置、方法等,故此数据的物理结构变化对数据的逻辑变化影响不大,更不会引发应用程序的变革。

2计算机数据技术应用于信息管理中的现状

2.1应用范围广

1)计算机技术结合数据库技术能够有较好的生命力,并能迎合广泛的市场前景。2)在计算机应用范围逐步扩大的情况下,目前已经涉及到多个行业包括与工业、农业、商业等相关专业,在相关管理信息不能及时更新的前提下,信息管理效率将无从提升。3)应用数据库技术的优势是,为很多行业提供相关的信息技术保障,带动行业的生产发展,提升行业的管理水平。4)由于计算机数据库的适用性较好,故而在实际应用的过程中能提出较多的优势,进而得到同行业的认同,这将有助于计算机数据库的技术与实践理论提升。

2.2发展态势强劲

1)计算机数据库发展的优劣与否,能在实际使用中展现出来,由于计算数据库的应用效果能够体现出数据管理的重要性,故而判定数据库的优劣对信息技术有着至关重要的影响。2)数据库技术的发展与数据技术的发展有着极为密切的联系,数据库技术从产生到发展已经历十几年的发展历程,可以分为四个主要发展阶段,初期是网状数据库,然后提升为层次数据库,最后变化为关系数据库,目前发展为对象数据库[2]。3)数据库的发展历经不断实践和成熟磨练阶段,在发展逐步成熟起来,并且发展过程中适用性以及可操作性较强,因而这种适用范围更大,更具快捷和可操作性,并能为数据的后期发展提供更为强劲的动力。4)结合当前的发展状况获悉,发展中关系数据库与对象数据库适用最多。

3数据库技术在信息系统中应用的改进措施

3.1提升数据库的安全系统性

计算机数据库的系统安全技术与计算机安全、计算机数据库技术有着紧密联系,当前部分用户在使用时出现安全意识薄弱的情况,故而需要通过安全系统技术的建立帮助用户做好信息把关。加之部分用户在日常使用中不重视网络安全问题,导致安全措施不能真正的落实下去,故而发生很多安全事件。就此,数据库的安全性是数据库系统的生命而存在,如果数据库系统安全那么存储在其中的数据信息也将安全,能保有内部数据的机密性。数据库技术的应用涉及到很多重要的商业利益,因而需加大数据库安全性能,并将数据安全看成计算机安全技术的关键构成部分。但是数据库安全薄弱的环节主要是在数据共享方面,因而关注的重点则集中在数据共享保障上,为保数据库的安全就需要确保数据库安全技术,并解决其中可能出现的泄密环节,这是安全技术推行的重要解决难点。

3.2数据系统理论实践结合

计算机数据系统的理论需伴随着计算机技术、数据库原理等方面的发展而发展,因而在发展中需要理论与实际相结合,目前计算机系统理论更新换代较快,故而可以将研究的最新成果应用在实践指导上面,进而提升实践的科学性能[3]。另外计算机数据库系统理论研究要将实践看成研究的基础,理论只有通过应用才能体现其价值,很多理论研究在理论上有可行性,但是如果进行实际应用则会有很多脱节的环节,因而应结合理论做好实践,让理论与实践相结合,最终提升计算机数据库系统理论研究的针对性。若计算机数据系统有较好的适用性,那么也就决定计算机数据库未来将有良好的发展前景,并且在研究中不断的努力,力求让数据库更快成长,以期计算机数据系统在将来有更好地发展,安全高效地应用在信息管理系统内。

4结束语

伴随着计算机数据库技术以及信息管理技术的前行和发展,计算机数据库将在信息管理中有着广泛地应用,故而在实际工作中,应加强关于计算机数据库与信息管理结合的探究,让两者之间相互配合相辅相成,利用两者的优势,让理论结合实践,在创新发展中,满足两者的应用标准,实现计算机数据库技术的合理应用。

作者:祁贝贝 单位:新乡职业技术学院

参考文献:

[1]钱平生.试析计算机数据库技术在信息管理中的应用分析[J].电脑知识与技术,2015(9):3-5.

大数据技术论文范文4

关键词:高校图书馆;特色数据库;数字化建设;数字技术;数字信息资源 文献标识码:A

中图分类号:G258 文章编号:1009-2374(2017)02-0189-02 DOI:10.13535/ki.11-4406/n.2017.02.091

伴随着现代数字技术的突飞猛进,高校数字图书馆建设也已经达到相当发展程度,用户对数字信息资源在数量上、质量上和技术上的要求都日益提高,特色数据库建设因此成为了高校图书馆数字资源建设的重要组成部分。建设特色数据库、提供特色服务已经成为了国内外高校图书馆的奋斗目标和研究对象,在实践和理论上都取得了长足进步,本文的研究着眼于理论上的总结和研究综述。

1 特色数据库概述

1.1 特色数据库的概念

高校图书馆特色数据库是指高校图书馆利用所在地域优势、历史文化资源,在本校特色学科和馆藏资源的基础之上,通过先进的数字技术和优秀的专家团队,对某一学科或某一专题的信息进行收集、整理、分析、评价、整合、存储,并按照一定标准和规范将其数字化而形成的以满足用户个性化需求并可以被用户快速方便检索利用的一种网络信息资源库。

1.2 特色数据库的类型

1.2.1 按特色数据库资源类型划分。高校图书馆的信息资源类型多样、数量庞大,特色数据库中的资源除了传统的纸质资源,还包括图书馆已引进的数据库资源、图片资源、视听资源、网络资源等。根据资源内容的类型可以分为以下四类:

(1)文本资源特色数据库:文本资源很多是图书馆根据本馆或者本地区的特色纸质资源扫描、复印转化成的数字化资源,这部分资源在有关古籍特色的数据库中占有比较大的比例,也是特色数据库资源的重要组成部分。

(2)图片资源特色数据库:在很多特色数据库中都有大量的图片资源,尤其是有关人物纪念的特色数据库,这些图片经过扫描、处理后,再进行数字化处理,转换成计算机能够识别的数字信息,经过分类、整理,成为特色数据库中的特色资源。

(3)视听和多媒体资源特色数据库:在图书馆信息资源中,视听和多媒体资源所占的比重越来越大。这些资源包括图书馆自身自建、购买的音频、视频资源,通过交换、捐赠等形式获得的音频、视频资源,还有目前各高校图书馆自建、购买的多媒体数据库等。这些经过处理的数字化多媒体资源,具有强烈的视觉冲击力,具有更形象、更具体的表现形式,被越来越多的图书馆用户开始使用,并在逐步减少纸质资源的使用。由此可见,视听和多媒体资源也是特色数据库的重要组成部分。

(4)网络资源特色数据库:很多高校图书馆把网上的资源加以整合、提供链接供图书馆用户使用,网络用户可以登录付费使用,高校图书馆可以购买这类型数据库,充实馆藏资源,建立相应的本地镜像站或者提供中心站检索服务,虽然图书馆不拥有这些资源,但图书馆用户可以免费使用这些网络资源。

1.2.2 按特色数据库资源内容特色划分。根据数据库资源内容特色的不同可以分为馆藏特色数据库、学科特色数据库、地域特色数据库、民族特色数据库以及其他专题数据库。我国高校现在的特色数据库一般类型有馆藏特色数据库、学科特色数据库、名人专家数据库、地方特色数据库以及一些其他专题数据库。

1.3 高校图书馆特色数据库发展的意义

高校图书馆特色数据库是将实体特色馆藏资源数字化,或将古籍善本、孤本等珍贵文献数字化保存,或将分散在各学科、各d体上的资源有效科学合理的整合在一起,并且通过现代化的网络技术、通讯技术等传播利用。高校图书馆特色数据库的建设加快了高校图书馆数字化、现代化的进程,是图书馆适应新形势的重要举措,是图书馆适应新形势的需要和必然选择,具体来说,它在很大程度上提高了图书馆的服务水平、服务效率和用户满意率。用户是图书馆资源建设和服务的推动者和最终受益者。高校图书馆特色数据库是按照用户的需要和习惯,将学校独有的信息资源加工整理数字化,并通过符合当今用户习惯的网络、移动通信等方式传播给用户,供其检索和利用,最大程度地满足用户的个性化需求,节省用户的时间,提高学习工作的效率。

高校特色数据库的用户不再仅仅局限于本校师生用户,越来越多地扩展到社会上,这就在很大程度上扩大了图书馆的服务对象和服务空间,使得特色资源在全社会范围内实现共享,推动了我国数字资源的建设进程,让资源在更广阔的范围内得到优化配置。

2 国外研究现状

国外对特色数据库的研究和实践都已经相对成熟。国外对于特色数据库的研究始于20世纪80年代,一开始的研究也主要集中在理论的探讨和特色数据库的介绍上,之后大规模的数据库开发建设实践兴起,内容涉及了商业、新闻、综合、科技、工程、法律、医学、生命科学、人文科学、社会科学及各种交叉科学等,不仅有单一学科还有交叉性综合学科,不仅涉及到了本地区本国的历史传统、文化文明,还收集了他国经济历史文化等相关资料甚至还有一些珍贵资料和古籍史料,如耶鲁大学图书馆建有15个特色图书馆,其中Lewis Walpole Library收藏了18世纪英国的书籍、手稿、印刷品、素描、水彩画和油彩画等珍贵资源;形式从原来的单一的文字、图表,扩展到了声频视频等多媒体特色数据库;从加工层次来看,全文的、事实型还有目录、文摘、索引等二次文献特色数据库。美国高校图书馆的特色数据库研究和实践处于世界领先水平,它们非常重视用户对于特色数据库资源的需求,Michell Visser提出高校在建设和开发特色信息资源,提供特色服务时要首先考虑用户的需求。J.Gakobo在“特色馆藏在高校图书馆中的作用”一文中,指出特色资源的建设要以服务于学校的教学、科研、特色服务以及未来高校的发展。

3 国内研究现状

笔者通过对CNKI数据库中相关文献进行检索,限定在2003~2013年,以“特色数据库”为主题,共检索出论文3505篇,以“特色为数据库”和“高校”为主题,共检索出论文1356篇,并且纵观的数量,随着时间发展基本呈逐步递增状态,无明显起落,可以看出特色数据库研究已经不是一个新的议题,而高校图书馆特色数据库建设的研究在这十年间,历经了从有到无,到形成一定规模的过程。梳理分析这些文献,发现对其的研究主要集中在以下五个方面:

3.1 基础性理论方面

在研究初期多为理论上的初探,后来伴随着我国高等教育文献保障系统CALIS启动后,支持了一批特色数据库建设项目,理论研究随着实践的发展而日渐深入。相关理论研究不再只局限在可行性、必要性等一些条件性理论的研究上,有关定义、原则、建设意义、存在问题、相应对策等的研究慢慢增多,后来有了关于高校图书馆自建特色数据库建设标准、建设规范的研究和制定,并日臻完善。

3.2 技术方面

笔者查询检索到的所有文献资料,发现纯粹介绍研究特色数据库技术的文献很少,仅有朱道勇在《高校图书馆特色数据库建设技术研究》中,专门讨论了信息采集的扫描技术、光学字符识别技术、音视频捕捉技术;信息资源加工过程中一般涉及到的自动标引技术、人工标引技术和元数据技术等;信息存储过程中的直接连接存储、网络连接存储(NAS)、存储区域网络(SNA);信息检索过程中的全文检索和智能检索技术;信息过程中PULL和PUSH技术等。其他涉及技术的文献多是以一个建设案例为代表,分析特色数据库系统的相关技术、性能。或者是一个新技术作为切入点,研究该项技术在图书馆特色数据库建设过程的应用和兼容。如吴涛的《拓片著录与网络利用技术在现代图书馆中的应用》、宋欣等的《运用ASP和SQL技术创建及备份图书馆自建特色数据库》等。

3.3 实践调研方面

在这方面的研究主要集中在对某省市、地区特色数据库的调研、统计、分析。比如《东北地区高校图书馆特色数据库建设现状的调查与分析》《江西高校图书馆特色数据库的现状和发展方向》《四川高校图书馆自建特色数据库调查分析》;这类型实践调研的目的和实际落脚点一般在于区域特色信息资源的共建共享,这也遵循了特色数据库建设的原则和目的,是值得研究和讨论的现实问题。对某一专业领域或某类型高校图书馆所建有的特色数据库的统计分析;《国内工学十强高校图书馆特色数据库建设浅探》《“211工程”高校图书馆特色数据库现状分析》等。这类研究有利于特色信息资源在行业内或同类型用户之间的有效利用和流动,节约时间成本和经济成本的同时促进了资源的合理配置和共享。

3.4 建设评估方面

对于高校特色数据库建设的系统评估研究基本上是基础理论发展到一定程度,结合特色数据库实践的迅速发展而兴起来的,同时也伴随着高校以及高校图书馆各种评估而进行和发展的。如《高校图书馆特色数据库建设评估研究》中涉及了高校特色数据库评估的基本问题研究、评估标准研究、评估模型和目标研究以及评估指标体系的研究等;此外还有《高校图书馆特色数据库建设评估指标体系的探讨》对高校特色数据库建设的评估指标体系做出了专门系统的研究。

3.5 其他方面

除上述研究以外,学者们还对特色数据库建设过程中的版权问题以及以此而开展的特色服务进行了研究探讨。

笔者总结高校特色数据库的相关理论,综述国内外高校特色数据库的发展研究情况,希望为我国高校特色数据库的发展奠定一定基础。

参考文献

[1] 李冬.关于985高校图书馆特色数据库建设的调查[J].科学家,2016,(5).

[2] Michell Visser.Special Collections at ARL Libraries and K-12 Outreach:Crrent Trend[J].The Jouranl of Academic Librarianship,2006,(3).

[3] J.Gakobo.The Role of the Special Collection in the Academic Library[J].Academic Press Inc,1985,(17).

[4] 朱道勇.高校D书馆特色数据库建设技术研究[J].内蒙古科技与经济,2009,(5).

[5] 吴涛.拓片著录与网络利用技术在现代图书馆中的应用[J].图书情报工作,2010,(3).

[6] 宋欣,等.运用ASP和SQL技术创建及备份图书馆自建特色数据库[J].牡丹江大学学报,2007,(5).

[7] 王茹.江西高校图书馆特色数据库的现状和发展方向[J].图书馆学研究,2010,(12).

[8] 陈京莲,罗红.江西高校图书馆特色数据库的现状和发展方向[J].图书馆学研究,2012,(8).

[9] 冉小波.四川高校图书馆自建特色数据库调查分析

[J].图书馆学研究,2009,(10).

[10] 段运国.国内工学十强高校图书馆特色数据库建设浅探[J].图书馆学研究,2010,(2).

[11] 云广平,等.“211工程”高校图书馆特色数据库现状分析[J].电子科技,2013,(5).

[12] 王启云.高校图书馆特色数据库建设评估研究[J].新世纪图书馆,2012,(3).

大数据技术论文范文5

论文摘 要 智能交通系统 (ITS) 是集成于信息技术、传输技术、电子技术、及计算机处理技术等多种类电子工程技术,而建立起的实时、高效、准确的综合运输和管理体系。其中,数据压缩和数据融合技术使得ITS技术更具有现实意义。本文基于智能交通系统中信息的特征,探讨了数据压缩和数据融合技术涉及的关键技术及要求,分析了技术应用及现实突破。

1 ITS信息及特征分析

1.1 智能交通信息(ITS)

交通系统由包括4个基本要素:人(交通出行者、驾驶员和管理者)、物(货物)、各类交通工具和相应的交通设施构成。交通信息是指所有与交通系统的四大要素相关联的信息,是ATMS的关键基础。面向ATMS的基础交通信息主要是指与交通运行状态和交通管理有关的交通信息,是交通信息中最直接、最基础的信息。基础交通信息包括基础交通地理信息、交通实时状态信息、交通控制和管理信息、交通政策法规信息、公共交通信息。

1.2 基础交通信息的属性特征

基础交通信息是一种在大范围内、全方位发挥作用的,实时、准确、高效的综合运输和管理系统,其应具有以下一些基本属性特征:1)准确性;2)及时性;3)共享性;4)信息的采集具有实时性和动态性;5)具有海量信息特征;6)增值性。

2 数据压缩处理技术

交通信息一方面时采集到的信息烦杂多样,要想利用这些不同类别的信息,需采用不同的处理方法;另一方面,交通信息的一个显著特征是它的空间性和随机性,因此对它的研究分析需要建立在广泛统计的基础上,应用各类信息处理技术和统计分析方法来探索它的规律性。

所谓多媒体技术就是能对多种载体(媒体)上的信息和多种存储(媒质)上的信息进行处理的技术,特点主要表现在它的综合性和交互性。交通信息是属于多媒体信息范畴。若要实时的综合处理声音、图像、视频、文字等多媒体信息,其数据量是非常大的。要传输或存储这样大的数据量是非常困难的,必须对其进行压缩编码,在满足实际需要的前提下,尽量减少要传输或存储的数据量。

数据压缩主要依靠信源编码技术。一般的,图像压缩技术可分为两大类:无损压缩和有损压缩技术。在多媒体应用中常用的压缩方法有PCM(脉冲编码调制)、预测编码、变换编码、插值和外推法、统计编码、矢量量化和子带编码等;混合编码是近年来广泛采用的方法。新一代的数据压缩方法,如基于模型的压缩方法、分形压缩和小波变换方法等也已经接近实用化水平。

3 信息融合技术

信息融合技术在单纯数据采集融合(即一次融合)阶段称为数据融合,是研究多种信息的获取、传输与处理的基本方法、技术、手段以及信息的表示、内在联系和运动规律的一门技术。融合是指采集并集成各种信息源、多媒体和多格式信息,从而生成完整、准确、及时和有效的综合信息,它比直接从各信息源得到的信息更简洁、更少冗余、更有用途。

先进的交通管理系统(ATMS)是一个典型的多传感器系统,信息融合技术给交通信息加工和处理提供了一种很好的方法,信息融合技术的最大优势在于它能合理协调多源数据,充分综合有用信息,提高在多变环境中正确决策的能力。

在信息融合领域使用的主要数学工具或方法有概率论、推理网络、模糊理论和神经网络等,其中使用较多的是概率论、模糊理论、推理网络。当然,除了这几种常用的方法之外,还有其他很多解决途径。

3.1 概率论

在融合技术中最早应用的就是概率论。在一个公共空间根据概率或似然函数对输入数据建模,在一定的先验概率情况下,根据贝叶斯规则合并这些概率以获得每个输出假设的概率,这样可以处理不确定性问题。贝叶斯方法的主要难点在于对概率分布的描述,特别是当数据是由低档传感器给出时,就显得更为困难。另外,在进行计算的时候,常常简单地假定信息源是独立的,这个假设在大多数情况下非常受限制。卡尔曼滤波方法则根据早先估计和最新观测,递推地提供对观测特性的估计。另外,概率论和模糊集理论的综合应用给解决多源数据的融合问题提供了工具。

3.2 模糊理论

模糊集理论是基于分类的局部理论,因此,从产生起就有许多模糊分类技术得以发展。隶属函数可以表达词语的意思,这在数字表达和符号表达之间建立了一个便利的交互接口。在信息融合的应用中主要是通过与特征相连的规则对专家知识进行建模。另外,可以采用模糊理论来对数字化信息进行严格地、折衷或是宽松地建模。模糊理论的另一个方面是可以处理非精确描述问题,还能够自适应地归并信息。对估计过程的模糊拓展可以解决信息或决策冲突问题,应用于传感器融合、专家意见综合以及数据库融合,特别是在信息很少,又只是定性信息的情况下效果较好。

3.3 推理网络

推理网络的构建和应用有着很长的历史,可以追溯到1913年由一位名叫John H W ig-more的美国学者所做的研究工作。近来,许多对于分析复杂推理网络的理论往往基于贝叶斯规则的推论,并且都被归类于贝叶斯网络。目前,大多数贝叶斯网络的研究都包括了对于概率有效传播的算法拓展,同时它在整个网络中也充当了新证据的角色。同时贝叶斯网络在许多A1任务里都己作为对于不确定推理的标准化有效方法。贝叶斯网络的优点是简洁、易于处理相关事件。缺点是不能区分不知道和不确定事件,并且要求处理的对象具有相关性。在实际运用中一般不知道先验概率,当假定的先验概率与实际相矛盾时,推理结果很差,特别是在处理多假设和多条件问题时显得相当复杂。

参考文献

[1]杨兆升.基础交通信息融合技术及其应用[M].北京:中国铁道出版社,2005.

[2]史其信,陆化普.中国 ITS 发展战略构想[J].公路交通科技,1998,3.

大数据技术论文范文6

工程管理作为工程科学和管理科学相融合的结晶是面向工程的管理学科,是为了更加有效地利用资源,实现预期的目标,而对工程进行的决策、计划、组织、协调等工作。发展工程管理学科需要深刻的认识工程管理的发展规律,借助可视化信息分析技术,可以进一步明确工程管理理论的主流研究。

一、工程管理和可视化研究的概述

工程管理发轫于上世纪50年代,将网络技术应用在工程项目的控制中,取得了很大成功。工程管理的研究领域比较广泛,具体来说包括了建设施工、工程设计、工业工程、制造和技术生产等等方面。在最初,工程管理只是一个比较狭窄的领域,随后逐渐的扩展到公共政策、组织、技术、网络等领域[1]。50多年来,工程管理的研究历经了从工程管理、研发管理再到创新管理的嬗变历程。在我国,工程管理作为一门学科也具有比较久远的历史,最初只有单纯意义上的土木工程管理,现在已经扩展到更加宽泛的意义上的工程管理。

可视化技术是随着计算机技术的发展而涌现出来的新技术,就是在计算机图形学以及计算机图像处理技术快速发展的基础上逐步发展而来的。这种技术将数据转换成为图形,并且能在计算机屏幕上表现出来,进行交互和处理。可视化技术有着广阔的应用前景,尤其是在图书情报领域应用非常广泛。引文可视化分析技术是可视化技术的重要分支,将大量的抽象数据用直观形象的方法展现出来进行引文分析,使人们直观的观察引文内容。将可视化技术和信息科学、应用数学、共现分析等理论和技术结合起来,就能够用可视化的图谱形象直观的展示学科的核心内容,发展历程、前沿理论以及学科整体的知识架构。

在工具方面,能够进行理论知识图谱可视化分析的软件和程序比较多,但是citespace软件相对来说更容易获取,使用也更加便捷。这种软件不需要把下载下来的原始性文献转换相关矩阵,而是可以对数据库保存下来的数据格式进行直接分析,这样就使数据的处理加工变得更加简单快捷[2]。一般来说,进行工程管理理论研究主流可视化分析都会采用这款软件。

二、数据来源和研究方法

在我国,目前工程管理科学已经形成了比较庞大的学科体系,知识架构也比较复杂,新的理论、新的技术和新的研究方法不断涌现出来,一方面这为我国工程管理理论研究带来重要机遇,另一方面也对工程管理学科进行清晰划分带来了一定难度的挑战。伴随着工程实践和工程管理理论的研究不断深入,工程管理的界限也变得越来越模糊[3]。正因为如此,本文用工程管理的相关期刊对工程管理本文由收集整理学科进行界定和相关研究。由于对数据的分析和处理时进行研究工作的前提,因此对数据来源的界定和遴选需要格外重视。本文分析所使用的是中文社会科学引文索引,也就是cssci,这个引文索引是由南京大学中国社会科学研究评价中心研制和开发的,另一个重要数据源是中国期刊网,是由清华大学中国学术期刊电子杂志社主办。这二者都是我国目前在该领域最为重要的引文信息源。对cssci来说,它遵循的是文献计量学的规律,它的信息源头是在全国2700多种中文社会科学学术期刊中,综合运用定性和定量的方法,精心挑选出那些学术性比较强、编辑规范的期刊。这些期刊中包括了25个大类的500多种学术期刊,涵盖管理学、经济学、历史学、政治学、法学、文学等领域。而中国期刊网是按学科进行划分的,收录了5300多种学术期刊的全文或者是引文,主要划分为理工类、文史哲类、农业类、政治经济和法律类等领域。

在进行工程管理理论研究的时候要综合采用定量和定性的方法,并且更加重视定量的方法,注重用绘制图谱的方式来展现。科学图谱就是包括了共被引分析和词频分析等,对于读者了解学科演进非常方便。词频分析指的是对出现的关键词进行频率上的统计和分析,以查找该领域的研究热点,通过观察关键词的演变分析学科的发展趋势。所谓共被引分析是值得两种文献之间,同时被引用的频率和次数,次数越多,说明这两种文献的关系越密切,背景也越相似。

三、可视化分析的结果

首先是对《管理工程学报》的分析。首先从cssci数据库上下载2008至今的文献数据,在同一个文件夹中用纯文本的方式进行保存,再利用数据转换器将下载下来的文件数据转换成为citespace识别并可以分析的格式。数据来源是文献标题、文献摘要和关键词、主题词类型,在主题词类型项选择名词性短语,开展聚类分析,节点类型上选择主题词和被引用文献,通过运行软件得到了该期刊的共被引和主题词网络图谱。通过这个图谱,我们可以看到,关键节点包括了博弈、物流、协调激励、供应链等词汇,这说明该领域的研究热点是这些关键词背后的课题。研究方法囊括了遗传算法、模型等。另外,委托、自主创新、知识转移等词汇出现的频率也比较高。通过对可视化图谱的分析可知,该期刊作为工程管理理论的重要期刊研究的主题主要涉及了供应链、物流、博弈理论、技术创新等。供应链研究显然是主流性研究;委托、物流等方面也在研究者的视角逐渐受到重视。

其次是对《建筑经济》等其他期刊的关键词分析。在中国知网下载《建筑经济》自2008年以来的文献数据,利用citespace软件在数据转换的基础上进行分析。通过分析可以看出,全过程造价、bt模式、信息化、全寿命周期等词汇是研究工作的关键词,说明这期间的研究热点在这些领域。

不同的期刊往往刊文重点有不同,体现了一本期刊的研究视野各有侧重,因此,工程管理理论研究领域的不同期刊进行可视化分析,能够更加客观全面的掌握工程管理理论研究的主流。对不同期刊的关键词汇内容进行分析,体现了这种相互补充性。《工程管理学报》也是工程管理领域的重要学术期刊,在中国知网上下载2008年以来的文献题录,用纯文本的方式进行保存,再通过citespace软件进行格式转换,最后用citespace进行分析,得出来的结果就是《工程管理学报》在这个期间的研究主流。建筑企业、竞争力、实证研究等词汇出现在结果统计的前列,这与该期刊侧重建筑业工程项目和政府投资项目管理的研究侧重点相吻合。此外,在方法论的层面,层次分析法、模糊性综合评价、系统动力学等成为研究方法的热点,这也体现了《工程管理学报》在研究方法上的独特性。用同样的方法对《科技进步与对策》期刊进行分析,得到的出现频率较高的词汇是自主创新、科技创新、知识产权、知识共享、低碳经济等。这体现了技术创新、知识管理等依旧是该刊关注的前沿。工程管理是一门与时俱进的学科,随着研究的深入新的研究内容会逐渐进入研究者的视野,新的研究方法也会得到更多运用。