档案数字化的关键技术范例6篇

前言:中文期刊网精心挑选了档案数字化的关键技术范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

档案数字化的关键技术

档案数字化的关键技术范文1

关键词:档案;信息化;数字化;档案馆;设想

随着现代社会信息化程度的提高,档案信息化和数字化建设成为档案界普遍关注的问题,它是适应社会信息化发展的必然产物,也是全面提升档案工作为社会服务能力的一个不可缺少的手段。尤其是将来档案信息网络的建设,更是突破单位和行业界限,为当地引进资源,搞活经济提供良好的信息服务软件环境,突破区域界限,实现全社会的档案信息共享,最大限度发挥档案的自身价值。国家档案馆早在2000年的全国档案工作会议上,就正式提出了档案信息化的概念,之后档案信息化、数字化建设在全国各类档案馆和机关档案室中蓬勃开展起来,《档案信息化建设导论》一书对档案信息化和数字化建设是这样定义的:在国家档案行政管理部门的统一规划和组织下,在档案管理活动中应用现代信息技术,对档案信息资源进行处置、管理和提供利用服务。

1 对档案信息化建设的认识

档案信息化建设是档案管理模式从以面向档案实体保管为重点,向以现代化的档案信息实体的数字化信息处理和利用的这种主要形式向社会提供服务为重点的转变过程。但是由于这方面的技术在我市发展时间较短,人们对档案信息化建设的理解和认识上还有一些偏差和不足,在思想观念上还需要有进一步的更新和突破。

第一,更新档案管理的旧有观念。长期以来,档案工作者普遍思想观念比较陈旧,认为档案工作是一个简单的,默默无闻的工作,只要守好摊、看好门,不让档案丢失就行,社会大众也把档案部门看成是一台“文件保险箱”,因此,要真正实现档案信息化,就必须更新档案管理的观念,树立信息意识、服务意识、法制意识、效益意识,通过档案信息服务带动整个档案工作水平的提高。

第二,正确理解现代化、数字化与信息化的关系。档案信息化建设是一个长久的、系统的、庞大的工程,它包括档案信息资源的有序整理,档案信息数据库的建立、档案信息网络的建设以及档案信息资源的最终开发利用。档案现代化是旗帜,数字化是基础,而档案的信息化才是最终的目的,信息化的实现需要有明确的指导思想和领导的重视与支持,需要档案工作人员脚踏实地的工作态度,需要资金和技术的保证,只有把现代信息技术手段的运用与现代信息管理方法的应用有机结合起来,才能确保档案信息化建设取得最优化的效果。

2 我市档案数字化建设进程

过去的纸质档案在多次反复查阅的过程中都产生了或大或小的损伤,利用现代化的技术手段对纸质档案进行全文数据处理就能长久的保管好纸质档案,延长使用寿命。

这几年来,我局领导高度重视档案的数字化建设,投入了大量的人力、物力、财力为我局档案的数字化建设提供了良好的发展空间,多次派干部到省局、黄冈市局以及江汉区、江岸区、青山区等其他的档案管理部门学习档案的数字化处理方法,并结合我馆的实际对麻城市档案馆的重点全宗档案进行了数字化处理,目前已录入目录数据接近100万条,进行全文扫描323万余幅,位居全省前10名,全市机关单位中也有近80家安装使用了科怡档案管理软件,对本单位的档案进行全文数字化处理,这也为我馆将来建设复合型数字档案馆打下了坚实的基础。自2008年我馆搬迁进新馆以来,我馆已逐步使用现代化的管理方法为利用者提供服务,在复退军人档案、婚姻档案、退休干部档案等档案门类中已不需要再到库房翻阅原始文件,而是直接通过科怡管理软件打印出利用者需要的文件材料,既缩短了查阅档案的时间,极大地方便了利用者和档案馆的工作人员,也保护了这些门类档案的纸质材料。延长了他们的使用寿命。

3 未来的复合型数字档案馆

(一)、复合型数字档案馆是发展趋势

随着社会的发展,人们获取信息的方式发生了翻天覆地的变化。档案管理工作将随着信息技术的发展和进步,步入一个新时代。我们可以从信息产业部2001年6月的《国家信息化指标构成方案》中看出我国对档案馆未来建设的发展方向。档案管理工作也将随着社会的发展进入一个新的信息化时代。档案信息已从以往的纸制档案,在质上发生了根本的转变,从最初单一的文字图片资料扩展为音频、视频、数码照片、数据通讯、文件传输、电子邮件、远程登录、网络新闻、压缩和存储技术等各种信息资源。信息资源的重要存储基地,网络也就成为数字化信息资源服务的主要工具,网络上的数字化信息资源的管理就成为建设数字化档案的关键。档案收藏的目的在于利用,档案界理应走在信息时代的前列,顺应时代的潮流,以网络作为一个全新的平台为社会提供档案服务,从现在已进入信息数字化时代,无纸化办公已逐步兴起,建立未来的“数字档案馆”是势在必行之举。

然而数字化档案馆的发展,还需要有个过程,数字化时代传统档案馆不可能消亡,复合型档案馆是档案馆发展模式的现实选择。也就是说,在未来社会里,将会有三种档案馆存在:一是纯数字档案馆,主要是指一些跨馆、跨系统、跨地区的网络档案馆;二是纯传统档案馆,主要是存在于一些基层或经济欠发达地区,这些档案馆将随着社会的发展,其馆藏档案结构也将由纯印刷型档案向印刷型档案与电子型档案并存发展,其档案馆工作将由纯手工操作向逐步实现计算机自动化管理的方向发展;三是传统档案馆与数字档案馆有机结合的档案馆,有数字化程度高的,也有数字化程度低的,这将是目前改进中大量存在的档案馆,这类档案馆就是复合型数字档案馆。

(二)、未来复合型数字档案馆发展前景的设想

未来的数字档案馆可以直接面向最终的档案用户创办自己的电子杂志。 档案利用者在访问档案馆的主页时可以随时订阅,以便定期获取最新的档案信息和馆藏信息。档案馆的电子杂志内容可包括新增加的开放档案目录、新增加的可供网上直接查阅的档案图像信息、本馆新增加的服务内容、国家新近出台的有关档案的政策法规,以及档案简讯、业界动态、热点新闻等。档案馆可以将这些内容通过电子邮件提供给注册用户。另外,档案馆的网页可以相互链接,可以在自己的网页上创办交流园地进行学术交流,可以设立聊天室和留言板,可以接受档案方面的稿件在网上刊登。总之,可以开办的业务不仅仅是对利用者进行查阅取证服务,数字化档案馆将为档案工作开辟了一个全新的天地。

数字化档案馆绝非是在政府上网时创建的网页上加一个选项或链接而已,应该有自己独立的域名和网站。“数字化档案馆”应创建自己独具特色的网页,开发可多级查询档案信息的应用程序,发展注册用户,给予注册用户更多的访问权限或提供更加优质的服务。只要办出特色,吸引档案界和更多的非档案界人士的访问,就会提高了档案馆的影响和馆藏档案的利用率,也有利于提高全民档案意识。社会效益的提高就意味着经济效益的获得。如果档案馆的网页访问量大,广告、合作、赞助等各种经济行为会随之而来,这就会加强档案部门的自身“造血”机能,缓解档案馆常年经费紧张的状况。

随着计算机网络的进一步发展,信息高速公路进一步拓展,复合型数字档案馆将会离我们越来越近,数字化数据、信息将渗透到我们生活的各个领域,任何人和机构只要通过计算机网络,均可拥有和使用数字档案信息。在这个信息化建设的进程中,档案工作会遇到各种各样的困难和挑战,我们将会不断摸索,研究新方法,解决新问题,建设一个符合我市实际情况的复合型数字档案馆。

参考文献

[1]杨公之:《档案信息化建设导论》

[2]陈春红:档案信息化建设初探[J],上海档案,2006(05)

[3]国家档案局颁发的《数字档案馆建设指南》2010年6月

档案数字化的关键技术范文2

【关键词】数字信息化 高校基建档案管理

高校基建档案是高校基建工程施工活动过程中形成的相关材料,这些材料通常是以图表、文字等为载体的。高校基建档案所记录和保存的是高校基建工作的各个过程信息,是基建工程的重要凭证和依据。然而,仍然有许多学校在基建档案管理上做的还不够完善,在管理工作中出现了许多问题,这是由于学校没有正确认清基建档案管理的重要性造成的,由此可见,高效科学地开展高效档案管理工作是极为必要和紧迫的。

一、高校基建档案管理工作的特点

1.独立成套

学校发展过程中的基建档案应当单独整理立卷,而且各个基建项目的档案资料也应该是独立的。基建档案的整理对象是单位工程,应当包含工程各个阶段的依据性文件,具体包括准备、设计、施工以及竣工等各阶段,是一套完整的档案卷宗。

2.来源广泛

高效基建档案的来源广泛主要是因为基建工程项目规模较大,且设计专业因素较多。工程项目的整个过程包括从工程项目筹划到竣工验收等各个阶段,档案材料来源涉及到各项工作的参与,包括设计部门论证、政府部门审批、材料设备单位供货、施工单位施工以及监理单位质检等。

3.实用性

作为高效基础工程设施建设中最为原始的信息,基建档案所承载的是大量关于各种基础设施建设的真实性信息,因此具有很强的实用性,在学校的扩建、解决土地纠纷、新建以及维修等工作中意义重大。

二、高校基建档案管理工作的问题

1.缺乏档案管理意识和规范的归档方法

由于高校基建部门以及相关领导缺乏对高校基建管理工作的认识和重视,因此在很多高校基建档案部门往往存在着“重建设、轻归档”的问题。高校基建档案管理部门往往缺少专业的管理人员,很多管理人员在基建档案管理工作中往往存在不负责任等情况,造成许多基建档案资料不知去向。除此之外,许多高校在基建档案管理工作中,经常会出现图文不符、文档缺失,还有材料缺失导致文档无法正确分类和归档的问题,这些问题严重影响了档案管理工作的正常开展。

2.档案管理缺乏准确性和完整性

高校基建项目从最初到竣工涉及到的领域较广泛、资料来源也比较复杂,而且工程周期也较长,不仅需要从高校内部获得基建档案的内容,往往与政府部门也有较深的联系。高校基建部门不主动对基本建设资料信息进行收集和归档,丢失许多工程建设过程中形成的重要信息资料。在工程建设期间,由于相关档案管理人员缺乏一定的档案管理知识、较强的责任心以及专业的知识,往往会分不清一般资料和重要资料,造成对资料的盲目管理,使得资料的真实性和准确性有所缺失。

3.缺乏科学的档案管理技术

高校基建档案管理的日常工作普遍存在被动、单一的特点,管理人员往往对基建档案进行按部就班地保管、归档和查阅,缺乏一定的热情和积极性,管理工作效率也不高。由于很多高校都将资金重点投放在教学设备和师资力量,而忽略了对高校基建档案管理工作的投入,因此,当前高校基建档案管理采用的是较为落后的管理方式,如人工翻阅模式,对现代化数字信息技术的运用、、查询工具的应用还不够充分,直接导致耗时耗力、效率低的后果。

三、数字信息化含义及发展趋势

数字信息化是以计算机、通信、网络、数据库技术为基础,对所研究对象各要素汇总至数据库,供特定人群生活、工作、学习、辅助决策等和人类息息相关的各种行为相结合的一种技术,使用该技术后,可以极大的提高各种行为的效率,为推动人类社会进步提供极大的技术支持。

随着中国经济的高速增长,中国数字信息化有了显著的发展和进步,缩小了与发达国家的距离。我国数字信息化已走过两个阶段正向第三阶段迈进。第三阶段定位为新兴社会生产力,主要以物联网和云计算为代表,这两项技术掀起了计算机、通信、信息内容的监测与控制的4C革命,网络功能开始为社会各行业和社会生活提供全面应用。

四、建立数字化信息管理系统,实现数字化查阅和备份

计算机技术和网络技术的发展为基建档案管理建立数字化信息管理系统提供了强大的技术支撑,数字化图书馆管理系统也为基建档案管理系统提供了经验借鉴。通过设立系统的软件管理系统,将现有的基建档案进行数字信息化,实现数字化查阅和备份,不但能数十倍地提高查阅和使用效率,大幅度提高管理效率和降低管理的劳动强度,而且有效地避免了档案资料的损坏和丢失。

在建立数字化信息管理系统的同时,对高校现有基建档案的形式不统一、不齐全、缺失严重的历史遗留问题,需要及时进行补充、完善、规范,同时进行数字信息化,实现基建档案的完整性和现代化。对于在建及以后建设项目的档案资料严格按照标准和规范要求进行验收、移交、入卷和归档,在归档的同时进行数字信息化,归入数字信息化系统实行规范管理。

高校基建档案的复杂多样性,要求档案管理人员必须掌握一定的基建专业知识,才能有条不紊地面对复杂的基建档案,科学地做好基建档案的管理和利用。假如因经费等原因高校一时无法达到档案馆的硬件要求标准要求,高校档案管理人员就要因地制宜,利用现有的实际条件,做好基建档案的管理工作。在信息化时代,对基建档案资料尽可能数字信息化,并采用信息化系统进行现代化管理。

参考文献:

[1]齐潇,潘会详.高校基建档案管理工作的探究[J].内江科技,2012(6):64-67.

档案数字化的关键技术范文3

[关键词]档案 数字化 文件级目录管理

[中图分类号]G271 [文献标识码]A [文章编号]1009-5349(2013)07-0055-01

在科学技术迅速发展的今天,对档案管理实现数字化已经是时代的需要。作为高职院校,在这样的形势下,应该跟上时代的潮流,为此,我校对档案数字化进行了有益的实践与探索。

一、档案数字化含义、作用

档案数字化是指:对于已有的各种载体形式的档案采用数字化技术进行处理加工,以实现不同载体形式的档案的数字化管理和档案信息资源的数字化共享。实现档案的数字化意义重大,它改变了档案存在方式和利用方式。从档案的存在形式上看,档案不再是纸质的档案,不需再为纸质档案的损坏、保管担忧。从利用方式上看,它改变了在利用档案过程中时空的限制。在空间上,档案不再是“孤本”档案,很多人可以同时通过互联网来使用同一个档案;在时间上,实现档案数字化以后,使用者可以随时根据自己的需要调用自己所需要的资料。在高职院校内部,实现了档案的数字化,就可以使各个部门根据自己的需要,随时随地调用所需要的档案资料了。

二、档案数字化的思考

档案数字化的建立是个复杂的过程,我们需要做好技术上的处理,又要做好全方位的管理,以保证档案数字化的合理实现。

(一)做好馆藏情况的调查

要实现档案的数字化管理,需要引进硬件设施。而需要购置什么样的设备,需要了解文档的类型、馆藏数量、档案信息利用等基本情况。在充分了解的基础上,再购置相应的设备,做好硬件设施的准备工作。

(二)在硬件设施到位以后,要进行软件方面的建设

需要建立文件级目录数据库。它可以满足一般检索和管理的需要。目前,很多的档案馆由于没有实现全部档案的文件级目录机检,查找档案不快、不准、不全的问题普遍存在。所以,把文件级目录数据库建设作为一项基础性工作,在提高档案的查全率、查准率的同时,利用计算机实现档案以件数为基本单位的管理是非常必要的。在高职院校的档案管理中,可以把档案按照教学档案、学生档案、行政文件档案进行分类,建立文件级目录。在需要找某一类档案时,在这一级别进行查找,以提高查找的速度。

三、选择适当的时候建立专题数据库

在档案数字化的过程中,只实现文件级的目录,有的时候,是不能解决全部检索的需要的。随着客观需要的变化,对某一专题档案有集中利用的需求是经常发生的,突击建立专题数据库,以满足各部门的需求。为做好这项工作,主要把握三个方面:一是根据馆藏档案内容确定专题数据库的总体布局;二是按需求分期建立专题数据库;三是根据文件内容和检索需要分别设立不同的专题数据库结构。例如:为了加强对教务管理档案的利用,可以设立教务专题数据库。在设立教务专题数据库时,可以按照时间进行分类,也可以找找教务管理制度、教师教案、教学成果等进行分类。总之,可以通过细致的分类,以达到高速运用教务档案的目标。

四、档案数据库的管理

对档案数据库的管理,首先是要提高档案管理人员的业务素质和思想素质。档案工作是一件非常枯燥又重要的工作,需要档案人员具备相应的业务素质和敬业精神。例如:档案人员要掌握数字化档案信息压缩及存储的关键技术;数字化档案信息安全、保密技术;数字化档案信息的访问形式与安全控制;数字化档案信息知识产权等。同时,需要档案管理人员发挥主人翁意识,做好档案的保密工作的同时,要耐心细致地工作。

其次,加强对在建数据库和成果数据库的管理。所谓的在建数据库是一个动态变化的数据库,要进行及时维护和更新。成果数据库是已经完成的数据整理,不需要再进行更改。但是要加强对使用权限的限制,以保证档案信息使用的安全性。可以建立技术负责人、权限负责人,也就是设立专门的人员进行管理。一方面可以保证档案使用部门快速使用,另一方面可以保证档案的访问权限,避免恶意地窃取档案信息的行为。

总之,档案数字化的建立是一项长期而复杂的工程,需要政策上的重视,档案管理人员业务素质的提高,硬件设施的不断更新。作为档案管理人员,应该为档案数字化的实现不断进行探索。

【参考文献】

[1]王萍著.电子档案著录标准及其应用.吉林大学出版社,2010-10-1.

档案数字化的关键技术范文4

关键词:虚拟现实;数据采集;档案数字化

中图分类号:TP311.1文献标识码:A 文章编号:

the Application and Research ofWorkflow Model in the Construction of Digital Estate Management

System

SUN De-chao, SHEN Xu-dong

(Ningbo real estate property section, Ningbo315100, China)

Abstract: This article takes the paper file digitization as a starting point, through the establishment based on digital image's three dimensional file virtual system model, utilizes the technology of imagery processing, WEB application and virtual reality and so on, realizes the function of the digital image gathering input, processing, the memory and the three dimensional virtual call, and this function supports the B/S pattern .

Key Words: Virtual reality; Data acquisition; File digitization

1 引言

信息技术的快速发展与广泛应用给档案工作带来新的契机和新的研究课题。档案作为一种原生的信息资源,其重要性正日益凸显出来,采用先进的信息技术对档案进行管理,开展档案数字化系统建设势在必行。目前国外的档案数字化建设在档案管理信息系统的建设方面比较成熟,关于网络环境下的数据库、搜索引擎、检索服务、信息资源共享、三维虚拟等方面技术在档案管理中的应用研究比较活跃,已经达到新的。相比较,国内的档案数字化建设相对滞后,在档案管理信息系统的建设方面尚处在起步的阶段, WEB技术与虚拟现实技术方面在档案管理中的应用非常局限,虽有虚拟档案馆一词,但仅仅停留在展示方面,还未真正达到有效虚拟管理作用的目的,有关档案管理的三维虚拟现实方面的课题研究刚处在起步阶段。因此,建立档案管理的三维虚拟现实系统有重要的现实应用,将对档案管理模式产生深远的影响与变革。

目前中国许多档案部门着手进行挡案的数字化工作,档案整理工作量庞大,设计一套有效的档案数字化模型是非常必要及时的,对档案数字化工程的推进有着非常重要的意义,通过数字图象三维虚拟系统模型的建立,可保护实物档案形成电子档案,有助于电子查阅和网上浏览,降低办公成本,提高档案管理效率,而且使用直观方便,接近现实世界。

2 系统实现

2.1 主要内容介绍

系统深入研究档案数字化进程中的档案三维虚拟现实管理问题,包括纸质档案的拍摄或扫描采集录入系统与档案电子库房的三维虚拟管理如虚拟档案袋与档案架的创建、上架下架位置排列与虚拟档案袋的调阅等问题,充分利用理论、硬件、软件与技术应用相结合,对档案的三维虚拟现实管理方面进行独特而全面的研究。

系统主要运用Visual Studio 2005和.Net框架建立一套基于B/S模式的数字图象三维虚拟现实系统模型,主要分成两大块:电子档案数字图象的采集录入系统与三维档案虚拟现实系统。系统实现工作流程如图1所示。

图1 系统工作流程

电子档案数字图象的采集录入系统主要是通过录入系统程序客户端运用USB接口控制技术控制数码相机或高速扫描仪进行档案纸质材料的拍摄或扫描录入,以TIFF/JPEG等主要图象格式进行数字图象的分布式存储并上传到文件目录服务器与数据库服务器,为三维虚拟现实管理系统提供数据来源;三维虚拟现实系统主要建立三维虚拟档案袋与虚拟档案库,根据档案的空间位置信息与上架信息,通过虚拟档案袋载入数字图象信息,自动形成三维图形展示的档案库房密集架直观图,通过该图可以直接定位档案的具置,可以直接对该卷电子档案进行操作,如调阅、迁出、销毁、借阅登记等,实现三维电子档案的模拟实物查询与操作,以简化档案管理的业务工作环节。

2.2 关键技术

(1)USB接口控制数码相机技术:支持JPEG、GIF、PDF、BMP、DWG、DXF、TIFF等多种图象格式,支持黑白二值、灰度和彩色拍摄或扫描录入,支持多种数码相机或高速扫描仪的录入接口,支持远程服务应用,能进行拍摄或扫描模板及参数的设置。

(2)数字图象处理、图象存储安全与图象压缩技术:能对图象进行缩小放大、去噪去污等处理,以保证图象质量;鉴于档案种类繁多,数据量庞大,考虑到虚拟现实管理的实时性与快速性,本系统具有高效图象处理的功能,并采用LZW无损压缩算法对彩色数字图象进行高比例无损压缩存储,以满足数字图象访问速度的需要,具有良好的实时性、扩展性和伸缩性。

(3)虚拟电子档案袋建立技术:将文本数据与图象数据关联,存取在虚拟电子档案袋中,形成完整的电子档案;

(4)三维虚拟现实技术:能形象逼真地模拟档案的查询与调阅;三维虚拟现实提供电子库房虚拟管理和虚拟档案的调档查阅,具有生动逼真和模拟实物档案管理的效果。同时,具有虚拟档案位置信息大变动调整速度比实物档案位置信息大变动快的得多。。

(5)数据库存取与数字多媒体技术:能实现图象文件的分布式存储 ,能快速读取图象数据;支持声音,实现多媒体漫游;

3 结论

该系统针对数字化档案工程,提出了用三维虚拟现实技术、USB接口技术、图象处理技术和WEB技术相结合来解决电子档案数字图象采集、存储、三维虚拟调阅等问题的方案,给档案数字化管理提供了有力的应用工具,有利于信息共享,大大提高了数字化效率,图2为系统在宁波数字化档案管理使用过程中虚拟现实的图片。该作品具有较好的前瞻性和实用性,不仅局限于档案领域,可以扩展到多种行业多种领域,具有很好的使用价值、社会效益和市场前景。

图2 虚拟现实系统

参考文献

[1] 胡西伟.基于三维动画与虚拟现实技术的理论研究[D].武汉大学硕士论文,2005,4.

[2] 古玲,苑志勇.基于B/S结构的档案管理信息系统研究贝华[J].华中科技大学学报,2005,1.

档案数字化的关键技术范文5

1.1是有效改善档案管理工作的需要

纸质载体是农业科技档案的根本依据,但是避免不了局限性,存在着数量多、体积大、质量重,不易携带,不便查找,信息传递慢,无法检索等方面的不足。农业科技档案管理的数字化建设,可以从根本上克服这些弊端,即以现代通信、计算机网络、多媒体信息技术为基础,建立计算机网络平台,以建立好的各种档案信息库为资源,利用智能信息处理技术,将数据库转变为知识库,以供需要者查询、搜索,并且信息资源的使用维护方便,安全保密性强。农业科技档案管理的数字化建设,可以达到资源信息的数字化、资源管理网络化和智能化。

1.2是档案管理发展的大势所趋

农业科技档案资源的高效、快捷开发利用需要应用数字化技术。传统的查阅方法是到档案馆,采用人工捡索的办法查找所需的档案,费时、费力,查全率和查准率均不高。档案管理实行数字化后,全市农技推广机构通过互联网,进入市科技档案馆数字化信息中心,各单位的档案电子目录和开放档案数字信息均上传至市农业科技档案馆信息中心,方便全市农业科技档案资源的整合和利用,顺应档案馆现代化发展的需要。

1.3是现代农业发展的必须

在当今人们的时间意识越来越强,领导需要迅速、准确的决策;各职能部门工作要求快速及时;社会广大公众对档案信息需要量不断增加的情况下,要求档案部门必须尽快改变传统的原始管理、检索和提供利用的手段,运用现代信息处理技术手段来处理农业科技档案信息资源,提高档案资源的开发能力和利用效率,确保档案信息能及时、方便地提供。

1.4是节约农业档案机构建设资金的举措

库藏档案案卷数量的不断增加需要信息化来管理。以杭州市农业科学研究院为例,该院下辖农作、水产、茶叶、蔬菜、畜牧、生物等多个科研所,截止2010年全院库藏档案820卷,资料12088册,其中相当部分档案分散在基层建档单位,如果对这些档案进行有效整合,采用数字化管理,可大大减轻农业科技档案管理工作人员的工作量,降低费用支出,使档案管理人员能在有限的时间内搜集更多的信息,不仅降低了成本,而且极大地提高了效率。

2农业科技档案管理数字化建设总体设计

农业科技档案管理数字化建设的指导思想是:以需求为导向,以利用为目的,充分利用计算机软硬件功能,最大限度发挥人力资源和数字化加工设备能力,保护农业科技档案原件完好,保证数字化农业科技档案真实准确,更好地发挥农业科技档案信息资源的作用。农业科技档案管理数字化建设的原则是:档案数字化,工作标准化。档案数字化标准规范体系的建设,可以从管理、业务、技术等标准规范层面来研究制定。从简单的标准化向科学、精确的标准化过渡,从孤立的标准向体系化的标准推进。重要档案优先数字化。以利用需求为导向,结合实际,统筹规划,分步实施,突出重点,量力而行,将年限较长、具有馆藏特色、最为珍贵以及利用频率高的档案优先数字化。各部门分工协作。档案数字化工作相当繁琐,涉及面广,必须坚持分工协作、整体配合、长期坚持、相互理解的工作理念,充分发挥单位各个部门和各类人员的作用,明确工作任务,落实责任分工,真正做到各司其责,各施其能,协调配合,形成全方位、多层面、多角度、共同推进档案数字化建设的科学发展模式。多方位快速高效检索。数字档案管理系统应该建立多种满足档案利用者的检索方式,提高检索的自由度。完善的电子检索系统,能高效、快速、全面地从档案信息中检索出利用者所需的信息,并对档案利用进行快速统计。数字档案管理系统应及时公布、更新、维护网站网页内容,提供服务范围、内容,便于档案利用者了解档案信息动态,及时查找所需信息。注重档案数字化人才培养。要建立和完善档案人才选拔、任用和激励机制,重视人才的储备,以超前的意识搞好人才建设,造就一批既熟悉档案工作管理、通晓档案理论知识,又掌握现代档案数字信息技术的新型档案工作人才队伍,确保档案数字化建设及档案事业又好又快地发展。农业科技档案管理数字化建设需要投入,特别是建设初期软硬件配置投入较大,建成后也要保持一定的运行成本。因此,要按照成本效益最大化的要求,细化农业科技档案管理数字化建设的步骤。同时优化农业科技档案管理数字化的各种资源配置,根据不同的情况,进行农业科技档案管理专业人员和数字化技术人员、计算机和扫描设备的合理配置,构建农业科技档案管理数字化投入小收益大的新模式。具体步骤上:一是建立农业科技档案管理数据库。第一步,输入文件级目录。在建立数据库的过程中,可边输入边打印,一方面补齐卷内文件目录,另一方面检验输入的正确性,从而确保农业科技档案管理数据库的真实性、完整性和有效性。第二步,采用扫描仪、数码相机等设备,实现原文件信息数字化。二是加强电子文件的收集和积累工作。电子文件包括电子文件内容、电子文件载体和电子文件显示、修改的电子计算机软硬件平台组合,是未来数字农业科技档案管理最主要的来源。为了确保所形成的电子文件不被丢失,保证电子文件是可存取、可利用和可理解,必须及时对所形成的电子文件进行收集积累。电子文件的收集积累,不仅保证电子文件的真实性,还维护了它的系统性、完整性,同时,也防止了存有信息内容的载体在个人手中发生丢失、损坏,从而保护电子文件的安全,为电子文件的归档打下基础。电子文件的收集积累范围,应严格按照国家有关规定执行。用载体传递的电子文件,要按规定进行登记、签署,对更改处,要填写更改单,按更改审批手续进行,并存有备份件,防止出现差错。三是农业科技档案管理数字化与上网利用同步。农业科技档案管理数字化及管理流程重组是一个管理思想不断变化的过程,农业科技档案管理数字化与上网利用同步即是新技术和新理念相互融合的表现。数字化农业科技档案管理分开放与不开放两种,开放农业科技档案管理即上互联网,建立农业科技档案管理资料网站,实施资源共享,在互联网上向政府和社会提供农业科技档案管理信息。

3农业科技档案管理数字化建设需要把握的几个问题

3.1提高认识,统筹规划

首先必须在思想上充分认识农业科技档案信息资源的重要意义。在当今信息公开程度越来越高的形势下,农业科技档案的文化性质和社会性质逐步强化,利用的范围和对象将逐步扩大,只有当农业科技档案信息资源在农业现代化建设中发挥重要作用时,农业科技档案和档案工作的意义和价值才能充分地全面地展现出来。其次,做好统筹规划。将大量的农业科技档案数字化,是一个庞大的系统工程。首先要做好馆藏情况的调查,包括档案的类型、载体形态与状态、馆藏数量、档案信息利用等基本情况。根据馆藏情况,制订农业科技档案数字化的科学规划,包括服务器、电脑、扫描设备等硬件的购置计划和数字化处理规划。最后,要保障档案整理过程的完整性。农业科技档案数字化是一项费时较长的工程,在大规模、流程化的数字化过程中,所有档案原件都需从档案库房分批大量取出,一定要保障档案原件的完整,不允许出现损毁和遗失的现象。

3.2加强基础工作,认真做好档案数字化

一是档案数字化必须有所选择。针对馆藏“浩瀚”的档案资源,不加选择地全部数字化既不可能、也没必要。应该根据一定的原则确定哪些馆藏档案原件应该数字化、哪些档案原件中哪些不需要数字化。二是做好数字化时扫描参数的优化设置。扫描系统扫描参数的选择和确定对扫描数字影像质量有较大影响,其中扫描分辨率直接关系到扫描文件的清晰度和还原效果。选择分辨率时应根据实际需要综合考虑,包括扫描文件的可阅读性、存储空间、输出打印质量等。三是做好档案数字化的全程控制。在档案数字化过程中,要注重全面的质量检查,加强数据的质量控制。

档案数字化的关键技术范文6

关键词:数字图书馆;信息数字化;存储技术;发展对策

中图分类号:G203 文献标识码:C 文章编号:0439-8114(2011)09-1942-03

The Problems and Countermeasures of Information Digitization Construction of the Digital Library in the College

LU Xian-feng

(The Library of Huanggang Normal University, Huanggang 438000,Hubei,China)

Abstract: A digital library was an information system which saved information resources by digitalization and offered immediate service by internet. Therefore, the digitalization of information resources was a basic requirement for the realization of a digital library. Initially the concept of digitization of information was disscussed, the key technology of it was explored, the main problems nowadays which involved the construction of content, intellectural property rights, technology application and standards were analyzed, and some countermeasures and suggestions for those problems were put forward too.

Key words: digital library;digitization of information;storage technology;strategy of development

信息数字化作为数字图书馆的内容建设,是数字图书馆正常运转的关键步骤。但目前我国信息数字化中由于种种原因还存在许多问题,如重复建设、知识产权、技术应用和标准与规范等问题,这些都严重阻碍了我国数字图书馆的健康发展。因此,我国在实施信息数字化建设过程中,不仅需要更新观念、统筹建设,还要规范标准、加强立法、提高馆员素质,更要加强适合我国国情的技术创新。为此,我们需要不断地总结经验,探索新的开发技术和工作方式,逐步将我国宝贵的传统文化遗产加以数字化,进而开发出具有中国特色的数字化产品。

1数字图书馆中的信息数字化

1.1信息数字化的内涵

从社会信息化环境来说,数字图书馆是运用计算机技术、网络技术、通信技术等多种信息技术,对不同载体和类型的信息资源进行搜集、选择和规范化处理,使之以数字化的方式存储,建立分布式的馆藏信息资源库和虚拟信息资源库,并通过网络向世界各地用户提供无时空限制服务的信息系统。数字图书馆的主要职能是搜集、保存和传递数字化信息,可以称之为数字化信息的存储和传递中心,因而信息数字化建设无论从质量还是从数量上都是数字图书馆发展的关键环节。

1.2信息数字化的关键技术

信息数字化技术包括数字化信息的生成技术、存储技术和压缩技术等,其关键技术是数字化信息的生成技术和存储技术。

1)数字化信息的生成技术包括有键盘录入和非键盘录入两种方式,目前使用较多的数字化信息的生成技术主要是第二种方式。键盘录入是一种手工转换的文本模式;非键盘录入包括手写识别技术、印刷文稿扫描识别技术、语音识别技术。在信息数字化实际工作中,我国许多数字图书馆都采用两者相结合的方式来规避键盘录入的较高错误率和扫描方式对硬件的较高要求,也就是采用超星公司开发的数字化技术加上便携式文件格式(PDF)和超文本标记语言(HTML)格式。

2)数字化信息的存储技术包括直接存储技术和网络存储技术。直接存储技术是目前大多数数字图书馆的数据存贮技术,主要包括光盘塔技术、磁盘阵列技术和磁带库技术;网络存储技术是海量数据信息存储的实现方式,包括直接附加存储(DAS)、网络附加存储(NAS)、存储区域网络(SAN)、小型计算机系统接口(iSCSI)技术和内容寻址存储(CAS)[1]。

2信息数字化中存在的主要问题

虽然我国数字图书馆建设中的信息数字化工作取得了一定的进步,但由于观念和技术的落后,信息数字化建设整体上呈现出数字信息资源重复建设严重、版权保护立法不健全、缺乏有力的技术支撑、标准和规范化建设滞后等问题[2]。

2.1重复建设问题

由于国内各地区、各系统以及各馆之间无一个权威的协调机构,也无规划布局和分工实施计划,数字图书馆建设缺乏全局性的统一规划和政府权威部门的协调,相当多的所谓数字图书馆建设仍处于各自为政、贪大求全和相对分散的无序状态,信息资源重复现象的问题严重。近年来,我国各级政府投入数字化建设的资金总额已达36亿元,在政府资金的大力支持下,各级各类数字图书馆都在进行数字信息资源建设,甚至引进CNKI等数据库,这种现象在各大高校数字图书馆的信息数字化中也非常普遍,在相当广的范围内存在着潜在的数字信息资源重复建设问题。

2.2知识产权问题

数字图书馆中信息数字化所涉及的知识产权问题包括信息来源的著作权尊重和数字化信息建成后自身著作权的保护。随着数字图书馆的开通,数据库的利用将越来越广泛,由此产生的知识产权问题就不可避免,其中争论的焦点是关于网络作品的制作、传播和使用的版权保护问题,让一些数字图书馆在实践中遭遇法律尴尬。著作权人公开指责图书馆界滥用权利,严重损害了著作权人的利益;出版界也有人认为文献信息的数字化是复制出版界的出版物,在网上出现了成千上万的复制本、使出版界的经济利益受到损害;而图书馆界则认为信息获取的主动权完全掌握在版权人手里,这样会严重地影响知识的创造和传播。因而制定网上数字化文献的著作权法律法规已成当务之急。

2.3技术应用问题

随着电子出版物的收藏和网络数字化资源的采集,图书馆越来越多的信息一入馆就是数字化的,而对于未数字化的传统馆藏,进行数字化转化所使用的技术主要是光学字符识别(OCR)扫描录入方式。一般的OCR录入系统能够实现对各种现代书籍、简繁体书籍、报刊杂志、公文档案的录入识别,且识别率高,还能实现各种校对,然而,对于馆藏文献的数字化而言,由于汉字的复杂性,OCR对各类中文文献的识别远难于对英文和数字的识别,特别对含有繁体手写汉字的古籍文献、简繁混排的中文文献、专业性强的中文文献以及难于机检的汉字文献。OCR技术目前还存在很大的误识率和拒识率,为此,需要对OCR系统进行深入的研究和改进,提高其应用的全面性,并要引入中文校对、录入质量控制等技术,从而加强其管理功能。

2.4标准与规范问题

目前,在信息数字化标准规范方面存在的问题主要有:①缺乏对标准规范重要性的认识;②缺乏普遍接受和广泛应用的关键标准规范;③缺乏对标准规范建设的系统化把握;④缺乏对标准规范的开放描述和开放应用;⑤缺乏开放、联合、共享的标准规范建设与应用机制,例如图书馆在信息资源建设过程中所采用的软件系统差异很大,如ILAS系统、图书馆集成系统等,其标准和格式都不一致,导致开发的数据库不能兼容,检索界面不一,检索途径也不同,检索语言也无统一的规范控制,无法在网上实现资源共享。

3信息数字化发展对策

3.1加强特色数字馆藏建设

只有具有特色的数据才能赢得较高的网络访问频率,才具有资源共享的价值,也是各大数字图书馆以最小投入换取最大效益的文献信息共享模式。因此,在进行本馆的信息数字化建设时,除了需要全面考虑文献价值、用户需求、载体形态、技术可行性和著作版权等一般因素外,还需要科学而系统地考虑馆藏内容、馆藏特色,尤其是馆藏结构和馆藏级别。馆藏级别一般可以划分为永久保存级、服务级、镜像级和链接级4个基本层次。永久保存级馆藏是指具有确定的保存价值和用途,并具有惟一性的特色文献;服务级馆藏是指十分有用和必须的虚拟馆藏;镜像级馆藏是指其他数字图书馆馆藏的拷贝,与永久保存级相同的是它们都是现实馆藏,与之不同的是它缺乏惟一性;链接级馆藏则是贮存于其他数字图书馆中的数字化信息资源,其内容较为广泛,与服务级馆藏相比,它与用户的相关性要低一些。只有通过这些特色数字馆藏的建设,才能真正优化馆藏文献的结构,加快馆藏信息利用,最大限度地避免重复建设,从而提高整个社会文献资源的保障水平和信息资源的开发利用效率。

3.2从信息源头加快信息数字化建设

文献信息资源的源头在出版社和出版商,每年都有数以万计的文献资源被出版系统数字化,这个资源如能加以利用,将是一笔巨大的财富。据2001年统计,全国530家出版社的图书总量是154 526 种[3],一年的文献资源总量就相当于一个中型图书馆文献资源的全部馆藏总量,而且还在逐年递增。如果把信息数字化的生产重任交给出版商,将会带来很大的经济效益和社会效益:一方面可以大量减少信息资源重复数字化带来的人力、物力、财力的浪费;另一方面,信息资源数据库的建设者可以通过与出版社合作取得授权来解决信息资源建设、传播中的知识产权问题,既能保护作者的知识产权,又能照顾到出版商利益,同时还能让各类文化、科技的文明成果纳入数字图书馆,使其能为更多的人服务,创造出更大的价值。

3.3开发和利用先进技术

无论是从数字图书馆建设,还是从作为其一部分的文献信息数字化技术来说,技术问题仍然是制约着信息资源共享的主要问题。数字图书馆是采用现代高新技术的系统工程,不仅需要立项研究开发新的应用技术,而且还需要各种高新技术成果的及时转化和应用。目前,信息资源数字化的关键技术在发达国家已趋于成熟,国外的数字图书馆工程为国内提供了可借鉴的经验,加强技术研发工作可以从以下几个方面进行:①从中国数字图书馆建设项目的实际出发,组织专人对信息数字化关键技术进行跟踪、研究、攻关;②借鉴引进适合国情的国外先进技术和先进产品;③集成和采用以国家“863”计划为代表的国内已有的科技成果;④开发适合我们自己的先进技术,如电子信息处理技术、指引库技术、语音识别技术及信息媒介技术,同时规范有关技术标准[4]。

3.4促进信息数字化建设的规范化和标准化

信息数字化涉及文献描述、组织和检索多个方面,要使工作顺利进行,各个数字图书馆之间要能够共建共享信息资源,就必须统一标准,加强兼容性。因此,图书馆数字化建设要走资源共享的道路,必须打破各自为政的局面,各图书馆文献分类编目不统一,对资源共享造成很大的障碍,在书目数据方面,数据不标准就不能保证用户从各个角度迅速、准确地检索资料。因此必须有一个数字图书馆全国中心,建立和健全全国数字图书馆使用的各种标准规范,协调规范资源库建设,解决信息数字化建设的标准化问题。根据标准,再由地区内、地区间各馆合作建库或由地区文献信息中心统一建库,各馆录用,最终达到全国的标准化。

3.5提高馆员的信息处理技术与研究人员的素质

随着信息资源概念的发展,文献信息数量和类型的增加,信息工作方式和手段的改进,图书馆的工作对象已不再局限于对传统纸质文献和某些缩微资料或视听资料的一般性收集、整理、组织、管理等工作,数字图书馆面临更多的信息载体和信息服务方式。例如,各种电子图书、网络信息资源、CD-ROM和其他电子资料已成为数字图书馆采访和处理的主要对象,这对于长期熟悉纸质文献的传统图书馆员来说就是一个巨大的挑战,同时,数字图书馆还会带来一系列需要解决的新问题,如知识产权归属品种和复本的比例、购书经费的分配等。在书刊分类和编目工作上,馆员的技术性处理工作会迅速减少,但会被赋予需要更多知识的技能才能完成的新任务。也就是说,他们可能参与更多的信息技术工作、文献信息研究和用户研究工作。总之,现在图书馆工作者应当是信息专家和信息工程师,是信息系统的设计者,也是信息用户的导航者。鉴于此,在提升数字图书馆馆员的素质上,一方面可以通过吸收一批计算机、通讯、外语方面有特长的人才充实图书馆人员队伍;另一方面应加强在职人员的培训,提高其计算机、英语和专业综合技能与素质,及时调整和优化他们的知识结构,以适应信息资源数字化建设的要求。

参考文献:

[1] 陈柯明.谈网络环境下数字图书馆信息存储技术应用发展[J].图书馆界,2004,6(2):20-21.

[2] 梁 平.我国数字图书馆建设中的几个问题[J].中华医学图书情报杂志,2004,13(3):13-14.