文学常识题库范例6篇

文学常识题库

文学常识题库范文1

1 社会心理学文献专题库建设的背景

社会心理学是一门研究个体与他人交互行为过程中社会心理现象的学科,包括群体社会心理学和个体社会心理学。群体社会心理学是指特定环境下群体所表现出来的社会特征,如:群体共识、群体凝聚力、群体决策。个体社会心理学是指个人思想受他人或社会环境影响所表现出来的特有特征,如:社会顺从、社会抑制、人际吸引等。无论是个体社会心理学还是群体社会心理学都是研究人与环境交互作用的过程。[1] 人一出生即生活在社会中,社会现象、社会生活和社会关系都会对人心理产生影响和作用,推动或制约人的行为,成为社会心理产生的根源,当前诸多社会现象,如:家庭分裂、贪污腐败、房价居高不下等问题可能都包含有社会心理因素。因此,社会心理学理论被越来越多地运用来解释各种社会现象,解决现实问题。特别是近年来,网络技术发展以及智能手机的应用,使人与人之间交流越来越少,虚拟世界与现实世界的冲突日益增多,人的心理变得更加封闭,这必定会产生一定社会影响,由此可能引发社会问题。同时,随着社会节奏加快,新事物层出不穷,习惯了往日生活的人们发现自己需要不断地调整和适应,才能跟上时代节奏,而这个调整和适应的过程必然加重人们心理负担。因此,加强社会心理学研究,关注大众心理健康将在未来社会发展中起到至关重要作用,越来越多的领域要求运用社会心理学理论知识去指导解决现实问题。在这种背景下,对社会心理学提出了新要求,学科重要性也日益突出。

目前,知识载体越来越多,人们不再简单通过书本获取知识。要想在浩如烟海文献资料中找到需要的信息,而又不迷失方向,就必须对搜集的资料去重、分类和排序。去掉重复和过时的信息,这是一个非常繁杂而又枯燥的过程,会花费科研工作人员大量时间和精力,据统计,科研人员花费在资料查找和整理上的时间大约占全部科研时间的51%。[2]在这种情况下,图书馆或信息服务机构就必须改变服务方式,由过去的传统借阅服务改变为更加个性化、知识化的服务,使服务内容和服务层次更加深入。因此我们需要构建专题文献库,为科研工作者提供更加便捷和准确的知识获取途径。专题知识库作为一种新的知识服务形式,是运用知识聚类和数据挖掘技术,将相关学科文献信息资料较好地整合、关联在一起,形成该学科知识的专题库,以方便读者快速、高效地获得专业文献资料。

2 社会心理学文献专题库的框架设计

2.1 社会心理学专题库的数据采集

2.1.1 数据资源采集原则

建立专题库,至始至终要保证有可靠数据,数据采集也力求保证完整性和权威性,即在建库初期,有图书馆馆员负责元数据的查询、收集,同时需要制定规范的选取原则来保证数据数量和质量。因此,在选取数据时,要遵循下述原则:首先,科学性原则,对社会心理学专题库整合的文献对象、内容和方式要科学,以保证所选取的文献科学、合理;其次,有序性原则,社会心理学专题库诸要素之间的相关性有一定规则,不是杂乱无章的,系统内部信息根据词表都具有层次等级;最后,系统性原则,保证对社会心理学专题库学科知识完整、连续地整合,只有这样一个系统、动态地整合过程,才能使专题库发挥持续效用,专题库的构建也才更加具有生命力。

2.1.2 数据资源采集途径

根据文献类型不同,社会心理学数据采集途径有以下几种:

(1)社会心理学领域的期刊、图书、报纸等纸质文献,资料选取过程中,要注意资料质量,尽量选择该领域权威人士或专家的著作。

(2)利用已有数据库对数据收集与筛选。目前,已有的中外文数据库包括清华同方的中国学术期刊数据库、重庆维普全文数据库、万方数据库以及EBSCO的全文期刊数据库等,应考虑先在这些已有的数据库中检索社会心理学相关文献。下载过程中第一要考虑该领域专家的文章;第二可以把文献来源限定为该领域核心期刊,在权威刊物中选取相关资料;第三要注意选择该领域权威机构研究成果。当然,数据选取应遵循科学性原则、有序性原则和连续性原则。

(3)通过搜索引擎,如:百度、谷歌、谷歌学术搜索等,获取网上社会心理学信息,或者选取开放存取(OA)资料来整理、下载社会心理学相关文献,如PubMed提供的免费资料中就有少数社会心理学文献,PubMed上约有5%的文献可以免费看全文,这些文献左上角通常会有一个Free Full Text的小标记。

2.1.3 数据资源加工

数据库资源采集是把存储于各种载体的文字、图形、图像、语音、视频等原件转换成统一的数字编码信息,即数字资源,这些数字资源是各种信息资源总和,数据格式既有文本、图像,也有音频、视频。

数据采集过程中,能够检索到各种不同类型文献,因此,收集的纸质文献,必须先扫描形成电子文档,再通过建库软件转换成相应的数据库格式文件;收集的电子文献,也需要通过建库软件转换成相应的数据库格式文件,通常为PDF文件格式;采集的图片,先利用计算机技术转化为占空间小、适于网络传输的文件,再以超文本方式组合起来。当数据收集到一定规模后,再利用数据挖掘技术提取有用信息资源,并进行分类、整理。

2.2 社会心理学专题库的功能结构

功能设计上要满足用户需求,使用户能够快速、高效、全面地检索文献,既可以为用户提供简单检索、跨库检索和高级检索的检索方式,也可以按检索内容,为用户提供题名检索、主题检索和全文检索的检索形式。功能设计还需要考虑构建检索式的逻辑组配检索功能,包括逻辑“与”、“或”、“非”,尽量达到“一站式”服务。同时,还可以根据社会心理学的主题内容,设置专业学科导航栏目,初步构想设置为社会思维、社会影响、社会关系和应用社会心理学,这样既方便读者按专业类别搜集资料,也节约科研工作者搜集资料时间。

2.3 社会心理学专题库的

目前,关于数据库的软件系统有很多种,选取原则主要遵循技术架构性能优良。通过调研国外专题库构建,发现使用最多的是Dspace,它是由美国麻省理工学院图书馆(MIT Libraries)和美国惠普公司实验室(Hewlett-Packard Labs)经过两年多努力,合作开发的软件平台。Dspace作为一种开放源代码数字存储系统,以内容管理为设计目标,遵循BSD协议,该系统可以收集、存储、索引、保存和重新任何数字格式、层次结构的永久标识符,具有检索功能强大、界面友好的特点。

也有研究机构使用英国南安普敦大学开发的Eprints,它也是开源软件,允许任何大学、院系、团体、组织和项目组使用该软件,它遵循的是OAI协议。Eprints是构建高质量专题库最灵活的系统平台,也是最容易、最快和最节省成本的方式,具有个性化、扩展性强的特点,可存储任何格式文件,也允许同一文件有不同格式。[3]

目前,国内高校图书馆和研究机构多选用Dspace、超星、科技图书文献信息保障系统、麦达电子有限公司特色库系统、CDICM和Drupal作为专题库平台,如:国家图书馆的图书馆情报学开放文库就使用的Dspace系统、厦门大学的厦门大学学术典藏库使用的也是Dspace系统、中国科学院国家科学图书馆建的NSL-IR(中国科学院国家科学图书馆机构知识库)使用的是科技图书文献信息保障系统。但是考虑到语言交流方便,大多数研究机构都是选用国产软件平台或自主开发的软件系统,只有为数不多的研究机构采用Dspace系统。[4]

3 社会心理学专题库的知识服务

为提高信息检索效率,保证信息准确、全面,本文参照美国国立医学图书馆编制的《医学主题词表》(Medical Subject Headings,简称MeSH词表)构建了主题词表,该词表是建库时标引和检索的依据,主要起规范主题词作用。通过建立主题词表,能够使标引者和检索者在用词上尽可能达到一致,提高检索效率,减少查找资料时间。[5]

社会心理学主题词表按属分关系构建,属分是指主题词之间包容和被包容的关系,每个词族可能有二级、三级甚至更多级的属分。确立属概念能够限定检索主题,便于扩大或缩小检索范围,保证检索准确性和全面性。根据属分关系,社会心理学主题词表既分为上位类,又包含下位类,详见图1[6]。

社会心理学主题词表库建成后,完成元数据分类标引。通过准确标引,能够把用户和文献联系起来,这样用户就能在大量文献中,用较短时间全面、准确、迅速地查找所需文献。

社会心理学专题库除了能够为读者提供传统文献查阅、检索服务外,还可以利用数据挖掘、知识提取、人工智能等技术对文献深层次加工,为用户提供高层次知识服务,如:根据收集的文献,提炼社会心理学最新研究进展,撰写综述,并跟踪文献动态,确保获取最新知识;通过关联分析找出数据关联度,挖掘隐藏在数据中的相互关系,为科研人员提供参考和预测;通过评价分析主要刊物影响因子、5年影响因子、总被引频次等文献计量学指标,来分析刊物影响力、学术水平以预测社会心理学学科发展趋势。[7]

通过专题知识服务,科研工作者不仅能够快速、准确地获取文献,提高资源利用效率,而且还能及时了解社会心理学发展最新动态,预测学科发展趋势,洞悉学科发展方向。

4 社会心理学专题库的宣传推广和后续维护

文学常识题库范文2

【关键词】本体 自动问答系统 数据结构 知识表示

1 引言

问答系统(QuestionAnsweringSystem,QAS)是一种新的信息检索技术。它应用自然语言理解技术,通过对用户问题的理解,将答案直接返回给用户。由于现有的许多自动问答系统都是基于知识库的,知识库是自然语言处理的基础资源,知识库中知识的丰富程度、知识表示形式以及知识的组织方式直接关系到基于知识库的自然语言处理应用的性能。因此如何设计知识库对提高自动问答的性能和效率具有非常重要的意义。为此本文提出,以数据结构课程为例,采用本体技术构建课程本体,首先对数据结构课程知识进行了核心词汇分析, 提出若干类和属性, 然后借助本体知识库良好的分类特性、概念的形式化描述来对数据结构课程进行知识表示、知识存储,建立数据结构课程本体库,从本体库出发建立常见问题库和课程文档库。以此建立的常见问题库和课程文档库为后续课程自动问答系统的自动问答提高了效率。

2 本体技术

本体论(Ontology)来自哲学领域,比较流行的定义是Gruber在1993年提出的本体的概念,他认为本体是有关概念模型的明确的规范说明。本体的目标是捕获相关的领域知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇之间相互关系的明确定义。本体的研究包括概念和概念分类、本体上的代数。近年来,随着信息科学的飞速发展,本体论逐渐用于知识工程和信息科学等领域之中。

随着Web的发展,出现了许多本体描述语言,如早期基于一阶逻辑的EJF,基于框架和一阶逻辑的OCML,基于描述逻辑的LOOM等。随着进一步的发展,又出现了RDF(S)、OIL+DAML、OWL等。而其中,OWL是建立在XML/RDF等已有标准基础上,通过添加大量的基于描述逻辑的语义原语来描述和构建各种本体。本文中主要使用RDF(s)和OWL。

本体构建工具有很多,目前使用最为广泛是Protege本体构建工具,是使用java开发的、可扩展的、免费的、开源的本体工具。本文采用了Protégé 4.0.2版本作为本体的构建工具,构建《数据结构》课程本体。Protégé 4.0.2本体构建工具有很多优点:使用简单方便、文件的输出格式可以定制、用户接口可以定制、模块划分清晰、后台支持数据库存储。

3 课程本体的构建

课程知识本体是课程自动问答系统FAQ(Frequetily Asked Questions)库的基础,同时也是准确、高效的实现自动答疑的关键。课程知识本体界定了FAQ系统的范围,决定了关键词、知识范围和内容、知识点之间的相互关系,是系统准确性、智能性的基础。系统在充分理解课程大纲的基础上,根据教材体系设计课程知识本体。

课程本体的构建是一个严谨的过程,本文在参考相关本体构建方法的基础上,在领域专家的帮助下,采用以下的步骤来开发课程本体,尽可能保证本体的正确性和一致性:

(1)明确领域范围:主要考虑该课程领域本体要包含的内容、用途和使用者。

(2)考虑可重用性:考虑是否已有相关的课程本体,可否对其进行扩展或精炼。

(3)列举核心概念、基本概念:以某种方式表示课程领域中的概念。

(4)定义概念及概念间的层次和结构。

(5)定义概念的属性:提供相关的属性来详细描述概念的方方面面。

(6)基于课程本体构建该课程的常见问题库和知识库。

3.1 课程的概念本体

要进行课程本体的构建,首先要确定该课程中的关键知识点,课程知识点由课程的核心概念和基本概念构成。准确定义领域内核心的概念,以确定合理、完整的概念体系,构建课程本体。需要抽象概念、属性,及概念之间的关系进行描述和定义。

概念本体(CO-Concept Ontology)是用来描述某个知识领域内的一些核心概念和基本概念的本体,这些概念是被该领域内人们所共同认可的,本文将其表示为一个单独的本体,定义如下:

CO::=(Onm,Ch,Cj,Sx)

其中Onm是某个领域的课程名;Ch为该课程领域核心概念集合;Cj为该课程领域基本概念集合;Sx为该课程领域各概念的属性集合;

本文领域概念的提取是由多位领域专家及网络搜集获得,下面给出一个实例片段:

CO::=(Onm,Ch,Cj,Sx);

Onm=“数据结构”;

Ch=(数据结构、线性表、树、图);

Cj=(栈、队列、特殊线性表、串、多维数组、广义表、二叉树、查找、排序);

Sx=(Sx1数据结构:定义,发展历史,访问接口,分类;

Sx2线性表:定义,逻辑结构,存储结构,应用;

Sx3树:定义,遍历,转换;

Sx4图:定义,逻辑结构,存储结构,最短路径,遍历,关键路径,应用)

3.2 领域概念层次关系提取

根据上一节提取到的课程概念,确定课程概念间的相互关系,并且用精确的术语来表达这些概念以及概念之间的关系,本文在建立《数据结构》课程本体时主要考虑了基本概念之间的关系如表1-1所示,包括概念间的同义关系、蕴含关系、上下位关系、层次关系和缩写关系。同义词关系表示两个概念(类)之间的语义相等或非常相近,往往可以相互替换,如“线性表”别名“表”或“Linear list”等。蕴含关系表示两个概念(类)是继承关系。如线性表和特殊线性表具有继承关系。上下位关系表示下位词是上位词的特例,如特殊线性表是栈和队列的上位词。在问答中有时候通过该概念的上下位概念也能提取到潜在的有用信息。

3.3《数据结构》课程本体模型

《数据结构》课程知识本体按章设计,参考本体模型构建方法,以上文对课程本体的概念及概念间的关系的描述为基础,将课程的知识概念经过组合分类后,对课程知识点层次结构进行扩展,通过对《数据结构》课程概念及其属性、概念间关系的描述,可以将整个知识内容形成一个面向自动问答系统应用的本体资源,本文采用OWL语言来定义本体,用RDF语言来描述资源和标注过的文档。利用本体编辑软件Protégé 4.0.2作为本体的构建工具,构建《数据结构》课程本体模型。如图1-1是部分课程知识本体结构图。

3.4 常见问题库和文档库的构建

课程FAQ库是课程自动问答系统的核心,存储的是针对某一门课程内容最关键、最重要的问题集合。包括学生在学习过程中经常提问的问题及各类考试中频繁出现的题目等等,课程FAQ库把这些问题存储到数据库中,并配有准确的答案,为了使系统充分理解用户的提问意图,以便在自动答疑时把FAQ库中相关的问题集找出来,结合前面的分析,本文以课程知识本体为基础,应用短文本分类技术对所有问题分类,构建了《数据结构》课程FAQ库。

自动问答系统中对于用户提出的常见问题,首先用户输入查询问题,系统先在课程FAQ库中找到相同或相似的问题,返回相应的答案,对于一些问题是FAQ库模式难以回答的,比如:用户提出一些叙述形式的问题或者与应用相关的算法实现等问题。对于这些类型的问题,本文基于课程知识本体设计了课程文档库来解答。课程文档库按章对《数据结构》课程的内容以树形结构组织,课程文档库中存储的是该门课程知识的集合,是完整的关于课程知识的体系结构,具有良好的结构性,便于查找。在查找时可以将父结点、兄弟节点和子结点的相关信息返回。提高了查询结果的准确性。

4 小结

本文通过对自动问答系统的相关研究进行剖析,结合本体技术的核心内容和特征,对如何使用本体来构建课程知识本体库进行了论述。以《数据结构》课程为例,建立了《数据结构》课程知识本体,基于课程知识本体又建立了课程的FAQ库及文档库,为后续实现课程自动问答系统中的知识组织和自动检索奠定了基础。随后进行的研究工作包括完善课程知识本体库、FAQ库及课程文档库,设计基于课程知识本体库的自动问答算法,实现课程自动问答系统。

参考文献

[1]Wu Y.,Zhao J.,Duan X.,Xu B.2005. Research on Question Answering & Evaluation:A Survey[J]. Journal of Chinese Information Processing,19(3):1-13.

[2]GRUBER T R.A translation approach to portable Ontology specifications[J].Knowledge Acquisition.1993,5(2):199-222.

[3]古华贞.基于本体的移动问答系统研究[D].大连理工大学,2006

[4]骆正华,樊孝忠,刘林.本体论在自动问答系统中的应用[J].计算机工程与应用,2005.

[5]叶忠杰.基于课程知识本体的智能答疑系统的研究与开发[D].浙江工业大学,2007

[6]周宁,张玉峰,张李义,信息可视化与知识检索[M].北京:科学出版社,2005

[7]王盛,樊兴华,陈现麟,利用上下位关系的中文短文本分类[J],计算机应用,2010

[8]冯成,陈智敏,领域本体建模方法的研究, 科学技术与工程[J],2009

[9]刘汉兴,林旭东,基于本体的自动答疑系统的研究与实现[J],计算机应用,2010

作者单位

文学常识题库范文3

一、数据库建设缺乏统一的规划、分工与合作

学校图书馆数据库建设是一项长期的系统工程,周期长、投入大、见效慢。长期以来,学校图书馆由于体制及隶属关系的原因形成了管理体制上条块分割,在客观上为统一分工、合作建设数据库增加了难度,再加之闭门造车、急于求成的现象十分严重,形成了各馆单独建设专题数据库,并普遍存在结构单一、规模小、专业面过于狭窄、缺乏建库规范和数据的录入标准等问题,影响了数据库的使用效率,产品的市场化、商品化更是无从谈起。

二、数据库制作的规范和标准化程度低

标引、分编、检索点选取没有严格的质量控制,数据库的建设各自为政,分别基于不同的系统。低水平的数据库在本馆或小范围内或许能够使用,一旦上网联机在全球范围内调用,它们的缺陷立即会显露出来,仅不同计算机系统的互联和数据的统一规范就会出现很多麻烦,甚至会严重到无法上网交换成为废库。

三、数据库在类型上比较单一

中文数据库居多,外文数据库、多媒体数据库偏少。单一类型的数据库只能给用户检索提供部分的帮助,不能满足读者从多渠道获取文献信息的需求,因此只有单一类型数据库的图书馆是不能令用户满意的。

四、学校图书馆数据库建设过程的方向把握不准确

馆藏文献数字化要把数量如此庞大的印刷型文献转化为数字化,不仅任务十分艰巨,而且数字化还需要大量的技术、设备、人力、资金、文献作保证。目前,同时具备上述条件的图书馆不多,中小图书馆就更是凤毛麟角。因此,学校图书馆还没有能力开展大规模的数字化工作,只能根据现有的条件对部分文献实现数字化,逐步推进此项工作。然而,一些部门的决策人错误地理解“发展”二字,片面追求数量,为了扩大政绩,他们不顾有无技术基础、设备条件、经营经验与经济实力,盲目建库。数量倒是增加了,但原本就相当紧张的人力、物力和资金被不断分散,不仅所建的数据库质量得不到保证,而且影响了学校图书馆日常工作的正常开展,真是有百害而无一利。

五、重复采购,保障率低

学校图书馆为了克服订购书刊资金的不足,不得不采取保刊压书、保品种压册数、保中文压外文的办法,集中在核心期刊、常用书刊的订购上。这种自我满足、实用化的原则便产生了你有我有、我无你无、重复率高、保障率低、学科覆盖能力低、难以形成有特色的馆藏文献资源,依据这样的馆藏“文献资源”所建成的数据库,其质量就可想而知了。在网络技术如此发达的今天,是完全应该避免的。

六、检索效果未尽如人意

一个可行的专题数据库检索系统应是外部特征检索、主题检索、分类检索、全文检索的综合应用。目前,已经建立的专题信息数据库大多只有外部特征检索和文本方式的全文检索两种检索途径。一般的用户都能快速简便地从作者、标题、日期、版次等外部特征入手查找资料,但前提是用户已事先知道要查找的资料所在的日期及其他信息,否则,用户要想扩大或缩小检索范围,查全查准资料,并非易事。数据库缺乏科学的、辅助的检索工具,影响了它的使用效果。

七、数据加工存储的格式众多

以文本方式存贮的全文检索,具有占用存储空间小、不需人工标引加工、便于查找文章细节、检索结果直接可靠、检索详尽彻底、使用简便易学等优点,但在不进行任何控制的情况下,文章中的每一个字、词均可成为检索点,无形中加重了检索方面的负担,使每次检索的文献量偏多,筛选量过大,用户检索所需时间长,直接影响了查准率,造成了检索噪音。

以图片方式存储的全文检索,必须进行耗时、费工的人工标引和技术加工,其标引难度很大,对“原文”内容又不能直接地逐字、逐词进行检索,由于“原文”采用链接方式,检索速度相对较快,但占用存储空间大,对古籍、档案、照片和含有特殊公式、符号的科技文献能进行原貌保存。因此要提高查全率、查?事剩?就必须提高文献的标引深度和数据的加工质量。

文学常识题库范文4

〔关键词〕知识管理视角;高校图书馆;特色数据库;建设路径

随着信息时代的到来,数字信息作为一种资源形式在高校图书馆建设和发展中发挥着越来越重要的作用,已经成为衡量一所高校知识信息资源建设的重要标志,日益成为高校图书馆实施数字图书馆建设的核心和关键[1]。但高校图书馆应根据专业优势及地区发展的要求建立具有自身特色的文献信息资源库,尤其是要通过对图书馆特色馆藏的数字化加工以及对具有院校、地域特色信息资源的收集、整理与数字化加工,来加强高校图书馆特色数据库的建设,以实现资源应用与共享;并通过提供特色服务最大化满足用户的学习研究需求,为教育教学、人才培养及社会经济发展服务。例如四川大学建设了巴蜀文化数据库、湖南大学建设了湖南人物数据库,成为传播地方文化、促进学校资源共享的有效载体[2]。建设知识管理视角下的高校图书馆特色数据库是高校图书馆应对信息时展的必然,为配合这一转变,高校应在资金投入、软硬件建设、管理人才配备及科学管理机制等方面综合实施,为实现高校图书馆特色数据库的建设打通一条有效的路径。

1知识管理视角下高校图书馆特色数据库建设的目标定位

1.1知识管理相关理念

在知识经济时代,知识对于经济发展的推动作用已越来越大,知识管理的相关理论研究方兴未艾[2]。所谓知识管理,其主要内容即是对知识本身的管理,特别是对知识的传播、转化及应用方面的管理。高校图书馆特色数据库的建设就是对知识的“高级”分类过程;而图书数据信息的查阅、应用及研究就是知识的转移过程。因此,为了研究知识转移与运用的价值,在知识的分类方面,专家们将知识划分为显性知识和隐性知识,显性知识是指正式的、可以用系统性语言或者公式、定理、符号进行有效传递的知识;隐性知识则是难以用言辞表达的、直觉的、尚不明细的知识。显性知识和隐性知识对知识管理的影响是非常明显的,但二者之间并没有分明的界限,而且在一定的条件下也可以相互转化。在目前情况下,通过计算机信息系统的技术方法对显性知识进行处理恰是图书馆特色数据库建设的一种方式与方向;但高校图书馆所提供的特色数据库信息服务也必将有助于显性知识与隐性知识的转化,从而形成知识转化、传播、应用和创造的循环上升过程。

1.2高校图书馆特色数据库建设内涵

高校图书馆特色数据库建设是指高校依托馆藏信息资源,针对高校教育教学、科学研究的文献需求,对某些专业或某些领域有利用价值的信息进行收集、分析、评价、分类、整理与存储,并按照一定的标准和规范使之数字化,以满足用户个性化需求的过程。特色数据库能够体现高效图书馆馆藏信息资源的特色,其所要求的特色不仅体现为信息资源具有他校所不具备的优势特点,还体现为数据信息资源的完备程度,以及为用户所提供的个性化信息服务方式。因此,要建设具有自身特色的高校图书馆数据资源库,就必须以高校专业特色及专题特色为根本进行选题项目的设计与实施,必须以地域文化特色及发展需要为基础进行数据资料的采集与处理,也必须以良好的社会效益和经济效益为追求进行辐射和覆盖。而要达到这一目标,还需要相关的市场调查与科学论证、做到人无我有、人有我优、人优我丰。广州高校特色数据库就各具特色。例如中山大学的突出的是教育文献数据库和珠三角文献数据库,而华南理工大学突出的是学科服务平台建设[3]。高校图书馆特色数据库的“特色”除了上述内涵,还应跟上网络技术及现代信息技术的不断更新与发展,使特色数据库更具科学化与现代化特征,以此促进高校图书馆的特色化建设迈上一个新台阶。

1.3知识管理视角下高校图书馆特色数据库建设目标

高校图书馆特色数据库建设的目标就是要突出专业、专题与重点,使图书数据资源更具高校专业特色与地域特色,除此以外还需达到以下目标:第一,通过特色数据库的建设使高校图书馆规模扩大。高校图书馆特色数据库的建设必须能够满足信息环境下高校教学及科研的需要,这应是高校图书馆特色数据库建设最基本的要求。随着高校规模的扩大及信息技术的飞速发展,高校教学科研所需的信息是非常多的,增长速度也是非常快的,巨量的信息供应与服务是现代数字图书馆必须保证的,这就要求高校图书馆必须扩大规模,特色数据库的建设过程也是数据规模扩大的过程。第二,通过特色数据库的建设丰富高校图书馆数据类型。特色数据库建设不是图书信息资料数据内容的单一化,恰恰相反,特色数据库的建设应该更能够满足高校多专业、多学科的教学需求。应在满足多种专业需求的前提下,突出数据信息资源在专业优势、区域特长及发展方向上的特色,注重书目形式以外的图文、图形、图像、音频、视频等多彩生动的数据信息资料,以提供更为丰富的个性化信息数据。第三,通过特色数据库的建设使高校图书馆更加开放。高校特色数字化图书馆的效益主要体现为其应用的广度、频度与效度,要以教学、科研,社会及经济效益的展现为评价依据。要达到这一效果,就必须使图书馆更加开放,更有利于知识的传播、转化与应用,充分实现数据资源的共建、共用与共享。

2知识管理视角下高校图书馆特色数据库建设的思想原则

2.1特色数据库建设的基本原则

高校图书馆数据库的特色化建设过程涉及到内容的收集、筛选、录入与运用,这一过程必须坚持数据库建设的基本原则,才能保持数据库建设的主旨与特色。首先,要突出数据资源的特色性。高校图书馆特色数据库建设是在现有纸质馆藏及电子数据资源基础上的重建,不是简单地扩建或补充,要以服务的特色化建设为理念,引导数据库的特色化建设。为此,应在传统数据资源的基础上,着重于某一领域、某一方向、某一主题,有重点地开发数据资源,使建成的数据库充分体现地域性、学科性、专题性和唯一性[4]。其次,要保持数据主题的一致性。建设数据库的环节之一是大量数据资源的收集,要收集什么样的数据资源,哪些资源是重点,哪些资源有利于突出数据库建设的特色性,都必须围绕一个统一的主题,要始终保持数据资源在主题上的一致性;无关或相关度不大的数据资源即便收集也要经过筛选过滤,避免冲淡数据库的特色性。再次,要统一数据系统的标准化。数据系统对数据资源的录入过程需要统一标准,使录入内容在同一个平台上同构化、兼容化,以实现数据资源的网络化共享与应用,有利于服务的规范化与标准化。当然,无论数据库建设要追求怎样的特色效应,都必须以实用和适用为根本,都必须以为客户提供高效的服务为根本。

2.2特色数据库建设的资源采集

高校图书馆特色数据库的资源采集应关注三个问题:一是主题选择,二是采集要求,三是资源来源。主题选择是开展特色数据库建设工作的前提和基础,选题要在调查研究和项目论证的基础上,将资源主题的内涵和外延加以界定。资源主题内涵和外延的界定应考虑以下因素:第一要立足本校专业特色及学科优势,即参考本校的有利教育资源——如师资力量、科研方向、科技项目成果、人才培养特色等——进行选题。立足自身优势特点即特色项目有益于突出主题、彰显特色,有益于建设独具特色的数据资源库。第二,要充分运用本校图书馆有优势、有价值、有特色的馆藏资源,在数字化的过程中将之进一步优化发展。第三,选题还要符合高校所在的地域特点,使建立起来的特色数据资源库既有特色,又能服务地域社会与教育、科技、经济的发展[4]。第四,选题要以服务学校教育及社会科学文化需要为宗旨,在满足各用户不同需求的同时,提供独具特色的信息服务。资源采集是特色数据库建设的重要环节,数据库的主题是否能够达到要求、凸显特色,必须通过数据资源的具体内容来呈现。因此,数据资源的采集必须紧紧围绕主题而开展,必须经过取舍、筛选与过滤、加工才能采用。数据采集的来源有现存馆藏资源、各种教学材料、师生科技成果、各种学术资源、网络信息资源等,通过规范化与标准化建设后纳入数据资源库。

3知识管理视角下高校图书馆特色数据库建设的实施路径

3.1开展资料收集工作

高校图书馆特色数据库建设的重点是围绕主题开展资料收集,在明确收集目标、收集要求及材料来源的前提下,做到人手充裕、渠道宽广、角度丰富、效果优良。首先,学校应成立特色数据库建设领导小组,集中组织、统一指挥,在领导小组的具体运作下,指派工作团队或由专人负责资料采集工作。为保证材料收集的快速、丰富与高效,专门团队人手要足,素质要高,业务精干,专业要强。其次,学校要广开渠道,通过与个体、学校、政府及社会等各方面、各部门的协同联络顺利开展有关工作;特别是高校教职员工,要做好他们的动员工作,将师生教学与科研成果收集作为一条主要渠道。再次,为保证数据库建设的质量,学校应做好宣传推广工作,要使各方都能积极配合数据库建设工作。

3.2建设数据库平台

高校图书馆特色数据库的建设离不开高质量、高效率、高水平的软件平台系统,软件平台必须能够有效完成数据库著录字段的定义、数据库导航设计、与管理、各种类型资料的电子制作、编目、著录等工作。黑龙江中医药大学建立本草古籍特色数据库,就开发了基于B/S模式的数字化信息平台,该平台具备加工、阅读、检索、日常维护、相互交流等多项功能[5],充分体现了现代信息技术在提高特色数据库应用效能中的积极作用。数据库平台建设要处理好以下几个问题:一是标准化建设。标准化是对不同类型数据材料的同构与融合,是数字图书馆健康运转的前提,只有遵循统一的规范和标准,才能实现用户和系统、系统和系统之间的有效沟通,实现图书馆数据信息的有效传递、快速获取与有效应用。二是导航库建设。学科导航库是以学科为单元对互联网相关学术资源进行搜集、评价、分类、组织和有序化整理的部分,可为用户提供简要的内容提示,使用户通过分类目录进行链接,并导引和检索出需要的学科资源数据库。三是安全性建设。特色数据库的开放与共享决定了安全的重要性。四是维护与更新。文献资料的电子化是一个系统过程,数据材料的组织、加工与整理等环节需要与维护、更新等环节衔接起来,以保持高效运转及良好的服务状态。

3.3配备专业管理人才

高校图书馆特色数据库的建设是一项专业性很强的工作,从数据库的规划设计到数据库建设工作的具体实施,从特色数据库的项目完成到数据库的日常管理,从数据库运转平台的服务应用到数据库的维修保养以及更新升级,都离不开专业化人才。为此,建库领导小组应制定合理、规范、严谨、科学的岗位职责,保证建库工作的顺利开展;应努力提高工作人员的专业素质、综合素质及工作能力,确保特色数据库项目建设与管理的高质量、高水平与高效率。

3.4制定科学管理制度

特色数据库建设是一个长期的过程,要保持整个项目过程的规范、有序及高效进行,就必须制定相应的科学管理制度,建立适宜现代化图书管理工作的制度机制,使特色数据库的建设工作也具有自身“特色”。建库工作主要围绕资料的收集、整理、数字化、标准化等工作展开,针对建库人员的科学管理制度也应因此制定。应积极引入IS09000质量管理体系,并结合数据库建设、管理的有关规章、制度,编写质量体系文件,提高图书馆特色数据库建设及管理水平,最大化发挥特色数据库的知识价值与应用效益。

作者:谭浩娟 单位:中南财经政法大学会计学院

参考文献:

1.郑志军.基于我国高校图书馆特色数据库建设现状及应对路径的研究[J].经营管理者,2014(15):78-80

2.周勇娟.高校图书馆特色数据库的可持续发展问题探讨[J].特立学刊,2013(4):61-64

3.陈锦波.广州大学城高校图书馆自建特色数据库现状调查分析[J].图书馆学研究,2013(14):45-51

文学常识题库范文5

关键词:自动评分系统;MSYQL;数据库

中图分类号:TP311 文献标识码:A 文章编号:1007-9599 (2012) 19-0000-02

1 引言

计算机专业是一门应用型的学科,其课程体系注重培养学生利用相关技术解决实际问题的能力,即实践动手能力。然而由于当前教学手段、考核内容、考核方式等原因,常常使得实践能力的考核成为很多计算机专业技术类课程教学效果难以提升的瓶颈。数据库技术是计算机应用专业至关重要的核心课程之一,本文分析基于MYSQL数据库系统平台下的实践考核的基本特点与不利因素,提出了一套切实可行的自动评分方法,取得了一定的成效,促进了课程的教学效果。

具体分析而言,传统的基于MYSQL的数据库课程实践考核存在以下不利因素:

1.1 考核过程效率太低。实践测试需要通过学生实际操作MYSQL系统完成相关的考核要求,而为了了解学生确实的实践能力,教师必须在学生身边观测其全过程,并对结果进行评估。如果一名学生一次考核需要90分钟,一名教师同一时间监督10名学生,则对于一般100人的考核就需要10个批次。这不仅耗费了大量的时间,也降低了实验机房设备的使用率。

1.2 考核内容覆盖面小。实践测试如果采用传统的人工出题、评分的方式,在测试试题的设计时,难免造成试题量较少,测试内容覆盖不全面。如果测试的强度和测试内容覆盖不全面,也必然会导致难以有效的评定学生的实践能力

1.3 评定有失公平。MYSQL数据库实践考核通常在局域网中进行,在考核内容、设备、环境相同的情况下,学生相互抄袭与作弊行为易于实施。例如学生可利用局域网中的文件传输软件实现考核结果的相互传递。

2 基于MYSQL的自动评分系统

根据上述基于MYSQL的数据库课程实践考核传统测试存在的不利因素进行分析,结合实际教学内容与实践环境,提成了一个可行的实践考核自动测评的基本方法,其基本步骤描述如下。

2.1 设计题库及确定考题分值。根据MYSQL数据库课程的相关内容,设计试题库、并确定不同知识点所占的分数比例。①表与数据库的创建(20分);②表结构的修改及索引的创建(20分);③数据操作(10分);④查询及视图(20分);⑤触发器与存储过程的创建(20分);⑥用户与权限管理(10分)。为了有效的利用目前常用的智能组卷策略,题库中试题应包含分值、难度系数、所属章节等属性。同时与笔试(理论)试题设计所不同的是,实践试题的设计需要注意各部分试题的连续性,使得学生的整个实践测试过程是对某一实例应用相关的各个环节进行完整地的设计,突出实践测试的应用能力测试目的。

2.2 设计测试的自动组卷策略。在线自动测评系统的一个重要的功能是实现试卷的智能组卷,以避免试题重复从而导致考试不公行为的出现。目前常用的智能组卷方法主要有随机抽取法、回溯试探法、洗牌算法、最大权法和遗传算法。由于实践测试试题量较小、试题题型单一,为了保证系统能够实现快速组卷、并尽快投入使用以评估系统的性能,我们采用随机抽取法来产生试卷。算法基本过程如下:①根据知识点范围对试题库试题进行编码。最终形成按不同知识点分布的试题整数段。例如表与数据库的创建部分试题编号是从1到30、表结构的修改及索引的创建部分试题编号是从31到70等。②创建列表TestList用于记录试卷中的试题,同时该试题保存于测试学生的考试信息中。③利用随机函数按照不同知识点试题整数的范围产生随机整数进行抽题。首先判断其是否在TestList中,如果是,则重新产生随机整数;如果不在,则判断该知识点题目分值是否达到事先设定,如果满足,则加入TestList。④利用SQL语句获取TestList中的试题,并按照预定格式组织成试卷。

2.3 设计考核基础数据库STM。基础数据库STM是用于考生实践操作的目标数据库,数据库包含用于考核相关试题的数据及其它数据库对象,数据库的设计要充分考虑到对于某一实际应用的各方面考核。STM数据库利用下面MYSQL语句做成备份,考核时由学生在指定的位置下载,或由教师分发。

Mysqldump –uroot –p –l -all-database>STM.sql

2.4 提交考核数据库STM。考生完成试卷所要求的实践操作后,利用指定的MSYQL数据库系统的备份指令,将STM及其日志文件(慢日志)进行备份,并将备份通过考试的WEB界面上传提交,以便进行评分。

2.5 考核评分。考生提交完操作数据库STM及日志文件后。进入考核评分阶段,该阶段分别使用两种策略。

①自动评分。考试服务器根据考生提交的带有考生编号的STM备份文件,可实现计算机自动评分。首先导入考生数据库,然后针对不同考试内容采用不同的评分策略,主要过程是检测MYSQL系统表的记录信息、以及对比操作执行的结果集。评分完毕后将得分存于考生信息中。②人工评分。在考生存在争议或计算机自动评分失的情况下,教师利用学生提交的慢日志文件进行人工评分。根据学生抽取的试题,对比日志中记录的相关SQL语句即可判分。

整个MYSQL数据库实践考核的自动测评过程流程图如下所示:

3 结束语

上述MYSQL数据库的实践考核自动测评系统,能够在很大程度上克服实践考核存在的过程效率低、易作弊以及考核覆盖面窄的问题。在相关课程的上机实践考核过程中,该系统极大的提高了考核效率,同时使得考核过程的更加规范、公平、能力评估的更准确。通过以考促学,获得了良好的教学效果,有效的提升了学生的动手实践能力。

参考文献:

[1]张力.计算机自动评分[J].中国科教创新导刊,2011,13.

[2]杨涛等.《数据库原理》课程教学改革探讨[J].中国科技信息,2011,21.

[3]黄立.全国高校计算机考试机试评分系统方案设计[J].玉林师范学院学报,2006,5.

[4]唐汉明等著.深入浅出MYSQL数据库开发、优化与管理维护[M].人民邮电出版社,2009,3.

[5]金汉均,郑世玉,吴明武.分段随机抽选法在智能组卷中的研究与应用[J].计算机应用研究,2003,20(9).

文学常识题库范文6

但是,由于政策与机制、技术手段与设备、社会信息意识、人员素质等多方面的原因,我国地方报纸信息数据库的建设尚存在许多问题。本文通过对上述地方报纸信息数据库的现状与存在问题的分析研究,提出一些设想和改进措施,以期对今后地方报纸信息数据库、电视台、电台新闻数据库以及其他数据库的建库工作实践提供一点参考和借鉴。

1 地方报纸信息数据库建设存在的问题

1.1 宏观调控不力,数据库建设重复现象严重

由于国家、地区间的宏观调控不力,主观上缺乏统一规划的思想意识,技术上缺乏网络环境的支持,属于事业单位的各报社缺少需求分析和用户界定,也很少注重数据库的利用率问题,致使各地方报社自行投资建库,造成数据库规模小,缺乏竞争机制,建库方式单一,在选题上重复与空缺并存,造成人力、物力、财力的极大浪费。例如《南方日报》、《广州日报》和《羊城晚报》,各自都建有报纸信息数据库。由于同属于广东地区的地方报纸,相当一部分内容是重复的。像“中国新闻”、“国际新闻”、“广州新闻”、“体育新闻”、“天气预报”、“金融证券信息”等报道,因为消息来源是一致的,所以几乎每天的内容都大同小异。

目前,从总体上看,地方报纸信息数据库开发重复现象严重;而从个别来看,由于地方报纸信息的地方性、复杂性与时效性和技术支持不够,以及人员专业素质较低等因素的影响,普遍存在现有的报纸信息资源开发不足的问题。

1.2 检索效果未如人意

一个实用可行的报纸信息检索系统应是外部特征检索、主题检索、分类检索、全文检索的综合应用[1]。目前已经建立的地方报纸信息数据库大多都只有外部特征检索和全文检索两种检索途径(见表l)。

表1 广东部分地区报纸信息数据库可检字段一览

单 位

外 部 特 征 字 段

内容特征字段

广州日报

(起始)时间、时间版次、作者、标题

关键词

南方日报

(1993-1996)日期、作者、标题、栏目刊头、头版头条、版名、版次、体裁、版序、类目

(1997-)日期、标题、版次、版名

类目名称

关键词

羊城晚报

(1991-1993)(起始)时间、时间版次、作者、标题

(1994-)标题、作者、时间、专栏、版次、注释(专题报导名称等)

专栏名称

关键词

深圳特区报

标题、作者、时间、版次、地区、来源

关键词

一般的用户都能快速简便地从作者、标题、日期、版次等外部特征入手查找资料,但前提是用户已事先知道要查找的资料所在的日期及其他信息,否则,用户要想扩大或缩小检索范围,查全查准资料,并非易事。数据库缺乏科学的辅助检索工具,影响了它的使用效果。

全文检索与其他检索途径相比,虽然具有不需人工标引加工、便于查找文章细节、检索结果直接可靠、检索详尽彻底、使用简便易学等优点,但在不进行任何控制的情况下,文章中的每一个字、词均可成为检索点,虽在输入方面大大节省了人力和存贮空间,却加重了检索方面的负担,使每次检索命令中的文献量偏多,筛选量过大,用户检索所需时间长,直接影响了查准率,造成了检索噪音。再加上“假义词”、同义词大量存在,更容易造成漏检错检,难以保证查全率和查准率。

1.3 人员素质及其知识结构影响数据库发展进程

由于多方面原因,我国新闻资料从业人员整体素质不太高,知识结构不合理。据调查统计,具有高级职称的新闻从业人员仅占全部人数的5%[2],信息学情报学专业毕业的工作人员更是凤毛麟角。近年来,一些沿海经济发达地区、尤其是广东地区的新闻资料从业人员的大专以上学历的比重有所增加,但大部分属于后继学历,而且学科专业不对口,从整体而言,同样存在素质不高、知识结构不合理的问题;负责开发数据库的计算机技术人员一般都不甚了解数据库所属专业,而数据库所属专业人员反过来也不懂计算机技术;负责开发报纸信息数据库的计算机技术人员,一般都不熟悉报纸信息的分类、主题标引等业务工作,同样,从事报纸信息业务的工作人员通常都不懂得计算机程序编写及系统设计等知识,或是只懂得一些计算机的基本操作。因此,常常囿于双方的沟通和知识结构差异的问题,都会不可避免地、或多或少地影响数据库的发展进程。

1.4 商品化程度尚低,不能向社会开放

目前我国已建的地方报纸信息数据库大多只供本单位内部使用,一般不能向社会开放,能提供商业化服务的更是屈指可数。其原因是:

(1)地方报社的行政体制束缚了信息服务的社会化与商品化进程。

(2)信息市场发育水平低,信息的价值与价格关系没有理顺,地方报纸信息服务的社会化与商品化缺乏大环境。

(3)社会信息化意识不强。一方面建库者对数据信息的社会性认识不足,只想独霸,不愿共享;另一方面是社会公众缺乏利用现代化手段获取信息的意识,习惯于从行政渠道下达的政策文件中获取信息,形成了信息需求上的惰性,即使是横向联系也要通过上级管理机构进行协调;加上对地方报纸信息数据库了解不多,或是由于网络通信等问题而放弃使用数据库。

(4)缺乏必要的资金投入与人力投入。数据库是属于技术知识密集、资金密集和劳动密集型的事业,没有足够的资金、人力及技术力量的投入,难以快速启动建成并维持长期正常运转和提供服务。目前多数地方报社资金仍然比较困难,人手短缺,信息数据库的工作人员大部分都是身兼数职,常常忙于内部服务,很难再向社会开放或开展商业化服务。

1.5 未能突出地方特色

大部分的地方报纸信息数据库,都只是把报纸上所刊载的内容收录入库,而没有进行深层次开发,没有把地方报纸信息数据库的地方特色发掘出来。

目前我国地区经济发展水平不一致,尤其是有一些特定的地区、一些经济发展互动地区,这些不同的地区具有不同的地域文化(包括民俗和历史)、不同的人才群落、不同的文化研究机构、不同的信息资源、不同特色的地方产品等等。所有这些都会在地方报纸上有所反映,如果在建设地方报纸信息数据库时,能把这些地方特色发掘出来,就能更好地为新闻工作者乃至全社会提供服务。2 地方报纸信息数据库发展的设想

在因特网席卷全球、我国“十大‘金’字号国民经济信息化工程”建设实施的形势下,笔者针对目前我国地方报纸信息数据库建设的现状及存在问题,提出如下的发展对策与设想:

2.1 采取地区联合建库方式

联合或合作建库应是信息网络时代的首选和长期的建库方式[3] 。地方报纸信息数据库更应如此。

由于地方报纸的地方性与部分新闻来源的一致性,同一地方的地方报纸的许多内容都大致相同。如果随着地方报纸信息数据库服务的社会化,社会各界对地方报纸信息的需求也会越来越大,人们期望在一个数据库中就能查阅本地区其他报社的报纸信息。在这方面“教育文献数据库”就是一个联合建库的例子。“教育文献数据库”是在广东省高等教育厅教学处领导下,成立建库领导小组,联合中山大学图书馆、佛山科技学院图书馆、广州师范学院图书馆等11所高校及师范院校图书馆共同参与建设,分散建库,数据共享。该库是“广东省高校图书馆网络系统工程”的一个重要组成部分,收录全国重点教育刊物上发表的文献,重点收录广东和港澳台出版的教育刊物(包括有关教育方面的地方报刊和年鉴),为各级行政部门、教育科研机构和各级各类学校的教育教学与科学研究提供教育信息。该库的建库领导小组定期召开成员馆主管馆长及建库工作人员工作会议,协调建库工作;举办培训班,培训各成员馆负责标引和录入人员,以保证数据库的质量。从1995年底开始建库至今,共录入数据15000余条,数据形式包括索引、文摘和部分全文,定期出版书本式索引文摘,提供教育信息。它不但得到了国家教委和广东省高教厅的大力支持和充分肯定,而且还受到了国内外专家同行的好评。

“教育文献数据库”的经验表明:联合建库是今后我国数据库建设应该选择的一种建库方式。因此,地方报纸信息数据库建设应该采取以下模式:在国家有关部门的宏观调控下,在各省市委宣传部的直接领导下,联合本省、本地区的地方报社共同建设地方报纸信息数据库,分工建库,数据共享,同时注意突出各报的特色;并通过信息网络与本省市的其他专业报社、其他各省市地方报社和专业报社联通,组成全国报纸信息网络,进入覆盖全国的信息国道,充分开发和利用地方报纸的信息资源。

2.2 建设若干个实用的子库

地方报纸信息,是一种具有浓郁地方特色、内容庞大、时效性强、类型繁杂、各种新名词、新术语不断涌现等特点的综合性信息。为了方便建库和用户检索,根据实用性原则,地方报纸信息数据库可建成若干个子库,如人物数据库、会议数据库、经济新闻数据库、法律法规信息数据库、体育信息数据库、广告信息数据库、文娱信息数据库等。

2.3 突出地方特色

地方报纸信息是全面反映某一地区政治、经济、科教文化的知识宝库和信息源。随着改革开放的深入发展,它对地方经济社会发展的咨询决策作用、物质文明建设和精神文明建设的推动作用日益增强。发掘地方特色应该是地方报纸信息数据库开发工作的重点。如广东毗邻港澳,与港澳形成多形式、多层次、多领域、多元化的经济合作关系,广东在改革开放中市场经济体制占有明显的优势;同时又具有商贸优势,一向是华南的商贸中心;并拥有大批来自全国各地的“南下人才”。所有这些得天独厚的优势,都是广东特色。应当把这方面的报纸信息资源开发出来。《南方日报》社资料室从1996年开始在这方面做出了大胆的尝试。

2.4 扩大收录范围,满足多层次、综合性的社会需求

作为地方报纸的专门信息数据库系统,新闻无论大小最好全部收录,要为查阅资料提供可靠的依据,力求做到只要是报上刊登过的,数据库都应能提供线索,找到具体内容,所以应该保证一定的完整性。

随着社会信息化程度的不断提高,地方报纸信息数据库的开发利用势必会越来越受到重视,新闻工作者及全社会对地方报纸信息的需求也会向综合性、多层次发展。地方报纸信息数据库必须将收录范围尽可能地扩大,才能满足需求。

2.5 建立实用的检索系统

一个实用的地方报纸信息检索系统应是外部特征检索、主题检索、分类检索、全文检索的综合应用。目前主题检索和分类检索仍比较薄弱,甚至空缺。

2.5.1 主题检索

建立主题检索系统的关键环节是主题标引工作。主题标引的一致性、准确性直接影响文献检索系统的查全率和查准率。主题标引是对事物的特定对象及其各个方面的问题进行研究和探索,它可集中不同类之中的相关主题,人们可以从不同的角度对某一事物进行检索提问,解决了多主题、新概念层出不穷等复杂资料的加工处理及检索问题,并能充分发挥计算机的先进技术。

2.5.2 分类检索

由于一直沿用的《新闻资料分类法》已经陈旧、已不再适用于日新月异的报纸信息,各新闻单位有的根据本报纸信息的特点自编分类法;有的在《新华社分类法》的基础上根据需要进行修订,改造成本报专用的分类法。再加上部分新闻工作者不习惯或不懂得从分类途径检索,致使分类检索系统利用率不高,甚至部分原设有分类检索模块的建库单位最近都放弃了分类标引。但必须指出的是,尽管目前存在着缺乏权威的地方报纸信息分类法,也不能失去分类检索这个重要的检索入口。建议编制专门的地方报纸的分面分类法。由于现有的新闻资料分类法均不适用于地方报纸新闻资料的分类,在很大程度上影响了分类标引的进行,如果能够组织有关专家学者编制专门的地方报纸的分面分类法,将会有利于各地方报社开展分类标引的工作。

2.6 建设多媒体地方报纸信息数据库

多媒体技术集声、文、图、影像、动画信息形式于一体,不仅可以用键盘和鼠标操纵计算机,而且可用笔语言、触摸屏幕来与计算机对话,使人们与计算机的交流达到自然会话的境界。建设多媒体地方报纸信息数据

库是信息时代的需要,也是新闻工作者及社会各界人士的迫切需求,如能建立多媒体的地方报纸信息数据库,必将为全社会提供更高质量、更为方便的服务。2.7 在信息网络的环境下向社会提供服务

随着因特网的迅速全球化,以及我国“十金工程”的建设的全面展开,利用信息网络高速、优质、便捷、廉价地传输和共享信息已经从梦想成为现实,为地方报纸信息数据库向社会开放提供了非常有利的环境和条件,使信息资源共享成为了可能。

《广州日报》图书阅览中心率先向社会敞开了大门。从1997年元旦开始,凡订《广州日报》一年或一年以上的社会各界人士,只需交纳45元的借书押金及5元的手续费,均可办理该中心的借书证,免费上机检索该报数据库,上网浏览电子报刊和借阅图书报刊资料。迄今已有200多人办理了借书证,其中以大专以上学历的人居多。可见,不但新闻工作者需要地方报纸信息,其他工作在各条战线的人们也有着同样的需求。尽管《广州日报》图书阅览中心的做法距离地方报纸信息数据库商品化的要求尚远,但毕竟开了向社会提供电子版地方报纸信息服务的先河,其经验十分值得推广和借鉴。

笔者设想,各省市、地区地方报社联合建设本省市、本地区的报纸信息数据库,并通过信息网络与本省市的其他专业报社、其他各省市的报纸信息网络联通,组成全国报纸信息网络,进入全国的信息国道,走向国际互联网络。在这样的信息网络的环境下,地方报纸信息数据库向社会开放、提供有偿服务,将会使地方报纸信息数据库兼得社会效益和经济效益,走上良性循环的发展道路。

参考文献

1 宋明亮 我国报纸信息数据库开发的现状与对策 中国图书馆学报,1995(1):60~65

2 李献线 关于建设和发展我国新闻数据库的思考 中山大学硕士学位论文,1996:20

3 曹树金,罗春荣 论信息网络时代图书馆的数据库建设和服务选择 高校文献信息学刊,1994(3 ~4):24~27