不同信息管理系统间数据集成及应用

不同信息管理系统间数据集成及应用

【摘要】信息管理系统为信息的管理提供了便利,在保证信息管理质量的同时,解放了人工,降低了工作强度。但是不同信息管理系统之间由于技术等因素的影响,难以实现数据共享,存在着比较严重的信息孤岛问题。对此,本文提出了以Oracle数据整工具实现不同信息管理系统间数据集成的方法,并就其应用情况进行了简单分析。

【关键词】信息管理系统;数据集成;应用

前言

数据集成,指将来源不同、格式不同、特征显著的数据信息从物理或者逻辑层面上进行集中,为相应的管理工作提供可靠的数据支持。数据集成的应用,可以实现不同信息管理系统之间的数据传递和共享,有效解决了信息孤岛现象,为管理效率的提升奠定了良好的基础,也因此受到了广泛的关注。

1.数据集成的意义

想要实现不同信息管理系统之间的数据集成,需要系统对自身的数据表结构、数据编码等信息进行公开,方便不同应用间的信息交换,对数据的分布性和异构性问题进行解决。考虑到数据来源的广泛性,在不同信息管理系统中,得到的数据统计结果可能缺乏一致性,甚至会存在较大的差异性,导致这种问题的原因不仅仅是数据来源的差异,还有数据的同步更新问题。对此,必须对数据来源的唯一性进行规范,以数字化校园为例,学生系统中包含学生的基本信息,人事管理系统则包含教职工的信息。应该保证不同业务系统新数据的共享,将对应的业务系统作为数据的唯一来源。如果需要对信息源数据进行变更或者添加,需要从实际需求出发,做好其他系统相关数据的同步更新,保证数据信息的完整性和准确性[1]。

2.数据集成的实现

2.1数据集成模型

就目前而言,比较常见的数据集成模型有三种,一是联邦数据库系统,在半自治型数据库IT的基础上,增加了相应的数据访问接口来保证数据共享,形成的单元数据库既相互独立又彼此协作;二是数据仓库,常见于企业管理或者决策中,属于一种面向主题的、集成的、不可修改同时与时间相关联的数据集合;三是中间件模型,可以结合统一的全局数据模型,实现对异构数据库以及Web资源的访问,这里的中间件存在在于应用层和数据层之间,可以对不同数据源系统进行协调,形成通用的数据接口和统一的数据模式。中间件模型能够在中间层提供统一的数据逻辑视图,实现对底层数据细节的有效屏蔽,从用户的角度看,集成数据源是一个统一的整体,在实际应用中更加便捷,这也是当前应用最为广泛的一种数据集成方法。

2.2项目结构类型

数据集成环节的项目创建方法有两种,一是以具体数据为对象的流程化项目结构,面向的是具体的数据流;二是以需要进行数据集成的系统为对象的系统化项目结构,面向的是两个数据库系统。相比较而言,系统化项目结构更加清晰,也具备更好的可扩展性,只需要增加集成操作,就能够满足新的集成需求。

2.3ODI工具

ODI是对OracleDataIntegrator的缩写,其本身属于数据集成平台的一种,采用开放式架构,基本上能够实现对所有常见的关系数据库的支持,基于Java的特点使得其能够实现跨平台的数据处理,能够通过与中间件的结合,融入到IT架构中。与其他数据集成平台相比,ODI本身最大的特点,是知识模块的应用,能够将部分场景的详细化操作步骤记录其中,为用户的调用提供方便[2]。(1)全量集成与增量集成:全量集成,即一次性将数据源中的所有数据集成到目标数据库中,其本身对于服务器性能的要求较高,不过能够保证目标数据与数据源数据的完全一致,不容易出现误差;增量集成则是指仅仅将业务系统中出现变化的数据信息进行同步,适用于数据量较大的数据集成,能够在很大成都上减轻服务器和网络的负担。从技术层面分析,想要实现数据集成,可以采用的方式有三种,包括触发器、标志位和日志位,触发器方式较为常见,其基本原理,是在数据源上建立相应的触发器,结合触发器实现对于数据源中发生变化数据的记录工作,然后将数据集成到目标数据库中,对于没有发生变化的数据,不会进行同步。需要注意的时,触发器数据集成的前提是信息管理系统必须开放相应的权限,以确保触发器的合理设置和运行。(2)实时集成与定期集成:实时集成是采用轮询的方式对数据源的数据变化进行监测,如果发现其出现变化,则会自动进行数据同步,同步的精度可以达到秒级,多用于对数据实时性要求较高的信息管理系统中。定期集成也称绝对时间集成和相对时间集成,前者指在某一个固定的时间点进行数据同步,后者则是指设定相应的数据同步周期,如每小时同步一次,或者每天同步一次。如果数据实时性不强,或者一次性需要同步的数量较大,则可以选择定期集成的方式[3]。

3.数据集成的应用

以高校数字化校园的建设为例,设置了十数个信息管理系统,多数采用的都是Oracle数据库,由于系统数量较多,库表结构相对复杂,想要实现数据的集成,需要从几个方面着手:

3.1需求调查

通过需求调查,可以对系统的性能进行明确。以教务系统为例,需要能够从公共数据库中获取教职工信息、学生缴费信息等,可以从人事管理系统和学工管理系统同步获得;同时,教务系统还需要获取单位组织结构代码表以及校区代码表等,这些表通常都存储在公共数据库中,提供给所有信息管理系统共享。

3.2数据处理

对于不同信息管理系统中得到的数据,需要做好必要的处理工作,一是利用某一关键字段,实现来源数据表与目标数据表的相互关联;二是针对来源数据表中的字段,将目标数据表中的资源与之建立起一对一的映射关系,如果发现两个数据表中的字段属性不一致,则可以在目标数据库字段上,附加相应的字符转换语句,对其进行转换。例如:caseWhenSTUDENT.SEX=“男”then1else2endsubstr(T_JZG.zjh,7,4)|“-”|substr(T_JZG.zjh,11,2)|“-”|substr(T_JZG.zjh,13,2)|“00:00:00”.

3.3数据同步

结合需求分析和用户调查,利用ODI能够从教务系统中提取相应的表格和字段,然后在公共数据库中建立共享视图或者数据表,结合不同信息管理系统的需求,选择相应的数据集成方法和数据访问策略,制定出良好的数据同步方案[4]。

4.结语

总而言之,针对不同信息管理系统之间相互独立而存在的信息孤岛问题,应该做好相应的数据集成和数据共享。需要明确,伴随着信息技术的飞速发展,应用也在持续深入,想要实现数据集成,需要对数据交换信息标准进行补充,对共享数据库的维护规则进行完善,以保证良好的数据集成效果。

参考文献

[1]练亚雄,袁志刚,万晓卿.用ODI实现信息管理系统间数据同步和共享[J].电脑编程技巧与维护,2012,(8):41-43.

[2]练亚雄.不同信息管理系统间管理系统间数据集成的研究与实现[J].上海应用技术学院学报(自然科学版),2012,12(3):234-239.

[3]张德刚,张少泉,彭庆军,等.电力企业异构数据集成研究[A].电力行业信息化年会,2014.

[4]王利军.基于分布式数据库的天然气信息集成管理系统研究与应用[D].西南交通大学,2011.

作者:李诗宇 单位:中国农业大学经济管理学院