图书馆管理中数据挖掘的应用

图书馆管理中数据挖掘的应用

一、数据准备

我们这里只是做一个比较简单的挖掘分析,所以我们只考虑近两年读者的借阅情况,因此我们要先做一下数据的预处理,把两年之前的借阅信息弃掉不用,这两年每年的借阅数量和总借阅数量留待下一步聚类分析使用。由于读者的情况变化可能会很大,因此近两年的数据更具代表性,用来进行分析也会更加贴近读者的真实需求。

二、对数据进行聚类

在这里我们使用k-means算法对第一步中清理出来的数据进行聚类挖掘,设置聚类个数为3.代表把读者一共分成3个大类,一类为频繁借阅者,一类为普通借阅者,一类为偶尔借阅者.分好类之后我们就可以针对不同的读者提供不同的、更加符合读者需求的、个性化的服务了。按照以下几个步骤对收集的数据进行聚类分析:(1)把目标对象划分成n个非空子集(聚类);(2)计算每个聚类中所有点的坐标平均值,并将这个平均值作为每个聚类的中心;(3)计算每个点到聚类中心的距离,将每个点聚类到离该点最近的聚类中心的聚类中去反复执行(2)、(3),直到聚类中心不再进行大范围移动或者聚类次数达到要求为止下面是虚拟的聚类结果。

三、挖掘统计结果分析

上文介绍的挖掘方法比较简单,仅仅是从借阅数量方面衡量了读者的需求情况。但是在实际应用中也有很大的可应用、可扩展潜能。对于挖掘出来的第一类频繁借阅者,我们可以适当的增加其借阅数量的上限,这样可以更好的满足他们的需求;对于第三类偶尔借阅者,我们可以继续采用其他的挖掘方法挖掘他们的兴趣范围和较少借阅的原因,从而相应地改善图书馆的服务,为读者们创造更好的阅读条件。这样把读者分类之后再进行数据分析,可以更加精确地挖掘出不同读者的不同需求,可以给不同需求的读者提供更加个性化的服务。

四、数据挖掘在图书馆中的应用

例如利用关联规则分析图书借阅种类方面的联系,从而改善图书馆的布局;利用决策树的方法来对读者的阅读方向进行分类。从而提供个性化的推荐服务等等。本文仅从一个方面对于数据挖掘在图书馆的应用进行了分析,窥一斑而知全豹,数据挖掘在图书馆数据处理方面的应用是广泛而有效的,可以进行更深一步的研究与开发。

在现如今这个知识大爆炸的年代,各方面的知识和数据都应该受到广泛的重视与深入的研究,然而,这些信息鱼龙混杂,如何取其精华弃其糟粕就成为了当务之急,通过一些现代化信息技术的使用,我们可以提升获取信息的速度、分离出有价值的信息、根据这些信息改善服务水平。随着技术的不断发展,图书馆的服务也正在从被动化服务转向主动化服务,从简单的信息接收转向为信息检索、信息利用。

五、总结

总而言之,数据挖掘技术在图书馆数据管理与应用方面的应用前景非常的广阔,随着科学技术和图书馆硬件设备的快速发展,数据挖掘技术在图书馆的应用将实现巨大的发展和长足的进步。

作者:宋丽军 单位:同济大学软件学院