大数据在图书馆管理中应用

大数据在图书馆管理中应用

摘要:网络时代的迅速发展使得人们的生活有了质的飞跃,同时网络的广泛应用也使其产生了繁多的网络大数据,通过大数据分析可以决策出用户的消费习惯、消费比例等,从而预测出企业重点发展的方向,因此,大数据分析是十分重要且有价值的。现如今,大数据分析已经被广泛应用于各个行业领域,也能够为各领域做出合理的预判和决策,一定程度帮助企业更好地发展,这就使得图书馆管理中通过大数据分析用户喜欢的图书类型数据成为必然趋势。

关键词:大数据分析;图书馆管理与服务;应用

图书馆的图书种类、借阅和归还记录数据均种类繁多且复杂,图书馆管理员对此类数据的整理挖掘工作不仅耗费时间同时也耗费人力、物力,大数据分析技术能很好地解决这一问题,且其对数据的挖掘更为精准和高效。大数据分析技术将分析出的数据通过可视化图形界面展示,以供图书管理工作者分析和管理满足用户需求的书籍,使得人们在快节奏的生活中能得到解脱,畅游在书本中。

一、大数据的发展

以史为鉴可以知兴替,因此想要深入了解互联网技术,就必须清楚知晓其发展变化史,大数据亦是如此。首先大数据概念和技术提出于20世纪初期,与之对应的数据模型mapreduce应用而生,同年,谷歌完成了基于此模型的开源实现,即handoop的产生,mapreduce模型提出初期并未被业内人士所关注和重视,同样的handoop平台未被广泛且全面的使用,主要原因是当时大数据概念提出和其价值探索正处于萌芽阶段,人们对大数据没有深入的概念认知和了解,同样也不会关注大数据挖掘平台。2008年第一家以大数据挖掘为理论基础,以handoop为开发平台的企业诞生了,当时大数据挖掘和其价值性还处于探索中,因此其只为部分的中小型企业提供大数据解决方案。2009年3月,该企业了第一款基于handoop开发平台的分部式数据挖掘系统,同年,大数据发展迎来了曙光,迎来了业内人士的关注和重视,多数企业开始跃跃欲试。2008年以后,第一家启用handoop分布式开发平台进行大数据挖掘的企业尝到了甜头,同时也通过企业的努力和对技术的探索向互联网企业和业内人士证明了大数据的挖掘价值,当时有两家互联网企业也投入到handoop的数据挖掘中。发展至今,大数据已经成为耳熟能详的技术,也成为人尽皆知的词汇,这一切都离不开业内人士和相关互联网企业对技术的探索和对市场的定位。如今,大数据提高了各种领域、各类企业的数据处理效率和精准度,同时也依据互联网数据准确的预测出市场变动和市场需要。如大数据挖掘会依据淘宝平台的搜索记录推荐用户需要购买或可能购买的物品;再如,商场的人流量数据可以挖掘出商场应该拓展的业务,使其更好的服务于消费者。这一切都来源大数据技术,其对人们的生活带来了本质的改变和极大的便利。

二、大数据技术

大数据是指人们使用网络工具所产生的数据,如淘宝、京东、医疗数据、多媒体数据等,此类数据对用户是不可见的,但电商平台或网络企业会通过一定的采集技术获取用户的搜索记录或浏览记录,将数据按照一定的格式存储在数据仓库,然后通过计算机软件进行分析和处理,进而得出用户的消费记录或有利于企业发展的预测数据。大数据的发展也使得各领域企业能够适应用户需求而发展进步,也因其对数据的预测功能被广泛应用于媒体行业,以预测用户需求。1.数据集成大数据类型繁多且复杂,不同企业需要采集的大数据也各有不同,这就使得大数据集成极为困难,统一的工具很难满足不同企业的应用数据,因此大数据平台对其分门别类,对不同的数据类型使用不同的集成工具。如采集企业事物数据的ETL工具、采集网页浏览数据的Spider爬虫工具、采集企业产品运行的日志工具、采集结构化数据的文件数据集成工具、采集实时数据的集成工具等。2.大数据保存引擎数据类型不同存储的引擎方式不同,如企业大数据使用数据库引擎保存事务型数据,对地图大数据多采用实时搜索和分析引擎存储,对于普通数据、视频数据等多采用数据仓库存储,数据仓库会按照数据类别分门别类的保存数据,以供计算机软件分析和处理。3.大数据分析处理数据的集成和存储就是为了更好的分析数据,大数据经过分析处理以后就非常具有商业价值,能够为企业、电商平台、商场等提供可以参考的预判数据。大数据处理分析多使用计算机相关软件,如地图数据使用EMC的GreenPlum、Oracle的Exadata,数据实时性要求不高时可使用MySQL的列式存储Infobright、视频音频文件等大数据可使用Hadoop。这些都是技术较为成熟的数据分析软件,这些软件可以根据企业需求设定预先目标,对数据进行分析处理以供数据挖掘。

三、大数据的价值

1.技术价值大数据开发的技术价值不言而喻,其互联网技术涵盖范围极为广泛。首先是数据采集工作,各类互联网数据或企业数据大多繁杂,且数据产生多具有实时性,因此其采集工作极为复杂,要求必须保证数据的可靠性、完整性以及时效性,且需要对重复性数据进行合理有效的过滤。目前,数据采集主要依靠于运营数据库、社交网络和传感设备等,不同的数据需要的采集技术也不尽相同。这对技术人员和计算机技术是极大的挑战。其次,数据预处理阶段则主要针对数据的遗漏值、噪音数据、类型不一致数据等的处理,遗漏数据多采用忽略处理或选取平均属性处理;降噪处理多选用平滑处理或计算机人工检查等,类型不一致数据则直接采用手动更改即可。最后,数据挖掘则采用以mepreduce模型实现的开源的handoop分布式平台进行开发,语言多采用java程序设计语言,这对专业技术类人才有较高的要求,必须了解各类开发语言。因此,大数据技术极大推进了互联网技术的发展和新型技术的变革。2.商业价值大数据并非只是浅显的互联网数据,其背后蕴藏着巨大的商机,大数据可以挖掘出任何潜在信息,如客流统计、客户定位人群、企业营业额、商场店铺人群等多种与企业发展相关的数据,以此为依据可以有效的帮助企业决策和发展。数据不仅是度量方式,对其进行合理有效的挖掘能够对市场营业状况进行合理的推测和决策,有助于企业进一步了解市场需要和客户需求,从而推算出潜在客户。大数据的商业价值在于企业的运营具备更高的效率、更低的市场营销成本、更为可靠和准确的市场调研及产品定位,长远来看,其商业价值不可估量。

四、大数据在图书管理中的现状

1.图书管理工作者无法摒弃传统管理方式图书馆的管理对象是书籍,多数图书馆均依照传统的编码方式对书籍进行统计管理,且图书管理工作者多为年长的教育工作者,其很难摒弃传统的管理方式而借助先进的信息技术,因此图书馆的运营模式整体依旧保留传统的管理方式,甚至在引入大数据技术后管理者依然难以接受新生事物,造成资源浪费,排斥先进技术是目前多数图书馆管理中存在的问题。2.缺乏综合性管理人才目前,图书馆引入大数据挖掘技术的重要阻碍就是人员素质问题。大数据技术中搜索、查询等技术需要工作人员具备一定的计算机基础,或对大数据技术有一定的了解,尤其是在处理繁多复杂的图书书籍和借阅数据时,大数据技术的处理效率和精度远高于人工处理时效,因此图书管理工作者必须会利用大数据技术管理图书数据。提高图书管理工作者的综合素质是当务之急。3.缺乏完善的管理体系目前,图书馆管理服务极为落后,图书查找仍依靠人工和编码校对,大数据技术引入后管理体系正处于发展和变革阶段,管理体系尚未完善,同时,管理人员也缺乏基础的计算机技术。大数据技术的引入也并未得到管理工作人员的重视,使得其显得格格不入,不能被真正的发挥数据管理方面的作用。

五、大数据在图书馆管理中应用

大数据采集、存储、分析技术恰好能够适应图书馆管理工作中繁多且复杂的数据类型,通过大数据分析技术能挖掘出读者喜欢的书籍类型,形成大数据分析报告,同时也能为图书馆管理工作做出适当的决策和业务分析。1.精准分析读者的阅读兴趣图书馆管理服务中可以通过搭建大数据平台对读者喜爱的书籍类型进行定位和分析,数据采集渠道可通过读者借阅信息和书籍借阅流量等数据作为分析数据,进而对其集成存储,通过计算机软件分析统计,挖掘出有价值的数据线索,以供管理工作者定位分析。此类平台都有可以满足图书馆管理工作者参考的可视化界面,上层数据是大数据挖掘出的可用数据,底层是相关数据分析软件。大数据可以帮助图书馆管理工作者分析读者喜爱的书籍种类,同时也可帮助整理读书资料等,以便读者借阅。2.振兴书籍阅读图书馆管理工作中引入大数据挖掘技术对通过书籍阅读的方式产生了巨大的冲击,电子书的智能性、数字化、易携带等优势使得书籍阅读的读者数量逐年递减,毫无疑问在阅读方式的比拼中,书本阅读的方式远不及电子书籍。大数据技术的引入使得书本阅读的方式有了很好的转机。大数据技术为书本阅读方式提供了迅速变革的新想法也提供了相应的技术手段,同时大数据技术在图书馆管理员服务中的应用使的书本阅读和电子书本阅读可以进行优势互补、信息共享,极大程度提升书籍阅读的竞争力,这需要相关工作部门和专业类人才勇于探索实践,为振兴书籍阅读开辟出一条成功发展之路。大数据技术支撑的图书馆管理工作应该具有数据收集能力和数据分析处理能力,不论是书籍数据、借阅和归还数据、管理人员信息等都需要具体的数据做支撑。图书馆管理员人员也需要摒弃传统的管理理念和管理方式,尤其是图书馆的领导者,更应该摒弃传统的思维模式和观念,放弃保守、落后的管理方式,与时俱进,保证图书管理工作的先进性和社会性。真正将大数据技术引入图书馆管理工作中,切实可靠的发挥信息技术的真正作用,形成大数据背景下新型的图书管理模式,从而吸引更多热爱阅读的读者,使得大数据技术真正服务于民生。如果管理人员依然保留传统的观念和思维方式,拒绝接受新鲜事物则会一定程度延误书本阅读方式的发展和机遇。3.完善图书馆管理系统传统的图书管理系统只提供图书出版商、供应商、出版商等数据查询检索等,并未完成平台一体化的数据分析,后台的支撑数据也多为数据库中固有的、由工作人员定期管理的图书数据。传统的图书管理平台的时效性极差,图形界面也只为读者提供了非常简单的界面和查询窗口,读者也只能进行简单的操作,非常不符合与时俱进的信息技术规范,也无法满足读者的需求。因此,传统的图书管理系统中引入大数据技术作为后台数据支撑已经成为时展的必然趋势。引入大数据技术的图形管理界面更为人性化,更能满足读者的各项需求,同时板块设计中有依据大数据决策而出的读者喜爱书籍分类。读者在借阅和查询图书时能够全面掌握图书信息,大数据挖掘也会依据读者的搜索记录为读者提供相关的同类书籍以供读者参考。大数据技术也完善了固有的书籍数据库,摒弃了传统的依靠人工修改数据库的模式,而且使用大数据采集和存储的相关计算机技术将书籍数据保存至数据库中,并由软件控制定期更新数据库,从而减少了人力成本。4.为图书馆管理工作带来变革大数据从对图书馆书籍数据和借阅归还数据进行全面分析,将分析后的数据通过可视化界面展示给图书馆管理工作者,以供管理工作者做出数据分析,选择读者感兴趣的书籍分类,从而为数据存储做出合理规范的决策。此种数据分析方式彻底摒弃了传统分散、独立的资源整合流程,同时也融合了之前分散的书籍管理方式。当然,大数据的精准化、信息化能够在提高书籍管理效率的同时解放人力,提升了图书馆管理的经济效益,使得图书馆更好地发展。图书馆管理工作中引入大数据技术是时展的必然趋势,大数据技术会以书籍数据为依托,搭建数据管理平台,建立完整的数据库,并在此基础上不断的扩展变革,从而建立健全完善的管理体系,并协调各环节的发展变化和统一。同时,新技术的引入离不开人才建设,因此相关部门需要培养和打造信息技术过硬的专业型人才队伍,尤其的需要培养适合于图书管理工作特点的数据分析师,全面为振兴书籍阅读方式增添色彩。

六、结束语

综上,图书馆管理和服务引入大数据分析技术能为其带来全方位的改革,当然两者融合不是一蹴而就的,大数据分析技术在图书馆管理中的应用也不仅仅局限于文章提到的方面,相关工作人员需要不断地探索实践,充分发挥大数据分析技术在图书馆管理工作中的应用,以保证图书馆的经济效益和读者的需求。

作者:周玉华 单位:广东省深圳图书馆