挖掘特色文化资源的方法范例6篇

挖掘特色文化资源的方法

挖掘特色文化资源的方法范文1

【关键词】数据挖掘 个性化服务 数字图书馆

一、数据挖掘技术概述

数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、新颖的、可被人理解的、但又是潜在有用的模式的过程 。其主要特点是对数据库中的大量数据进行抽取、转换、分析和其他模型化处理,从中提取辅助决策的关键性数据。数据挖掘根据其主要研究对象的数据结构形式的不同,一般分为数据挖掘、文本数据挖掘、Web数据挖掘三类。

1.数值数据挖掘,通常称为数据挖掘,它的任务一般可以分为描述和预测两类,具体地说,挖掘功能包括发现概念/类描述、关联、分类、预测、聚类、趋势分析、偏差分析和类似性分析。常见的数据挖掘方法主要有:归纳学习方法、仿生物技术、公式发现、统计分析方法、模糊数学方法、决策树、遗传算法、贝叶斯信念网络、粗糙集及可视化技术等,由于各种方法都有自身的功能特点以及应用领域。

2.文本数据挖掘是面向文本信息的数据挖掘。当数据挖掘的对象完全由文本类型组成时,结合使用数据挖掘算法与信息检索算法对巨量文本信息进行自动化信息处理与分析的过程叫文本数据挖掘。它包括特征提取、文本摘要、文本分类与聚类、概念操作以及探索性数据分析等工作。文本数据挖掘所应用的技术包含用于表示文档的词频反文献频率向量表示法、词串表示法,用于文本分类的贝叶斯分类算法、词集合算法,基于概念的文本聚类算法以及 K—最近邻参照分类算法等。

3.基于 Web的数据挖掘。Web数据挖掘的定义是:针对包括Web页面内容、页面之间的结构、用户访问信息、电子商务信息等在内的各种Web数据,应用数据挖掘方法以发现有用的知识来帮助人们从WWW中提取知识,改进站点设计,更好地开展电子商务。

通过Web数据挖掘,我们可以从数以亿计存储大量多种多样信息的Web页面中提取出我们需要的有用的知识,包括用户访问行为、频度、内容等内容,根据这些内容和知识,来改进站点设计,优化我们的Web页面,包括页面内容安排、页面间关联结构优化以及开展有针对性活动和特色服务内容等,使更多用户能够更方便、更快捷的找到所需要的信息和享受到所提供的服务。Web数据挖掘在数字图书馆的开发和利用将发挥越来越重要的作用。根据Web数据挖掘对象的不同可分为:Web结构挖掘、Web内容挖掘和Web日志。

二、图书馆的个性化服务概述

所谓个性化服务,就是服务要体现个性,同时具有主动性的特点,实现个性化服务的关键是在“信息找人”过程中什么信息找什么人。其本质就是对于不同的人、不同的要求提供不同的服务,以满足不同用户的特定需求。常见的服务方式有个性化推荐、个性化检索、个性化网站。个性化推荐服务如信息推送服务,一种按用户指定时间或发生的事件把用户选定的数据自动发送给用户的技术,其本质就是主动性服务,几乎不需要用户做什么事,系统自动按照用户的信息需求提供相应的服务。个性化主动服务将使用户通过尽可能小的努力获得尽可能好的服务。数字图书馆的个性化信息服务首先就是要为用户创建个性化的信息资源库,即个人数据库。通过图书馆网络,用户向图书馆系统提交所定制的个性化信息,用于构建个人信息数据库,建立个性化网站。针对不同的个人信息,即对不同的用户采用不同的服务策略,提供不同的服务内容,如提供个人书架和信息检索服务等,不同人的个人书架内容是不完全相同的;对于相同的检索提问,系统反馈给专家的以及普通用户的内容应该有所区别的。

三、数据挖掘在图书馆个性化服务中应用

1.优化馆藏资源配置,提高资源利用率

传统图书馆资源的配置、服务的提供,由于受人工采集信息的影响,因此不可避免的受到采集者的知识层次、知识结构以及个人爱好等因素的影响,而带有主观性。采用数据挖掘技术则可以较好的解决这一问题。(1)利用数据挖掘技术,对流通记录、检索请求等日志数据进行分析,就可以得到各类文献流通借阅情况,了解读者的借阅行为和爱好。根据这些信息,有针对性的补充和丰富文献资源,剔除过时文献资源,或减少文献信息资源的副本数,甚至可以根据这些挖掘信息,调整图书馆的人力、物力资源的分配,从而达到资源优化配置,合理布局目的。(2)对数字图书馆的结构进行挖掘,目的是发现数字图书馆页面的结构和结构模式,在此基础上对页面进行分类和聚类,或对相关网页进行分析,从而可以评价网页的质量,优化检索方式,指导网站建设,便利用户对数字图书馆使用,提高数字图书馆的利用率。

2.完善信息资源建设,提升个性化服务质量

通过对流通记录、检索请求等日志信息的挖掘,所得到的信息,可以对图书馆的读者群有一定的了解,但对于完善信息资源建设,提升个性化服务质量,还是不够的。完善信息资源建设,需要多方面的收集信息资源,提升个性化服务质量,就需要对读者有一个比较准确和全面的了解,在前面提到的数据挖掘的基础上,还要从以下几个方面进行挖掘:(1)对数字图书馆的内容进行挖掘。基于数字图书馆的内容的挖掘是通过对数字图书馆信息的模式识别和分析理解,从中发现有意义的知识。根据某一领域的信息需求,自动捕捉、采集和整理领域所需信息, 过滤无用冗余信息,通过信息推送等方式,直接数据挖掘所发现的知识,提供给读者,主动提供个性化服务。(2)对数字图书馆的用户进行挖掘。从数字图书馆的大量访问信息中挖掘用户的访问模式、访问兴趣,采用关联性法则和聚类方法发现不同的用户群体,然后对这些不同的群体提供信息定制服务。同时还可以利用web挖掘所得到的信息,动态地调整web页面,更好地满足读者的需要。通过对用户访问信息、使用信息的挖掘,在数字对象和用户、对象分类和主题之间进行模式匹配,采用不同挖掘技术自动提取知识,从而确定个性化服务内容,提高为用户知识服务的自动化水平。(3)此外,收集整理图书馆网上咨询、荐购书刊等栏目中的数据,利用数据挖掘技术,可以预先发现读者群体的兴趣,调整馆藏方向,提升馆藏资源的针对性。

四、结束语

随着信息技术的发展,特别是数据挖掘技术和数据库技术的在图书馆领域中的应用,对图书馆界产生了深远的影响,不仅是观念上的革新,而且潜移默化了传统图书馆的用户服务模式。伴随智能化技术的进展,个性化服务有着相当广阔的前景。如何提供优质的个性化信息服务应当是我们始终共同关注的焦点。

参考文献

[1]邵峰晶,于忠清.数据挖掘原理与算法.北京:中国水利水电出版社,2003:91-115.

[2]朱晓华.浅析数据挖掘技术在图书馆自动化中的应用[J].图书馆学研究,2002,5.

挖掘特色文化资源的方法范文2

关键词:档案网站;特色资源;资源建设

内容建设是档案网站[1]更好更快发展必须遵奉的圭臬。目前,国内档案网站多因缺乏特色而不为大众熟知。为进一步凸显特色以吸引档案用户关注,提升网站服务质量和水平,就必须狠抓特色资源建设。

1 档案网站的特色资源定位

笔者认为,档案网站特色资源是发掘馆藏特色档案并于档案网站公开,能准确反映和展示档案蕴藏的历史文化、风土人情、特殊事件、名人名胜、名优特产等丰富内容,方便用户利用的档案信息资源。其认定标准为:一是这些档案资源须来源于馆藏档案;二是须有鲜明的时代特征与典型性;三是能强烈体现某时某地独有的社会、经济、文化等现象;四是有丰富的内涵供挖掘,有重要学术研究和参考价值。

如河南省档案信息网[2]的中原经济区专栏,及时中原经济区建设的相关政策、研究成果、实施方案、具体措施等档案信息,体现了当前河南省经济社会发展的重要举措,具典型时代特征,可为当前和今后研究这一专题提供丰富翔实的档案资料。

2 档案网站特色资源建设现存问题分析

2.1 现状及存在问题

据笔者调查,目前,国内档案网站多以特色栏目来展现特色资源,如“珍档荟萃”、“城市变迁”、“历史文化”、“热点聚焦”、“民风民俗”、“档海拾贝”等栏目,一定程度上体现了各自特色,但总体来看,在特色资源建设上还存在一些问题。主要体现在:

2.1.1 特色资源数量不够充足。网站内容相对单一,多是局(馆)职能、工作和利用服务信息,馆藏资源与学术研究信息较少,多载体类型档案资源更少,就连业内公认的北京和上海档案信息网[3]的资源类型也仍以文本和照片为主,远不能满足用户需求。

2.1.2 特色资源内容挖掘深度不够。要么,是以仅配有简短文字说明的图片形式展现,缺少有深度的档案知识与文化的挖掘;要么,是可读性不强的整篇文字,很难给人留下深刻的印象。

2.1.3 特色资源整体设计与文字编辑缺乏个性。各档案网站整体设计与栏目设置相似度较高,页面虽然整齐但色彩单调,语言表述也不生动,吸引力不强,特色资源建设更乏善可陈。

2.2 原因分析

2.2.1 档案机构思想上不够重视。从调查来看,各档案网站特色资源建设多不太受重视,栏目和形式虽已初具,但反映馆藏特色的信息资源还太少。以河南省的档案网站[4]为例,其栏目和内容都很丰富,但从内容到形式雷同,很难体现出栏目特色,仅有网上展厅和特色档案栏目可见特色资源,这种情形在国内档案网站较普遍。目前,各档案网站更多只是作为档案工作宣传的窗口,缺少档案网站特色资源建设动力。

2.2.2 档案网站特色资源建设的经费投入不足。各档案机构虽开展了诸如档案数字化项目、档案管理系统平台建设项目等档案信息化建设项目,但经费更偏重档案信息化软、硬件设施的建设及投入,强调技术,在特色档案资源的内容组织、研发项目上明显投入不足,结果网站虽技术成熟但特色档案资源匮乏。

2.2.3 档案网站特色资源建设的人才缺乏。调查发现,档案网站各板块的建设人员不少是兼职,专业化程度不高,时间不保证,责任感和专业感知度不足,维持网站内容更新尚可,凸显特色档案资源很难实现。

3 档案网站特色资源建设策略

3.1 特色资源建设需要多方面人员共同参与

3.1.1 档案人员。档案人员熟悉馆藏特别是珍品档案,在档案网站特色资源建设中很有优势。但现实中,档案人员研究能力普遍不强,无法发掘馆藏特色档案从而更好地展现档案文化,还须大力提高和改进。

3.1.2 档案学术研究者。档案学术研究者科研能力强,重视第一手资料的挖掘和应用,但对馆藏特色档案资源不太了解,需要与档案人员配合才能充分发掘利用好特色档案资源,更好地展现档案文化内涵。

3.1.3 网络编辑与网络技术人员。网络编辑是网站内容的设计师和建设者,通过网络收集和信息并与用户互动,熟知网络用户需求,可配合档案人员与学术研究者,逐步完善特色档案资源建设。同时,档案网站资源建设需要网络技术人员提供技术保障,以确保网站安全运行以及档案信息和用户信息的安全。

3.2 档案网站资源建设需要专业策划

档案网站比传统档案业务更具优势,能及时信息并提供档案利用服务,有学者认为,档案网站已构成了信息网络的一个节点[5]。虽然,档案网站扩大了档案机构的职能与功能,但本质还是档案机构进行档案信息宣传与服务的平台,要进一步体现特色、更好地发挥价值,须在档案网站资源建设上加强专业策划力度。

档案部门单方建设档案网站和传统的服务模式很难达到理想效果。应采取项目建设方式,由档案机构提出网站特色资源建设项目,聘请专业机构进行创意、规划和实施,以提升档案网站的吸引力。如,英国国家档案馆网站请专门的课程讲授团队研发视频会议课程,服务效果极佳,被授予“2010年学校视频会议课程最佳内容提供者奖” [6]。

此外,利用馆藏资源创作相关知识的动画、游戏等也是提升档案网站吸引力的好创意。澳大利亚档案馆网站(http://naa.gov.au/)以动画展示馆藏资源,在“环境”主题中设计了一款由用户率团队穿越南极寻找企鹅的动画游戏,游戏中巧妙穿插南极实地的档案照片,使孩子们在趣味游戏中学会识别地图,潜移默化增强孩子们的综合素质和能力[7]。

3.3 须加大档案信息产品研发力度

档案网站特色资源建设中档案信息研发成果必不可少,要结合利用需求加大研发力度,并注意加强以下两个方面:

3.3.1 科学做好选题策划。选题策划是对研发项目的总体规划和构思,预测其价值和效益,以便有目的、有计划地开展档案信息编研,一般包括选题名称、选题依据及目的、选题酝酿情况、选题内容简介及形式、读者对象、时间安排、成本效益等内容。

3.3.2 深入挖掘档案资源。档案信息产品研发须深入挖掘馆藏档案资源,揭示其蕴含的文化知识。

一是利用馆藏档案挖掘特色资源。如上海档案信息网“世博档案苑”专栏,向中外用户完整提供上海世博会从申办、筹办到举办全过程的珍贵档案资料。再如北京档案信息网全面系统的民生档案,方便公众随时查询利用,更是别具特色且有重要的现实意义。

二是利用馆藏档案挖掘教育资源。国内档案馆是爱国主义教育基地,发掘馆藏国主义教育资源是其基本职责。这方面,国外一些档案馆网站资源建设倒可资借鉴。曾有6500多名学生一年之内通过英国国家档案馆网站的在线视频会议和视频教室使用了原始档案资料[8],学习了“英国内战”、“妇女参政运动”、“中世纪印章”和“奴隶制”等内容。澳大利亚档案馆网站的教学资源,针对馆藏特色和师生需求,将馆藏分为“澳大利亚历史概况”、“民主和公民”、“环境”、“联邦和澳大利亚宪法”、“人与社会”、“总理”、“一战及影响”、“二战”主题,均针对特定年龄段孩子设计,方便其学习历史知识,更注重培养孩子们对档案所蕴含文化价值的兴趣[9],从而增强了用户对档案馆的了解及对档案的认知。

当然,档案网站信息的真实性正是其特色所在,因此,内容挖掘须注重真实性。如果对档案内容存有疑问,应对其进行充分考证,或存疑不论,决不能妄加断言,这样,才能体现出档案研究成果的可靠性。

增强网络档案信息编辑能力,首先,应考虑档案网站设置网络编辑岗位,聘请专业人员专门从事档案网站信息编辑工作。

其次,是档案信息的文字表述要规范易懂、有感染力。可借鉴报刊文章的写法,既保证档案信息内容不失真且具有学术性,又可有效提升其趣味性、可读性,吸引更广泛的网络用户群体阅读、转载。

同时,应采用平面设计和网站技术等手段,使页面切合档案信息内容,图文与音、视频相配套,不仅版面美观而且内容以多媒体形式展现将更具吸引力。

3.5 适当增设用户个性化档案资源建设板块

3.5.1 在网站增设个性化档案资源建设板块,网站定主题,用户依自己的特长和兴趣,系统收集组织相关资料后在特定板块发表文章,方便用户之间、用户与档案人员之间沟通交流,共建档案网站特色资源。

3.5.2 网站开设有奖征文,公布评奖细则,提供档案利用优惠服务,要求用户挖掘馆藏档案,发表在指定板块,评选优秀并发一定奖金。用户利用第一手档案资料可提升学术研究的严谨性,也促进了馆藏档案的实际利用效果,能有力推动档案文化知识的传播。

总之,为更好展示档案网站的特色和水平,就要强化以馆藏珍品档案为基础的特色资源建设,以项目形式实施,鼓励多方参与来共同策划、研发体现历史文化和民族特色,具有典型性且内容丰富的档案信息产品,真正以内容建设推动档案网站更好更快发展。

注:本文为国家社会科学基金项目《档案网站信息资源的开发与服务研究》(项目序号:09BTQ029)的阶段性研究成果。

参考文献:

[1] 本文所指档案网站主要指档案局(馆)为主体建立的档案网站,此类档案网站数量最多,具有典型性。

[2][4] 海 陈飞.河南省市级档案网站建设情况调查分析[J].档案管理,2011(2):57~60

[3] 熊瑶、李文佳.国内外城市档案网站资源建设调查分析[J],浙江档案,2012(1):12~15

[5] 范宗斌 赵春萍.论档案网站的定位[J],档案学研究,2005(1):51

[6][8] 杨太阳.英国国家档案馆获“最佳教育内容提供者奖”[N].中国档案报,2010-12-30,第3版

挖掘特色文化资源的方法范文3

关键词:大数据;信息化导学平台;教育数据挖掘;登陆行为;资源浏览行为

中图分类号:TP311文献标识码:ADOI:10.3969/j.issn.10036199.2017.01.027

“稻萸动学校,分析变革教育”的大数据时代已经来临,利用教育数据挖掘技术和学习分析技术,构建教育领域相关模型,探索教育变量之间的相关关系,为教育教学决策提供有效支持将成为未来教育的发展趋势。“大数据”的出现,将掀起人类教与学的又一次变革。

1教育数据挖掘及其价值

教育数据挖掘是一个将来自各种教育系统的原始数据转换为有用信息的过程,这些有用信息可为教师、学生及其家长、教育研究人员以及教育软件系统开发人员所利用。[1]教育数据挖掘也可被看作是嵌入已有教育系统的一个新的模块,并与教育系统中的各种要素产生良性互动,最终实现改进教学的目的。[1]教育数据挖掘对于我们教育工作者来讲,教育数据挖掘的作用主要是向我们提供更多更客观的反馈信息,使我们能够更好地调整和优化教学策略、改进教学过程、完善课程开发,基于学习者的学习情况来实现教学内容组织、创新以及构建教学模式等。[2]根据数据挖掘的应用领域,可以将教育数据挖掘分为ELearning(教学)数据挖掘、EManagement(管理)数据挖掘和EResearch(科研)数据挖掘。而在ELearning(教学)数据挖掘领域.[3]本文,主要是从ELearning(教学)数据挖掘应用出发,基于我院的信息化导学平台日志数据,对学员的学习行为进行分析。

2学生在线学习行为分析教育数据挖掘模式构建

学习者在线学习行为分析主要是基于网络教学平台对师生学习过程的记录数据,针对行为主体(教师、学生)的行为方式(登陆、浏览资源、在线交流等)、行为客体(各类资源、网路课程模块等)的被使用情况以及行为发生时间进行统计、可视化和各类挖掘,并结合师生的特征数据对影响在线学习行为的因素进行挖据。

教育数据挖掘模式为完成特定挖掘任务而建,是多种数据挖掘工具和算法的集成应用。

教育数据挖掘模式由“数据挖掘工作”“工具与算法”以及“数据”三要素构成。[4]“工具与算法”为数据挖掘工作提供支撑,并产生相应的“数据”,如图1所示。这三个要素在时间上的展开将分别形成数据挖掘工作流、工具与算法流以及数据流。其中数据挖掘工作流包括数据收集、数据预处理、数据挖掘、模式解释评价与应用等环节。其中,学习过程数据挖掘模式用于学习过程及学习行为分析,其挖掘模式如图2所示。

其中,在数据挖掘工作流的核心环节,主要的数据挖掘任务有学习者登陆行为分析、学习资源浏览模式分析、学生行为影响因素分析等。

3基于信息化导学平台的学生学习行为影响因素分析

计算机基础课程信息化导学平台,是我院自行开发并已广泛投入使用的计算机类基础课程在线自主学习平台。该平台具有较强的交互性、开放性、跟踪性、反馈型,教学资源丰富多样[5]。学员通过该平台进行自主学习过程中会产生大量的各种日志数据,如学员的登陆行为数据信息、学员对各种资源的浏览情况的数据记录等。本文主要采用网络日志分析这一非反应性研究方法及相关分析、差异检验、聚类分析等数据挖掘方法,对学员的在线学习网络日志进行细致深入的分析,以探索学员在线学习行为的内在影响因素。

3.1数据采集与预处理

以15级学员为主,选取了学员的基本信息数据和在使用信息化导学平台时产生的登陆、资源浏览、学习体验等日志数据,以及学员在使用形成性考试平台时产生的考试数据,共四份数据。将这些数据导入数据库,形成四张数据表。这四张数据表的关联通过“学号”这一字段来建立。如图3所示。经过联合查询,对这四张数据表进行交集运算,取得这四张表中共有的学员,共1265名。然后将这1265名学员对应的基本信息数据、登陆数据、资源浏览数据和形成性测验数据作为分析对象,进行统计分析和数据挖掘。

3.2学员学习登陆行为描述与影响因素分析

在登陆行为数据表中,学生学号和登陆时间是两个主要字段。本文不以学生的登陆次数为计数单位,而是以某个时间单位的登陆人数来统计。如果以登陆次数来统计可能会由于个别学员的反复登陆而造成学员学习强大的假象。因此,本文主要以登陆时间 “周”为分类字段统计学员的登陆率(登陆平台的人数除以学员总数);以学号为字段统计每个学员的登陆天数。本文以 2015年10月11日课程开学日所在周为第一周,该课程的持续周数15周。

(1)以时间段“周”为单位统计,发现学员群体学习的周期

对于学员个体而言,学习周期是不确定的。但是从教学这的角度来说,需要了解整个学员群体的学习周期,即通过登陆平台的记录,分析统计多长时间内整个学生群体都会登陆参与学习,以衡量群体在线学习开展的速度。作为教学者,需要了解,随着学习时间的推移,有多少学生不再来学习了,以衡量群体在线学习终止的速度。通过对每周累计登陆率的统计分析得到学员的学习周期,如图4所示。

可以看出,到第5周,有40%的学员参与了在线学习;第6周开始急剧增加;到最后一周,所有学员全部参与了在线学习。这说明,学员整体开展在线学习的速度是慢的,提醒教学者应该加以干预,如在第2周就应该督促学员登陆导学平台参与学习。作为教学者,也可 以此为参考对教学资源在时间上进行合理分配。

(2)影响学员登陆行为的影响因素分析

Microsoft决策树算法由Microsoft SQL Server Analysis Services提供的分类和回归算法,用于对离散和连续属性进行预测性建模。对于离散属性,该算法根据数据集中输入列之间的关系进行预测。决策树根据向特定结果发展的趋势进行预测。对于连续属性,该算法使用线性回归确定决策树的拆分位置。该算法原理是:通过在树中创建一系列拆分来生成数据挖掘模型。这些拆分以“节点”来表示。每当发现输入列与可预测列密切相关时,该算法便会向该模型中添加一个节点。该算法确定拆分的方式不同,主要取决于它预测的是连续列还是离散列。为了提高效率,微软决策树采用了两层结构,在建树算法和数据库直接设立了一个数据挖掘中间件,如图5所示。

综合考虑学员的层次(本科、飞行员、士官)、专业、性别三种因素,本文采用Microsoft决策树算法构建挖掘结构和挖掘模型,对学员的登陆行为(以天数为衡量单位)影响因素进行分析。以层次、专业、性别为输入值,以登陆天数为预测值,建立如下图6所示的决策树。

其中的比例比为 登陆天数 “ 不少于5天”的学员与 “少于5天”的学员的比例。通过分析结果可以看出,层次、专业、性别对登陆天数的影响程度是不一样的。层次影响最强,其次是专业,最后是性别。其中,飞行员、士官层次学员的登陆天数明显低于本科层次学员;飞行员和士官层次之间,飞行员的登陆天数要高于士官层次学员;而在某个层次内,如本科层次,不同的专业之间学员的登陆天数差别也有明显区别(由于保密原因,这里不便明确具体专业信息),而性别对登陆天数的影响最小。依据这些分析结果,教学者可以对不同层次、专业的学员在线学习行为进行合理的引导和调整。如对于本科层次内,不同专业之间的登陆行为之所以有较大差别,是因为不同的专业由不同的学员队进行管理、其专业指向性也有所不同,因此学员的学风有较大差别。学员管理者可以依据分析结果,对相应的学员队进行有针对性的加强管理,以提高其学习效果。

3.3学员资源浏览行为描述与影响因素分析

计算机基础课程信息化导学平台中的学习资源丰富多样。其中,课程包含了我院计算机基础类的所有通识课程,主要有《大学计算机基础》、《计算机程序设计》和《计算机硬件基础》三门课程;课程的教学资源一般按照案例、章节和知识点进行编排,资源类型有操作视频演示、Flas交互操作、类型丰富多样的测试题等。通过学员对各门课程以及课程中相应资源模块的浏览日志进行统计分析,以找到影响学员浏览行为的因素。统计分析结果如表1所示。

可以看出,从各资源模块的被使用程度和被学员的关注程度来看(主要通过“浏览频次”和“学生参与率”反映),由高到低依次是课程各章节案例库、视频资源区、Flas交互区、问题库、辅助资料库、常用软件工具库,这些恰好是这些资源模块在课程首页由上而下呈现的顺序。这说明各课程模块首页的布局反映了学员的学习习惯,也可能是这种布局对各资源模块的被使用程度产生了影响。对课程资源模块设计的指导意义在于,要使某种资源得到学员的关注,应将其置于相应课程模块首页的显著位置。

从学员对课程各资源模块的学习情况来看(主要通过“单个资源人均浏览频次”),由高到低依次是Flas交互区、问题库、课程各章节案例库、视频资源库、常用软件工具库、辅助资料库。学员对Flas交互区的学习程度最高的原因主要是,该模块采用动画以交互的方式让学员学会相应的操作,更能激发学员的学习兴趣,吸引学员反复学习。学员访问程度次高的是问题库,说明学员有较强的通过常见问题库来解答学习过程中各种疑问的需求。今后应该进一步丰富问题库,并将问题库的检索区域置于课程首页的显著位置,以便及时方便地解答学员的各种疑惑,帮助学员完成相应课程的学习。

4结论

本文通过对15级学员基于计算机基础信息化导学平台进行在线学习时产生的登录数据和资源浏览数据进行统计、挖掘分析,发现了学员在线学习行为的一些基本特点及其影响因素。从群体角度看,在线学习行为在时间的分布上相对均衡,以周为时间段第6、7周的学员登录率最高;从个体角度看,学员在线学习时间相对较少;影响学员在线学习时间投入的内在因素有层次、专业及性别等因素,其中层次因素是最重要的因素。相同层次的学员,不同专业之间的学员在线学习投入的主要影响因素是其专业,而这与其专业特点和所在学员管理队有较大关系;学员对不同资源的学习程度的不同主要取决于资源在课程页面上的分布、学习资源的特色及学员的自身需求,若想要某一类型的资源引起学员的足够重视,可以首先将其置于课程首页的显著位置,同时要基于学员的兴趣改进资源的特色等。

参考文献

[1]洪雪峰.教育数据挖掘下的学习效果探析[J].长沙铁道学院学报:社会科学版,2014(5):196-198.

[2]BIENKOWSKI M,FENG M,MEANS B.Enhancing Teaching and Learning through Educational Data Miningand Learning Analytics:An Issue Brief[M].Washington,D.C,2012.

[3]BAKER R S J.Data Mining for Education.International Encyclopedia of Education[M].3rd ed.Oxford,UK:Elsevier,2011.

[4]RAMASWAMI M,BHASKARAN, CHAIDR A.Based Performance Prediction Model in Educational Data Mining[J].IJCSI International Journal of Computer Science Issues,2010(1):10-18.

[5]魏Q.基于“信息化导学平台”的翻转课堂教学模式[J].计算机教育,2016(2):73-78.

挖掘特色文化资源的方法范文4

网络信息的数据挖掘不仅包括对网页内容本身的挖掘,也包括其链接模式,以及用户访问、存取、浏览、、操作等操作行为、访问行为所产生的信息的挖掘。有效地研究、挖掘、利用网络信息可以增强网站的吸引力,有的放矢地吸引用户群,更有效地利用网络资源。

一、 网络信息资源及其特点

网络信息资源是指放置在英特网上能满足人们信息需求的信息集合。网络信息资源极其丰富,包罗万象,其内容涉及农业、生物、化学、数学、天文学、航天、气象、地理、 计算 机、医疗和保险、 历史 、 法律 、 音乐 和电影等几乎所有专业领域,是知识、信息的巨大集合,是人类的资源宝库。网络信息资源是一种新型数字化资源,与传统 文献 相比有较大的差别。网络信息资源具有一下特点:

1、数量大,类型多传播范围广。网络信息类型多样,有文本、数据、图像、图形、声频、视频信息、多媒体信息等;内容既有高质量的信息,也有有害信息和虚假信息,有个人信息也有在政府信息。最为特殊的是各种非正式信息被广泛生产与传播。

2、网络信息资源没有统一的管理机制,信息安全缺乏保障。黑客攻击、计算机病毒和色情泛滥成为网络的三大痼疾。为防止有害信息耗费了大量的社会资源。

3、网络信息资源分布零乱无序,信息更新快,寿命短,管理相对困难。信息自由,来源广泛,内容混杂,质量不一,控制也比较困难。

4、以网站为信息活动的单位,以网页为信息和收集的单元。

5、信息利用水平取决于网站软硬件的技术水平和服务能力,网络信息提供方式是以网站为基点并可在网站间灵活链接的信息服务网。

6、网络创造了多层次的信息交流模式,全面反应了社会生活的各个领域,形成了百科全书式的知识网络和传播功能。

二、 数据挖掘的语言

数据挖掘语言有助于数据挖掘系统平台的标准化,推动数据挖掘应用的发展。数据挖掘语言根据功能和侧重点的不同,可分为三种类型:数据挖掘查询语言、数据挖掘建模语言、通用数据挖掘语言。

(一)数据挖掘查询语言dmql

数据挖掘查询语言dmql由数据挖掘原语组成。数据挖掘原语用来定义一个数据挖掘任务,通过查询的方式实现与数据挖掘系统通信,获得所需信息。数据挖掘查询语言dmql主要有五种基本的数据挖掘原语定义:任务相关数据原语、被挖掘的知识的种类原语、背景知识原语、兴趣度测量原语、被发现模式的表示和可视化原语。dmql 是基于这五种数据挖掘原语设计的查询式语言,类似于sql 语言的语法,因此很容易与sql 关系查询语言集成,很容易从关系数据库中挖掘知识信息。msql 是另一个数据挖掘查询语言,由imielinski 和virmani 提出。它使用了类似于sql 的语法和sql原语,为了规范规则产生和规则选择,提出了被称作getrule 和selctrule 的原语。

(二)数据挖掘建模语言pmml

数据挖掘建模语言pmml 全称预言模型标记语言(predictive model markup language),是对数据挖掘模型进行描述和定义的语言,使数据挖掘系统在模型定义和描述方面有法可依,各种数据挖掘系统可以共享模型,又可以在应用程序系统中间嵌套数据挖掘模型,不需要独自开发,就能使数据挖掘达到深度挖掘的目的。预言模型标记语言pmml 是一种基于xml 的数据挖掘建模语言,利用xml 描述和存储数据挖掘模型,使用标准的xml 解析器对pmml 解析,可以得到预计的输入和输出数据类型。pmml2.0 主要由:标题(header)、数据字典(data dictionary)、数据流(data flow)、挖掘模型(mining schema)、数据转换(derived values、statistics、taxonomy、normalization)、预言模型(tree model、naive bayes、general regression、regression model、sequences、general structure、asscocation rules、neural network、center and distribution based clustering)、模型组合定义(ensembles of models)、选择和联合模型和模型组合的规则(rules for selecting and combining models and ensembles of models)、异常处理的规则(rules for exception handling)等九个部分组成。对于复杂的数据挖掘任务,由多个数据源和数据挖掘模块,需要在各个模块之间交换结果,预言模型标记语言pmml 的主要组成部分拥有这种灵活的模型交换能力和数据格式转换能力,并实现模型与数据和工具部分分离。因pmml 是基于xml 的数据挖掘建模语言,适合部分学习、元学习、分布式学习的数据挖掘应用程序。

(三)通用数据挖掘语言ole db for dm

通用数据挖掘语言ole db for dm是2000年3月微软公司推出的一个数据挖掘语言,目的是为数据挖掘行业提供一个业界标准。ole db for dm综合了数据挖掘查询语言dmql和数据挖掘建模语言pmml的特点,既能定义模型,又能作为查询语言与数据挖掘系统通信,进行交互的和特殊的数据挖掘,实现了数据与模型真正分离。ole db for dm是一种基于sql预言的协议,扩充了sql语言语法,可以轻松地与关系型数据库集成,可以将不同的数据挖掘算法嵌入数据挖掘应用程序。ole db for dm为了更接近关系型数据库结构,定义了几个重要的概念。

挖掘特色文化资源的方法范文5

[关键词]数据挖掘知识管理知识知识管理系统

近年来,知识管理飞速发展,学者对知识管理的研究越来越深入,知识管理在企业中的实践也越来越广泛。企业可以广泛搜集到组织所掌握的技术诀窍、业务资料和长期实践经验等数据资料。但如何对这些数据资料进行科学地分析、处理,从而发掘出对管理和决策有价值的信息和知识,却是企业面临的主要挑战。数据挖掘技术可以有效地解决这一问题,并且被广泛应用于企业知识管理中。企业要在激烈的市场竞争中获胜,必须对组织中的知识进行整理或收集,形成企业的核心竞争能力的知识资本,从而提高企业的市场竞争力。

一、数据挖掘技术的常用方法

数据挖掘是从数据当中发现趋势或模式的过程,这个过程的目标是通过对大量数据的分类从而发现新的信息。数据挖掘(DataMining)指的是从大量数据中挖掘出隐含的、先前未知的、对决策有潜在价值的信息和知识的过程。

企业中应用数据挖掘技术的一般过程为:问题定义、发现信息、制订实施计划、采取行动及监测效果等步骤。数据挖掘过程中常采用以下几种方法:

1.分类(有指导的学习)。数据挖掘中的分类(或有指导的学习)方法在商务领域普遍存在。人们可以对数据库中的数据进行分组,一旦数据被分类,就可以概括这些不同组的特点。数据分类的基本技术有神经网络、遗传算法、决策树、贝叶斯信任网络、统计分析等方法。

2.聚类研究(无指导的学习)。聚类是一种对具有共同趋势和模式的数据元组进行分组的方法。聚类又称分段,是将数据集划分成若干个不同组的过程。聚类技术试图找出数据集中共性和差异,并将具有共性的元组聚合在相应的类或段中。

3.可视化。可视化即以图形方式表示数据,以图形方式表示的数据易于理解。可视化技术可以很容易地表示例外情况,例外是其值不在期望范围的数据。

4.关联(货篮子)分析。关联(或货篮子,简称MB)分析可以发现给定数据集中的频繁模式,常被用作从产品目录或零售商店的销售数据(无论是有形销售还是在线销售)中导出产品和关联的商用信息。

5.Web页挖掘。随着互联网技术的迅速发展,web上的信息无比丰富,web页挖掘可以对web页上的海量数据进行分析,提炼出有价值的信息。

6.异常性分析。从繁多的数据中挖掘出与其他数据显著不同的数据。

二、企业中数据、知识、信息、知识管理和信息管理的关系

企业中数据指的是各种未经处理的业务数据、销售数据、生产数据等,通过对这些数据进行加工处理就可以得到一些对企业经营有利的信息。企业中的知识和信息共同构成企业知识的来源,知识不是数据和信息的简单积累,知识是一种包括了人员的经验、价值观、关联关系,以及专家见解等要素的动态集合。数据是形成信息的基础或组成部分,处理过的数据可以形成信息。信息是知识的重要组成部分,信息经过加工处理可以变成知识。

知识管理是指对知识的创新、获取、加工、存储、传播和应用的管理,知识管理的研究存在两大研究主题:企业知识管理和图书馆知识管理。企业知识管理的内容包括:企业智力资源管理、知识产权资源管理、市场资源管理、组织设计管理、文化管理、信息化管理。信息管理是为实现组织目标,满足组织需求,解决组织环境问题而对信息资源进行开发、规划、控制、集成、利用的一种战略管理。信息管理是知识管理的基础,知识管理是信息管理的延伸与发展。

三、基于数据挖掘技术的知识管理

数据挖掘技术可以从企业数据中挖掘出有价值的知识,增强企业商务智能。信息化的推进让企业积累了大量的数据,建立充分利用这些数据的意识,从凌乱的数据中挖掘有用知识,这意味着企业开始向知识管理迈进。数据挖掘通过数据总结、数据分类、数据聚类和关联规则来发现企业中的显式知识和隐式知识。下图是基于数据挖掘技术的知识管理框架:

知识管理框架图

从图中可以看到,知识管理框架的核心是知识管理系统,知识管理系统可以看作是获取数据、提取知识、管理知识和向知识使用者提供知识的系统。知识管理系统从数据源中获取数据,通过数据挖掘可以发现数据中的隐式知识并且通过知识服务器供知识使用者使用。整个知识框架的目的是打败企业的竞争对手。企业中的一个组织可能扮演多个角色,其中的一个角色可能就是竞争对手,例如:一个组织拥有它自己的数据库并且利用数据挖掘技术从数据库中提取知识,它还可能会使用从其他组织的数据库中提取的知识。在这个例子中,这个组织具有数据源和知识消费者两个角色,并且利用数据挖掘技术从多个组织中挖掘知识,因此,它还扮演数据提取者的角色。

四、结论

挖掘特色文化资源的方法范文6

阴山山脉横亘于我国内蒙古自治区中部,是内蒙古高原的腹地,阴山山脉座落于呼和浩特到包头一线北面。东西长1200多公里,南北宽50―100公里。由色狼山、色尔腾山、乌拉山、大青山、灰腾梁、桦山和大马群山等山体构成。对于阴山南靠黄河,北邻草原。相对内侧有河套平原、土默川平原。阴山区域自古以来就是北方游牧民族的发祥地,更是中华文化的北方源头。历史上先后有十几个少数民族在此繁衍生息。是北方黄河文明的重要支流。具有丰富的原生态文化渊源。

(一)阴山文化资源基础性价值的挖掘

当前“经济搭台,文化唱戏”。由此一些地方旗县的文化建设搞得轰轰烈烈。其根源就是围绕阴山本源文化的变向挖掘或整理。有一种文化本性自觉。其一,阴山区域文化是县域文化建设的“思想座”与“资源库”。西汉司马迁在《史记》中提到“北破林胡,楼兰。筑长城自代并阴山下,至高阙为塞”。阴山作为中原王朝和北方游牧民族政权的天然屏障,文人墨客由此吟咏的各种题材的作品,由此登上历史文化舞台。阴山区域文化由此开始辐射、衍生。汉乐府《饮马长城窟》写出了“驱马陟阴山,山高马不前,往问阴山侯,劲虏在燕然”。反映了阴山行军的艰难和为国杀敌立功的抱负。唐代诗人杨素在《出塞》诗中咏到“树塞偏易古,草衰恒不春。交河明月夜,阴山苦雾辰”。隋朝诗人虞世基在《出塞》诗中咏到:“穷秋塞草腓,塞外胡尘飞,征兵广武至,候骑阴山归”写出了边塞诗中戌边艰苦。由此可见,阴山区域文化,从源与流上是黄河文明的重要组成部分,更是当地历史百姓生活的文化基础,也是区域文化的源头活水。

(二)阴山区域文化和长城文化的交融

公元前212年,秦始皇派蒙恬率众北筑长城,在阴山山脉上修筑了秦长城。由此秦汉两代在阴山区域上演了惊天地泣鬼神的历史大剧。秦汉文化由此与匈奴文化进行交融互通。司马迁在《史记》中写到“治狱吏不直者,筑长城”。司马迁后来又说“蒙恬所为秦筑长城亭障,堑山堙谷,通直道,固轻百姓力矣”。长城修筑,人力物力财力的投入加强了中原文明的输出,促进了阴山地区的经济文化的发展,从而促进了社会文化融合。

今天,座落于包头市固阳县地区的长城遗迹明显可见。生活于其中的百姓,领略着“秦砖汉瓦”的容颜。唐边塞诗人王昌龄《出塞》“秦时明月汉时关,万里长征人未还。但使龙城飞将在,不教胡马度阴山”此时真实记录了唐代阴山地区山水人文情怀。北朝民歌《敕勒歌》曰:“敕勒川,阴山下,天似穹庐,笼盖四野,天苍苍,野茫茫,风吹草低现牛羊”。出色地描绘出阴山脚下辽阔的草原上水草丰美、牛羊遍野的丰足景象。映射着阴山区域文明的清新明快。由此可见,从秦汉以来,阴山地区正是多民族融合的地区,是农业文明与畜牧业文明的交汇地带,阴山地区长期以来是中原王朝与匈奴政权的交汇地。有“单于天将”“单于和亲”“千秋万岁”的 作证。充分体现出阴山文化的源与流。阴山文化元素根植于百姓心中。

二、阴山文化资源的整理

如何挖掘整理阴山区域文化资源,从三个方面入手。

(一)了解调研。围绕阴山区域各旗县特点,由市一级政府牵头,组织文化部门调研。对旗县文化资源进行摸底、登记、归档、管理、整理。把当地文化资源,全部登记造册。做好文化资源的详尽记录。

(二)整理分类。在了解文化资源基础上,对阴山文化资源进行鉴别分类。比如分为物质文化资源和非物质文化资源。物质文化资源是静态化的,以物化状态作为存在方式。比如包头地区五当召,秦长城。非物质文化资源是动态化的,不是以固定的物化形态存在于世的文化资源。比如:土默川的二人台,蒙古民族的呼麦、马头琴,博客等。

(三)大力保护。阴山文化资源保护,一要明确主体,二要加大投入,三要制定法律法规,一定要以政府为保护主体,激发阴山文化的活跃因子。要加大人力、物力、财力投入,以更大的投入换取阴山文化资源文化保护及再生性。当地政府要制定相应的法律法规,完善制度保护政策。

三:阴山文化的利用

整合利用好阴山文化资源是一种再创造。笔者认为从以下方面参考:

(一)从阴山文化寻找地域特色。阴山文化有其精髓,但河套地区,土默川平原地区,固阳等地区有共同文化基础,又有不同小地区文化特色。阴山文化的整合利用要集思广益,发动能人,尤其是非物质文化传承人。又要注意寻找阴山文明自己具有鲜明地域特色和个性特点的文化形象。避免出现“千人一面”的局面。