数据挖掘技术探讨论文范例6篇

数据挖掘技术探讨论文

数据挖掘技术探讨论文范文1

关键词:水利工程管理 数据挖掘 数据仓库

中图分类号:F42 文献标识码:A 文章编号:1672-3791(2015)04(c)-0118-01

随着我国经济建设的快速发展,一大批水利工程应运而生,完善了我国水利工程体系防洪、排涝、灌溉、发电、养殖与旅游等重要功能。促进国民经济的快速发展。同时,水利工程建设取得的辉煌成就与其更快的发展需要在水利工程管理手段上作出新的调整,延长水利工程的寿命,发挥水利工程的重要价值。因此,该文从水利工程所运用的数据挖掘技术入手,对数据挖掘技术与水利工程的高效结合作出探讨。

1 浅析数据挖掘技术实施方法

数据挖掘技术是将现已存在的、海量分散的数据作为重要“资源”进行挖掘,从而研发出新的技术[1]。它以数据挖掘引擎为主要工具,通过对数据库中的数据进行分析,提炼出最具价值的数据信息。

1.1 利用关联性分析

通过数据间存在的关联性在数据源中找到所需要的目标数据以及延伸信息,通过数据间的联系找出规律,以便更好的分析利用数据。

1.2 数据的分类与整合

将较多的数据进行有目的的分类整合,对于没有规律与类型标记的数据按照相关规则进行分类,使具备相同规律的信息集中在一起。方便数据的查找与应用,提高数据认识能力,提高工作效率。

1.3 坚持预见性分析

要在数据源中保持预测性分析,通过重要数据类模型,对信息进行综合有效的分析与预测,从而得出数据发展趋势[2]。让数据本身通过数据挖掘技术得出所需结论。

1.4 把握概念

通过了解数据源中所需信息的内涵,概括其主要特征,作出概念性的描述。使数据具有较高的明确性。

1.5 把握数据偏差

数据在导入导出之间难免会存在偏差,通过数据挖掘技术对数据进行必要的检测,找出参照值与结果之间是否存在差异,从而发现一些潜在信息,缩小数据误差。

2 数据挖掘技术在水利工程管理中面临的主要问题

2.1 观点的差异性

在水利工程管理中,需要利用数据挖掘技术处理大量的空间数据。由于水利工程具有系统性,需要多个部门与领域的协调配合来实现高效的管理。然而在数据分析上往往因为角度不同,使专家之间有不同的意见。因此要加强利用新技术,利用交互探查、查询驱动等方法对数据进行探查式的快速联机查询,从而对数据进行有效分析,减少差异。

2.2 与GIS系统相孤立

GIS是水利工程信息系统的主体,它可以生成大部分空间数据。但是查询、计算与分析空间数据,使其可视化显示是一项较为复杂的技术,需要充分利用GIS系统[3]。因此,充分利用其原有数据,让数据挖掘与GIS有效的结合,二者共同处理复杂的空间数据是一项重要问题。

2.3 数据挖掘系统模型尚未建立

数据挖掘系统模型能帮助水利工程进行数据挖掘。在系统工程中,模型对于研究与设计以及实现工程目标具有重要作用,建构模型是系统工程完美实现的重要基础。

3 如何在水利工程中高效利用数据挖掘技术

3.1 充分利用GIS系统

水利工程的建设与管理受到地形、地质、河流、水文以及社会经济等多方因素的影响,需要运用处理和分析空间信息能力较强的GIS系统加以帮助。利用GIS系统中的大量空间和属性数据提供数据指导。将数据挖掘技术与GIS系统向结合能有效提高GIS的查询与分析能力,促进智能化系统的建立。

3.2 加强嵌入式耦合模式的运用

将数据挖掘系统与GIS进行耦合,形成双系统。[4]让GIS系统为数据挖掘提供基础,同时利用其丰富的空间数据与较强的分析能力减少数据挖掘的开发量,是开发效率达到一个新的突破。

3.3 重视松散式耦合

数据挖掘系统与GIS系统既相互联系又彼此独立,数据挖掘仅调用GIS系统中的空间数据与属性数据进行数据分析,让其他数据仍在原系统中进行,二者保持相对的独立性。这样可以促进各自系统的不断发展,得到更好、更快的开发与利用。

3.4 保持紧密式耦合

水利工程管理数据挖掘系统的首选便是紧密式耦合,它将嵌入式与松散式耦合向结合,在相互独立的情况下加强彼此的联系[5]。让数据挖掘系统发挥独立功能,使开发难度有所降低,增强系统的灵活性。

4 结语

在水利工程管理中利用数据挖掘技术,对水利工程数据进行全面综合的分析,找出并充分利用有价值的潜在信息,提供更加有效的管理决策,使建设资金得到更加高效的利用,降低工程管理的总成本,让水利工程发挥重大的经济效益与社会效益。该文主要探讨数据挖掘技术的实施方法以及如何在水利工程管理中高效的数据挖掘技术,初步认为在水利工程管理中需要数据挖掘技术与GIS系统的合作,二者的相互协调合作能够充分利用工程数据,促进数据挖掘技术的高效运作,提高水利工程管理水平。希望数据挖掘技术得到更多的开发与利用,为水利工程管理提供更多的帮助,促进国民经济的快速发展。

参考文献

[1] 王东坡.基于数据挖掘技术的水利工程管理[J].吉林水利,2014,(6):38-40,49.

[2] 韩红旗.数据挖掘技术在水利工程管理中的应用研究[J].中国管理信息化,2010,13(4):76-79.

[3] 丁云球.简析数据挖掘技术在水利工程管理中的实施要点[J].决策与信息:下旬刊,2014,(12):182-182.

数据挖掘技术探讨论文范文2

关键词:大数据技术;大学生心理;心理预警;动态管理

中图分类号:TP391 文献标识码:A 文章编号:1007-9416(2017)03-0147-02

随着移动互联网和物联网的快速发展,我们进入大数据时代,现在每天的数据记录比人类历史数据记录还要多,数据使用量从GB(10的9次方)发展到TB(10的12次方),面对复杂的半结构化或非结构化数据资源,传统的数据存储、分析和处理技术难以完成,产生大数据概念,与大数据相关的数据挖掘和数据应用已成为研究信息科学领域的热点。一直是该领域专家关注的焦点。

近年来,一些世界顶级科学期刊,开始建立大数据技术应用专栏,讨论大数据技术在各个科学领域的应用。在心理学领域,许多心理学家已经开始使用各种大数据平台来收集和处理所有类型的数据用于相P研究。目前,学生管理系统只针对学生心理健康指标的客观记录,数据处理工作仅是简单统计、存储、备份、查询等,没有充分利用这些数据,这为数据库应用和数据挖掘技术在大学生心理危机预防和发展提供空间和资源。

1 数据挖掘技术的概述

数据挖掘是从大量、不完整的、嘈杂的、模糊的和随机数据中提取潜在有用的信息和知识的过程。随着信息科学技术的发展,各个领域积累的数据量迅速增加。如何从海量数据中提取有用的知识和规则已成为研究热点之一。数据挖掘是一种数据管理、分析和处理技术,是知识发现的关键一步。该方法的主要应用是相关分析、分类、聚类、预测时序模式和偏差分析。

图1所示是一个数据挖掘模型。它表示数据挖掘的基本过程,大量的数据挖掘,根据管理的定义,预处理后的数据获得可靠的格式,便于挖掘向导处理数据,然后进入挖掘内核 得到模式集合,模式集合可以表达和解释通过挖掘管理器模式过滤之后可以得到用户理解和使用的综合知识库。

2 数据挖掘的算法概述

2.1 基于决策树的分类算法

决策树算法是基于实例类的归纳分类算法。 该算法可以为给定数据集构建决策树模型,并提取直观,易于理解的分类规则知识。基于决策树算法的自顶向下递归分类,首先,对于分类度量值数据集每个属性值进行分类,选择根节点。其次,从节点到分支机构根据不同的计量属性范围将数据集合划分为不同的数据子集; 然后递归方法地将数据分区,分区到所有子集属于同一范畴,停止扫描。最后建立末端的叶子节点。

2.2 基于人工智能的分类算法

人工神经网络的灵感来自于生物学,用人工神经网络来模拟脑神经元的处理。最好的方法是它可以通过训练方法自动匹配输入数据和输出数据,学习过程不需要控制,只要对训练参数进行调整即可。这为我们的建模提供了非常有用的手段。

2.3 基于模式识别网络算法

贝叶斯模型分类基于贝叶斯公式,根据某对象的先验概率计算后验概率来。选择后验概率最大的类作为该对象所属的类,Michie等人在1994年 将朴素贝叶斯分类与决策树算法和神经网络算法进行比较,发现贝叶斯算法和其它算法的性能在大多数情况下是相当的,在某些条件下会优于其它算法。如图1所示。

3 基于数据挖掘的心理危机预防系统的建立

基于上述挖掘算法,基于三种数据挖掘方法的心理危机预警系统结构如图2所示。系统分为三层:数据层、数据挖掘层和用户界面。数据层主要存储学生心理测试数据。处理原始数据以获得目标数据挖掘集合。数据挖掘层用于挖掘目标数据集。用户界面层可以查看数据挖掘结果和挖掘评估、条件分析和规则知识挖掘。如图2所示。

4 结语

研究大规模数据技术在大学生心理危机预警和预防自杀策略中的应用具有很高的实用价值。使用大数据技术的快速、可预测、准确和实用性等应用价值,可以快速准确地确定危机的状态和程度,从而有效地制定危机干预计划,减少或消除危机。为大数据应用技术的未来发展提供参考和借鉴。

参考文献

[1]喻丰,彭凯平,郑先隽.大数据背景下的心理学:中国心理学的学科体系重构及特征[J].科学通报,2015(01).

[2]何非,何克清.大数据及其科学问题与方法的探讨[J].武汉大学学报(理学版),2014(01).

[3]冯登国,张敏,李昊.大数据安全与隐私保护[J].计算机学报,2014(01).

数据挖掘技术探讨论文范文3

关键词:任务驱动;探究式;课程改革

中图分类号:G642 文献标识码:A 文章编号:1009-3044(2014)06-1253-03

Applied Research of Task-driven Inquiry Teaching Model in Data Mining Course

HUANG Jian

(Zhejiang Wanli University, Department of Computer Science and Information Technology, Ningbo 315100, China)

Abstract: The task-driven inquiry teaching model is a teaching activities which students as the main body, teachers as the leading. It fits the data-mining course. Not only using task lead the student to inquiry learning, but also improve teachers during the teaching process. Based on the data mining course teaching reform practice, summarizes the task-driven inquiry teaching mode in general process and the specific content of the reform. Practice has proved, this teaching mode is good for improving undergraduate courses teaching quality.

Key words: Task-driven; Inquiry; Curriculum reform

数据挖掘是一门包括了数据库系统、专家系统、机器学习、统计学、模式识别、信息检索、人工智能等学科的综合性的学科,其目标是发现隐藏在大型数据集中的知识模式。此课程一般是在研究生教育阶段开设[1],但随着社会对应用型人才的需求越来越大,这就要求我们的学生毕业后不仅要有扎实的理论基础,更要有较强的创新能力和实践能力。

我校针对信息与计算科学及统计学两个专业开设了数据挖掘课程。该专业学生拥有较强的数学理论基础,并掌握了数学建模、统计学、数据库等相关学科。数据挖掘作为一门综合性课程,是融合学生各科知识,提高该专业学生应用实践能力,培养学生团队协作能力的很好的载体课程。

1 数据挖掘课程教学特点

数据挖掘技术是一个多学科交叉的综合研究领域。不过也正因为它涉及的范围很广泛,发展的时间也不是很长,因此要真正理解数据挖掘的本质并不是一件容易的事情。我校针对信息与计算科学和统计学两个理学专业开设此课程,并将此课程归类为实践类课程。经过笔者多年对传统教学方法的研究和改革,发现了在数据挖掘教学中存在的问题:

1) 理论教学困难:数据挖掘课程内容涉及领域广泛,如统计学、数据库、机器学习、模式识别等内容,并且所涉及的算法繁多。由于本科生的知识体系不健全,理论基础相对薄弱,造成了学习难度过大。此外,由于学时限制,无法在课堂中详细地讲述算法理论,导致了学生积极性不高,很难达到教学目标。

2) 实践环节无法让学生体会数据挖掘本质:数据挖掘是从数据获取、数据整理、预处理、数据挖掘分析、结果分析等一系列流程的综合。但由于课时关系,我们课程中的实践环节往往是针对某个特定的算法,让学生利用已经预处理好的数据进行算法的应用。数据挖掘成本很高,但是这个成本往往并不是金钱,而是时间,而数据整理和预处理的时间往往占到全部工作量的80%。不经过完整的数据挖掘流程训练,学生就无法体会数据挖掘的本质。

3) 软件应用缺乏:针对海量数据分析是必须要应用到计算机技术处理。当今针对数据挖掘应用的软件很多,如SAS公司的EM模块、SPSS的Modeler、WEKA、Matlab以及各数据库系统配套的OLAP功能等。在课堂中,不可能对任何一款软件都详细的进行讲解。这就使得学生很难进行算法的应用实践。

2 任务驱动探究式教学模式

针对目前教学存在的这些问题,广西大学梁斌梅提出了目标驱动的专业课教学法,利用导入课吸引学生、利用教学目标引导学生[2]。韩秋明等人编著的《数据挖掘技术应用实例》中采用了大量的行业数据,为数据挖掘教学模式的改革提供大量的应用实例[3]。结合本校的学生特点,参考国内的一些研究成果,该文提出了基于任务驱动探究式教学模式。课程整体主线由任务驱动,学生进行探究式自主学习。

任务驱动是基于构建主义教学理论基础上的教学方法,以学生为主体,以老师为主导的一整套教学新模式。而探究式教学是与直接接受式教学相对的,在任务驱动的同时,激发学生的好奇心,并驱使学生投入到知识获取的自主学习活动中。任务驱动探究式教学模式是将两者有机的结合起来,使学生能够明确学习目标、提高学习兴趣、提升学习动力,发挥学生的自主学习能力、创造能力,培养学生分析问题、解决问题的能力。通过自主学习,自行的完成阶段性的教学任务,以达到相应的教学目标。任务驱动探究式教学模式,适合操作性和应用性强的课程。任务驱动探究式教学模式的核心思想是在教学方面强调任务驱动,在学习方面则强调探究式学习。因此必须合理地设计课程教学方案,在“教”和“学”两个方面进行设计。老师必须在任务设计、实施进程管理、信息反馈等各方面做好衔接,保证学生能够时刻跟上任务进度,并保持足够的兴趣度。

3 基于案例驱动探究式教学模式的数据挖掘课程改革

任务驱动探究式教学模式是以学生为主体,教师主导的新型教学模式。教师的作用在于教学组织和任务布置的安排调度。利用任务引导学生学习相关知识,提高学生的学习主动性。因此,如何根据课程需要合理地进行课程任务设计,安排任务进度都是课程改革成功的关键。

3.1 课程内容重新整合

数据挖掘是一个由数据收集、数据预处理、数据分析挖掘、结论分析等各个步骤组成的整体过程。在现有的数据挖掘书中,针对数据收集、数据预处理部分往往比较简化,大部分篇幅都在讲述数据挖掘算法,如分类算法、关联算法、聚类算法。如果在课程内容设计时,仅仅对算法做重点讲述而忽略前期步骤,将会造成学生内容知识的脱节,无法体会数据挖掘整个流程,从而不能真正地理解数据挖掘思想本质。因此,本课程教学目标应该是重点培养学生分析问题、解决问题和团队协作能力,树立数据挖掘思维体系,了解数据挖掘基本算法,能够应用数据挖掘软件解决实际问题并得到结果。

根据这个教学目标对课程内容进行适当调整。首先,增加绪论内容并设置导入课。在导入课中增加生活中学生感兴趣的数据挖掘故事,经典案例以及各行业中的应用,从而提高学生学习的兴趣。其次,适当增加数据获取、数据预处理以及数据挖掘软件的介绍,使得学生能够明确数据怎么来、如何处理以及用什么工具处理等问题。最后,有选择地介绍基本的数据挖掘算法,所介绍的算法应该是常见、易懂并且能够很容易使用软件实现的,如决策树算法、K均值聚类算法、Apriori算法、朴素贝叶斯算法等。而针对比较难的算法,可以仅做介绍,让学生在今后遇到此类问题能够自主的进行学习。通过内容的调整,一方面使得学生不会因为数据挖掘算法繁多且复杂而惧怕,保证学生的学习兴趣,从而很好的引导其自主学习,提高教学效果。另一方面,数据挖掘算法在不断的改进,不可能在课程中覆盖所有。通过基本算法和工具的结合,能够很好地帮助学生从算法理论转变成算法实现,从而真正的进行数据挖掘工作。即使出现了新的算法,也能够举一反三,进行软件实现。

3.2 组织方式的改变

任务驱动探究式教学模式必须以课程任务为依托。改变以往以纯理论的教学方式,加入实践和课堂讨论环节,将理论知识讲解和课程任务有机地结合到一起。考虑到数据挖掘连贯性以及工程庞大性,可以考虑以项目化的方式进行。将学生6个人左右分为一组,自主的在老师所提供的数据共享平台中寻找感兴趣的问题进行分析研究。将整个项目分解成为数据搜集、数据预处理、探索性分析、数据挖掘、结果分析等一系列的小任务,安排阶段性的任务目标,层序渐进,逐步的建立学生完成项目的信心并最终完成整个项目。

学生是项目的负责人,在接受一个短期任务后,就要自主的开始进行任务的执行。老师仅仅在课堂中进行了基本知识的讲解,学生要完成任务就必须学习更多的课外知识。项目的研究内容是自己选择的,而且完成阶段性的任务并不是那么的遥不可及,所以学生有足够的兴趣和信心去完成。通过查阅资料、学习知识、任务分配、安排和组织实施等,完成教学任务的同时也锻炼了他们团队合作意识、沟通能力、自主学习能力。这些能力的培养才能使他们在知识不断更新的当今,紧密地跟紧前沿技术并更好的去解决实际问题。

3.3 任务进度控制和评价

课程的课堂教学时间是有限的,老师不可能在课堂中既完成理论教学,又给足时间让学生进行课程任务,所以项目的实施必须是在课后进行。学生要在课外进行大量的参考资料阅读、相互讨论及数据分析的工作。那么老师作为主导者,必须及时地了解学生阶段性任务的完成情况,对当前学生遇到的困难及时给出建议和意见,甚至在学生遇到真正的难题给予技术上的支持。所以本课程在理论课教学的同时,也开展了定期的讨论课,让学生定期汇报阶段性任务的完成情况,及时进行任务进度的控制。整个项目的实施流程和任务分解如图1。根据流程安排,理论引导学生任务的进行。通过学生任务的完成情况,老师在完成基本理论教学的同时,有针对性的对学生所遇到的问题进行讲解,最终目标是引导学生完成整个教学项目。一方面,学生自主学习能力提高,有足够的兴趣和能力去完成每个阶段的任务,并且会更加认真的在理论课中寻找自己想得到的知识。另一方面,由于学生自主寻找的项目多样性,选择的算法不可控性,同样促使老师不断的提高自身,教学内容不再一成不变,而是随时的更新。

图1 任务进度安排流程图

良好的进度控制需要一个完善的评价体系做辅助。只有做好每个阶段性的评价,引入一定的竞争机制,才能提高学生积极性和自信心。首先,必须做到极端性任务的目标和时间明确化。要完成什么,在什么时候完成,都必须事先和学生约定。对没有按时完成任务的组,必须做出相应的惩罚,如扣除本阶段的得分。除此之外必须分析原因,搞清为什么无法完成任务,有针对性地提出建议和意见,以便学生能够及时调整。其次,评价标准既要唯一又要区别对待。唯一标准指的是一样的进度,一样的任务,一样的要求。但是数据挖掘项目会根据研究领域不同、使用算法不同、数据质量不同而造成难度差异,一味的同等标准要求会造成选择难度较高项目的学生积极性下降。所以老师必须客观的分析每个项目难度,并区别对待。对于由客观难度造成任务进程落后的组,应当在解决问题后给予奖励。并且,在最终论文评定时,适当的加入一定的难度分,以鼓励学生培养自我挑战的精神。通过教师评价、组长评价、组间评价等评价方式,客观的合理的对整个项目实施作出最终的评价结果。

4 结束语

通过案例驱动探究式教学模式的改革,数据挖掘课程在教学效果上得到了实质性的提高。人才培养上卓有成效,老师也在教学过程中受益良多。通过教学模式的改革,使得原本枯燥、难懂的理论教学变得生动。学生的求知欲望得到了激发,课程的学习目标更加的明确,教学质量也有很大的提高。同时我们发现,学生的自主学习能力、汇报能力、论文撰写能力都有了明显的提高,并且有很多教学项目被用于毕业论文的研究。数据挖掘课程也因此被选为宁波市级的智慧产业核心引导课程。

参考文献:

[1] 胡建军.浅谈数据仓库与数据挖掘的本科教学[J].广西科学院学报,2007(3):29-210.

数据挖掘技术探讨论文范文4

关键词:文本挖掘;特征提取;文本分类;文本聚类

中图分类号:TP311.13

面对庞大的信息,如何有效地能够通过对信息的有效分析成为一大挑战,文本挖掘技术的出现为解决这些问题提供了较好的研究思路。国内对文本挖掘的研究较晚,但在中文文本挖掘领域也取得了一定的成果,如中科院计算机信息工程研究中心研究的汉语自动分词、自然语言接口、语义分析;清华大学电子系丁晓青等研究的手写汉字识别、汉字识别多分类器集成等[1]。

1 文本挖掘基本问题描述

1.1 文本挖掘的定义

文本挖掘由Usama M.Feldman[2]在1995年首次提出的,是指非结构化的文本文档中抽取用户感兴趣的、重要的模式或知识的过程,它可是看作是数据挖掘或数据库知识发现的延伸。Kostoff[3]对文本挖掘的定义从大型文本数据集中获取正确的、潜在有用的并最终可理解的知识的过程。

1.2 文本挖掘的过程

文本挖掘的主要过程包括对大量文档集合进行数据预处理包括分词、文本模型表示、文本维度缩减;挖掘分析包括文本分类、聚类或关联分析、预测分析等;最后对挖掘效果评估和反馈以求算法、技术的改进。

2 文本挖掘关键技术

按照文本挖掘的基本流程,下面将从三个方面包括数据预处理技术、挖掘分析技术及挖掘效果评价来探讨文本挖掘的关键技术。

2.1 数据预处理技术

2.1.1 文本分词

目前主要的中文自动分词算法有机械匹配法、基于统计语言模型的分词算法以及基于人工智能技术的中文自动分词方法[4]。机械匹配法假设自动分词词典中的最大词条包含汉字个数为i,则取待处理资料当前字符串序列的前i个字作为匹配字段,查找分词字典进行匹配。基于统计语言模型的分词算法对语料库中相邻共现的汉字的组合频度进行统计,计算他们的统计信息并作为分词的依据。其中N-gram模型是一种常用的统计语言模型。神经网络分词算法将分词知识的隐式方法存入神经网络内部,通过自学习和训练修改内部的权值达到正确的分类效果。

2.1.2 文本表示模型

原始的文本文档需要通过某种数据结构表示出来才能进行文本挖掘。目前,文档的表示方法一般采用向量空间模型,在该模型中,文档空间被看作是由一组正交词条向量所组成的向量空间。具体地,对于训练文档集D,假设其特征集F中共有|F|个特征,在向量空间模型中,每个文档用一个向量表示出来di,i=1,2,…,|D|。其中,分量wi表示特征fi的权重。总的来说,有两种向量空间模型:布尔型和权重型。在布尔型的向量空间模型中每个特征用一个布尔文字来描述;而在权重型的向量空间模型中,用实数表示特征的权重[5]。

2.1.3 文本特征维度缩减

特征降维就是对特征空间的维度进行缩减,生成低维特征向量。特征降维一般通过两种方式来进行:一是在原有的特征空间的基础上,构造出一个较小的新的特征空间,从而达到降低特征空间维度的效果,称为特征抽出技术。另一种是通过某种机器学习算法,在已有的特征空间中筛选出一个特征子集,并用该特征子集作为新的特征空间,从而达到降低特征空间维度的效果,称为特征筛选技术。

2.2 挖掘分析技术

2.2.1 文本分类技术

对于文档集D={d1,d2,…d|D|}和类别集C={c1,c2,…c|c|},布尔矩阵=D×C中的元素True表示文档di属于类别cj,元素=False表示文档di不属于类别cj。文本分类的目的就是学习出一个分类函数,对:d∈D和c∈C,给出φ:d×c{True,False},该函数称为分类器(Classifier),相应的算法称为分类算法(Classification Algorithm)[6]。一般来说文本分类分为训练和分类两个阶段,具体过程如下[6]:(1)获取训练文本集:训练文本集由一组预处理的文本特征向量组成,每个训练样本都有一个类别标号;(2)选择分类算法对训练文本集进行训练得到分类模型:常见的分类算法有朴素贝叶斯算法、支持向量机、神经网络算法等;(3)对测试样本或待分类文本进行预处理,用导出的分类模型进行分类,得出分类结果;(4)根据分类结果评估分类模型。

2.2.2 文本聚类技术

与文本分类相比,文本聚类可以直接用于不带类标号的文本集,避免了为获得训练文本的类标号所花费的代价,利用聚类技术减少分类方法对有标号训练样本的需求,减轻手工标记样本类别所需的工作量,这种方法也称为半监督学习。文本聚类包括以下步骤[6]:(1)获取结构化的文本集。从文本集中选取的特征好坏直接影响到聚类的质量。如果选取的特征与聚类目标无关,那么就难以得到良好的聚类结果。对于聚类任务,合理的特征选择策略应是使同类文本在特征空间中相距较近,异类文本相距较远;(2)执行聚类算法,获得聚类谱系图。聚类算法的目的是获取能够反映特征空间样本点之间的“抱团”性质;(3)选取合适的聚类阈值。在得到聚类谱系图后,领域专家凭借经验,并结合具体的应用场合确定阈值。阈值确定后,就可以直接从谱系图中得到聚类结果。

2.3 挖掘效果评估

为了客观地评价文本挖掘的效果,研究者提出了很多评价指标,较常用的有准确率(Precision)、召回率(Recall)和Fβ指标等。其中准确率表示返回结果中正确的比例;而召回率表示所有正确结果中返回的比例。孤立地使用查全率和查准率都不能全面地衡量文本挖掘的效果,为了同时考虑这两个指标,提出了Fβ指标[7],它是准确率和召回率的调和平均。

3 结束语

本文从宏观角度对文本挖掘的关键技术进行了探讨,具体的算法没有深入研究,如何将这些成熟的算法应用到诸如舆情分析、产品评价分析、公司竞争情报分析等领域以及能够从新的理论和技术角度来探索文本挖掘是值得深入的研究领域。

参考文献:

[1]郭飞.文本挖掘方法探讨及应用[D].成都理工大学,2006.

[2]Feldman R,Dagan I.KDT-Knowledge discovery in texts[C].In Proceedings of the First International Conference on Knowledge Discovery and Data Mining(KDD),Canada,1995:112-117.

[3]Losiewicz P,Oard D W,Kostoff R N.Textual Data Mining to Support Science and Technology Management[J].Journal of the Information Systems,2000(15):99-199.

[4]刘迁,贾惠波.中文信息处理中自动分词技术的研究与展望[J].计算机工程与应用,2006(03):175-177+182.

[5]张阳.复杂类型数据数据挖掘研究―文本挖掘[D].西北工业大学计算机学院,2004.

[6]陈晓云.文本挖掘若干关键技术研究[D].复旦大学,2005.

[7]许洪波,程学旗,王斌.文本挖掘与机器学习[J].信息技术快报,2005(02):1-14.

作者简介:龙飞(1983.10-),男,博士,讲师,研究方向:物流管理、信息系统、电子商务。

数据挖掘技术探讨论文范文5

关键词:数据挖掘技术;成绩管理

一、数据挖掘的定义

数据挖掘是一个涉及多学科交叉的研究领域,综合了人工智能、机器学习、数理统计等学科,它把对数据的应用从较低层次的简单的查询提升到从数据中挖掘知识。简单的说,数据挖掘就是从数据中获取知识。从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道、但又是潜在有用的信息和知识的过程。数据挖掘应该更正确地命名为“从数据中挖掘知识”。

二、数据挖掘的过程

数据挖掘过程大概可以概括为三部分:数据准备、数据挖掘、结果的表达和解释。如图1-1。

三、数据挖掘的特点

数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识,所得到的信息具有事先未知、有效、实用三个特征;用户不必提出明确的要求,系统能够根据数据本身的规律性,自动地挖掘数据潜在的模式,或通过分析建立新的业务模型,帮助决策者调整市场策略,这有利于发现未知的事物。因此,它是由数据驱动的一种真正的知识发现方法。

四、学生成绩管理的现状

随着高校招生规模的扩大使成绩管理处理的数据量急剧增加,存放在数据库中的大量的成绩数据,对于一般的查询过程是有效的,管理人员能够通过简单的统计或排序等功能获得一些表面的信息,但随着数据库中存储的数据量的增大,传统的数据库管理系统的数据管理和处理功能就不能满足现实的需要,因为无论是查询、排序还是方差,其处理方式都是对指定的数据进行简单的数字处理,对于学生成绩管理方面,往往只能做一些简单的功能,由于大量数据以不同的形式存储在不同的计算机上,从而使隐藏在其中的大量有用信息无法得到有效的利用,无法发现数据中存在的关联和规则,无法根据现有的数据预测未来的发展趋势。上述问题直接导致教学管理部门无法进行有效的评估,任课教师无法进行有效的教学方法改进。而如何将这些数据信息转化为知识表示,为学校管理者提供决策依据,科学指导教学,提高教学管理水平,将是高校需要迫切解决的问题。

五、将数据挖掘技术在成绩管理中的应用

1、学生成绩分析方面

学生的学习成绩是评估学生表现好坏的重要依据,也是学生是否掌握好所学知识的重要标志,目前高校使用的成绩管理系统大部分只能做一些简单的数据管理和处理,例如:学生的平时成绩输入、考试成绩输入、毕业设计成绩登记,进行各类统计报表和信息查询、分析某一个班学生学习成绩分布的情况等。目前大量的成绩数据只是简单地存储在数据库中,隐藏在这些数据中的潜在信息被闲置,没能被充分利用。在数据库中学生成绩分析从定性的角度考虑不是很精确,而数据挖掘是从定量的角度精确地分析学生成绩分析的各个方面数据。

2、在考试方面

考试是对教师教学效果和学生学习效果的一个检验,是教学中必不可少的环节,虽然按考试成绩可以总体评价在一定时期内学生取得的成绩,但这并不能有效地说明成绩的高低与哪些因素有关,无法知道教师教学环节中的成功与不足之处,对教师教学方法的改进和学生学习成绩的提高都没有实际意义上的帮助,而且,学生考试成绩的高低也与试题的质量有着很大的关系,因此探索有效的方法来评价试题的质量如试题难易度,知识点全面度等在实际的教学过程中同样具有重要的意义。将数据挖掘技术应用于试卷分析数据库中,然后根据学生得分情况分析出每道题的难易度、区分度、相关度等指标,那么据此,教师可以对试题的质量作出比较准确的评价,进而可以用来检查自己的教学情况及学生的掌握情况,并为今后的教学提供指导。

2、在教学评价方面

教学评价是教学中的一个重要环节,是引导教育、培养高素质人才,帮助社会充分利用教育成果和促进教育健康发展的保证。传统的教学评价大多是参考相关评价指标体系和调查问卷等方式实施的,而且更是注重评价的结果,以作为教师晋升、学生评优等的依据.高校每学期都要搞课堂教学评价调查,积累了大量的教学信息数据,利用数据挖掘技术,从教学评价数据中进行数据挖掘,探讨教学效果的好坏与教师的年龄、职称之间有无必然的联系,课堂教学效果与教师整体素质关系如何,合理配备班级的上课教师,使学生能够较好的保持良好的学习态度,从而为教学部门提供了决策支持信息,促使更好地开展教学工作,提高教学质量。

3、选择教师的教学方法方面

在教学过程中,教师可以采用多种方法来完成自己的教学任务,比如讲授法、多媒体演示、分组讨论法、课程实习法等,在通常情况下,一般可以采取一种或几种方法进行.据此可用数据挖掘的方法来挖掘数据库中的数据,判定下一步应采取什么样的教学方法,以满足教学的需要,更有利于学生对知识的吸收。

4、课程的合理设置方面

在学校,学生的课堂学习是循序渐进的,而且课程之间有一定的关联与前后顺序关系,在学一门较高级课程之前必须先修一些先行课程,如果先行课程没有学好,势必会影响后续课程的学习,此外,每一学期安排课程的多少,也会影响学生的学习效果。利用学校教务管理系统中存放的历届学生各门学科的考试成绩,结合数据挖掘技术的相关功能,得出一些有价值的规则和信息,最终找到影响学生成绩的原因,在些基础上,对课程设置做出合理安排。

六、结束语

随着我国各高校管理信息化的不断推进,各类学校的数据库建设不断完善,在学校平时的教育教学管理中累积了大量的数据。在这些海量的数据中,隐藏着大量有用的知识,如果利用好这些知识,将能够对学校的教育教学工作起到积极的指导作用。数据挖掘技术正是为了解决如何从海量数据中挖掘出有用的知识,因此,将数据挖掘技术应用到高校的教育教学中去是非常有必要的。

参考文献:

【1】吉根林,帅克,孙志挥.数据挖掘技术及其应用.南京师大学报(自然科学版),2000,23(2):25-27

【2】李庆香.数据挖掘技术在高校学生成绩分析中的应用研究:硕士学位论文.重庆:西南大学教育技术系,2009

数据挖掘技术探讨论文范文6

关键词:智慧物流;数据挖掘;差异化服务

中图分类号:F250 文献标识码:A

Abstract: This article collects the research trends of smart logistics and data mining, and provides the theoretical basis for further research. Based on big data research field of vision, it analyzes the reason of logistics' enterprises exploring opportunity form the data under the pressure of competitive situation and“internet+”opportunity. The article studies the differentiation service method of logistics' enterprises from the establishment of high quality data availability set taking the theme of logistics service as the center and the competitive elements of smart logistics differentiation service.

Key words: smart logistics; data mining; differentiation service

2009年以来,智慧物流理念的提出,给物流业向“智慧化”转型注入了一剂强心针。各种冠以智慧名目的软件和解决方案不胜其数,对于物流企业而言,在享受智慧物流理念的同时,又深深陷入技术应用和业务发展的困局,即采用智慧物流技术之后,业务增长有限。与此对应的是,企业数据量大幅递增,带来了企业IT架构的不稳定。“互联网+”、大数据也在深深地刺激着物流企业的经营神经,如何跟上时代潮流,借助先进理念对企业业务进行升级转型成为了一个迫切需要研究的命题。

1 相关文献研究

1.1 智慧物流及研究动向

从现有文献来看,国内智慧物流理念从提出到引发激烈研讨,经历了以下几个阶段。2009年以前,相关文献使用物流智慧,或者将物流表述为一种智慧,对其展开了相应的研讨。宋则(2007)认为现代物流是一种人类协同合作“本能的智慧”[1]。2009~2013年,该阶段研究强调信息技术在物流行业的推广应用,将智慧物流作为物流信息化发展的较高阶段展开论述。王继祥(2010)指出物联网发展必将推动智慧物流的变革[2]。2014年之后,学者们结合智慧的内涵和外延,从管理角度对智慧物流进行了更加深入的研究。王之泰(2014)将智慧物流定义为是将互联网与新一代信息技术和现代管理应用于物流业,实现物流的自动化、可视化、可控化、智能化、信息化、网络化的创新形态[3]。

以“smart logistics”和“wisdom logistics”为关键词,检索google学术、Emerald数据库可以发现,2006年以前,国外学者往往以物流某环节的智慧(smart)为关键词展开论述,在研究时遵循着IT技术、RFID、系统软件开发的技术路线,同时沿着供应链管理的视角对物流相关环节进行研究。Peter Vervest, Eric van Heck, Kenneth Preiss, Louis-Francois Pau(2005)[4]认为智慧商业网络的实施需要对物流进行更加全面的改造,从而使业务流程更加模块化和动态化,以获得更为灵活的采购性能和资产效率。2006~2009年,国外学者围绕着物流具体功能环节,结合RFID、智能电话等信息技术的应用,进行了相应的研究。Veloso M, Bentos C, Pereira F C(2009)[5]等结合智慧运输系统,研究了感知技术和感知网络对物流的影响,并且论证了使用相关技术应用会对环境带来积极的变化等。2010年以来,国外学者逐渐将研究视野转向了行业应用、网络构建、大数据、信息管理体系、互联网融合、大数据等层面,逐步从原来的微观层面走向了中观,乃至宏观领域。Gubbi J, Buyya R, Marusic S等人(2013)[6]指出智能交通和智慧物流应该分别隔离成一个单独的领域,原因在于数据共享和IOT支柱环节实施的性质需要。

综合上述国内外参考文献可以看出,国内外学者的研究路线基本遵循着语义联想―技术应用―管理拓展的思路,从智慧源头开始,到相关技术应用于物流环节,再围绕RFID典型技术与物流的关系,然后再到产业融合等这样一个研究链条。略微有些差异的地方在于,国内学者对于互联网+、大数据和物流的研究兴趣要高于国外学者。

1.2 数据挖掘及研究动向

数据挖掘,又称数据库中的知识发现,是从大量的、不完整的、有噪声的、模糊的、随机的大型数据中提取隐含其中的、人们事先未知的、具有潜在价值的信息和知识的过程。按照数据结构进行组织、存储和管理数据的数据库技术,在过去60多年来产生了巨大的科技影响,与各行各业进行了有效的融合。泛在知识环境理念提出之前,数据挖掘的研究大多停留在基于结构化数据完成相关知识的描述和预测研究上。马志锋,刑汉承,郑晓妹(2001)基于Rough集的时间序列数据的挖掘策略,讨论了时间序列数据中的时序与非时序信息的获取问题[7]。Agrawal R(1993)等人提出了增量式更新算法[8],Cheung DW(1995)等人提出了并行发现算法[9]。在数据挖掘方法层面,进行了关联规则挖掘、多层次数据汇总归纳、决策树、神经网络、可视化技术等模式、算法的研究。郑建国,刘芳,焦李成(2002)在分析人工神经网络基础上,将子波与已有的神经网络模型结合,提出了基于自适应子波神经网络的数据挖掘方法[10]。Furuta K(1990)提出了剪辑近邻法[11]。

伴随着大规模数据的增长,人类社会已经进入大数据时代,与传统的数据集合相比,大数据通常包含大量的非结构化数据,且大数据需要更多的实时分析。2011年全球数据量为1.82ZB,据估计2020年全球大数据量将达到40ZB。现有数据库架构在ZB数据规模量级下呈现出一种无能为力的状态。围绕大数据带来的数据量级规模的变化,国内外专家学者对数据挖掘的研究焦点出现两个支分支,其一是如何应对大数据挑战带来的数据类型多样,要求及时响应和数据的不确定层面。余伟等(2015)针对web中不同数据源之间数据不一致的问题,基Hadoop MapReduce架构提出了相应的自动发现算法[12]。Rakthanmanon T, Campana B, Mueen A, et al(2013)[13]提出了DTW(Dynamic Time Warping)法来研究大数据集下的时间序列数据挖掘算法,通过实证验证了可行性。其二,围绕数据量集增大,将数据之间的因果关系转向相关关系,进行相关业务模式、应用和策略等的洞察力研究。曾晖(2014)提出了构建大数据挖掘的管理层次和制度结构及相关解决方法,基于房地产工程项目进行了应用研究[14]。

综合上述文献可以看出,从技术路线上来看,数据挖掘围绕着数据规模量级的问题,遵循着解决数据本身的数据结构异同挖掘,再到解决数据挖掘的实时性技术路线。从商业应用来看,研究领域围绕数据规模问题,从原来的因果关系转向到相关关系,逐步将技术与行业应用进行融合的研究路线。

2 竞争态势和“互联网+”机遇倒逼物流企业从数据中探索机遇

智慧物流更强调物流供应链的匹配效率,进而实现供应链整体运作最优。匹配意味着双向配对,无论成员之间的物流服务水平高低与否,在时空效率的约束下,成员的物流服务能力信息必须充分展示在供应链合作伙伴之前,才能实现其与物流供应链的快速匹配。

对于物流企业而言,在一定的时空约束下,物流服务能力是其从事某种物流作业的内在能力表述。物流服务能力会随着业务的熟练程度增加而提升其水平,同样也会随着业务萎缩而固步自封,或者说降低其水平。

提供同质化服务的物流企业面临的竞争环境越来越恶劣,越来越多的物流企业希望摆脱这种尴尬局面。长尾理论告诉我们,这些以往忽视的长尾东西恰恰是我们后续进行差异化经营的变局法宝。企业必须充分重视数据挖掘的细分市场变量集,依靠这些充分挖掘出来的市场细分变量集,我们可以将市场进行无限细分,进而进行有效的目标市场定位,然后根据这些细分市场表现出来的特征,改善我们的物流服务能力,从而形成差异化服务。考虑到物流服务的时空限制,数据挖掘必须重视线上和线下的数据源。对于线下实体运作过程中产生的大量与业务相关联的数据,必须充分纳入NOSQL数据库中进行存储。对于线上数据信息,必须设定相关的情感主题,以充分挖掘物流服务过程中隐藏在不同数据结构类型中的特征信息,借助相关性的数据挖掘技术,对线上和线下两种数据进行细分市场变量集合挖掘,找出相关的细分市场变量结合,从而完成后续的细分市场细分工作。

“互联网+”时代激发越来越多的物流企业将经营目光转向互联网领域,目标是获取更多的经营机会。具体作业时,往往采用“人―机”交互模式进行网上交易信息的检索和分析,并未充分发挥智慧物流的优势,通过机器的自动学习方法来获取和挖掘交易信息。对于网络上的数据信息而言,分为Deep-web和surface-web两种模式,对应的数据结构也分为结构化数据、半结构化数据和非结构化数据形态。对于互联网而言,surface-web模式带来的数据呈现着爆炸性增长的状态,而这些数据背后隐藏的信息给相关经营者提供了大量的商机,只不过这些数据往往以文本、视频、图片等半结构化和非结构化的数据结构存在着。物流企业可以通过提炼自身物流服务能力作为KEY-VALUE,结合能够充分挖掘不同数据结构类型的智慧物流数据挖掘算法,在互联网上进行智慧性的数据挖掘,才能在有限的时间约束范围内,挖掘出匹配自身物流服务能力的物流业务集合。经营者所要做的是,根据自己的服务成本和盈利目标进行二次筛选,形成满足客户需求的信息,主动信息出击,快速完成与相应供应链的对接服务。

3 借用数据挖掘,谋求智慧物流差异化服务创新发展

3.1 以物流服务主题为中心,建立高质量的数据可用性集合

大数据时代的智慧物流运作更强调将数据作为企业的宝贵资源来看待,通过数据挖掘探索出适合自身良性发展的方法和路径,这就决定了数据可用性成为了智慧物流数据挖掘和物流服务有机互动的基础。

随着时间延续,智慧物流运作中的数据量级必然会大幅递增。Web空间和物理空间(如物联网)上的数据流,线下具体作业过程中的数据流等,呈现出不能完全满足数据可用性的特性。一旦数据可用性不足,则数据挖掘结果必然会弱化决策效果。

对于物流企业而言,考虑到目前大数据挖掘技术不成熟的现实约束,必须先将数据可用性这一基础工作落实,只有这样才能随着大数据挖掘技术的突破应用获得实时效益。数据确认工作十分困难,考虑到具体经营条件约束,物流企业可以采取如下路径来完善数据可用性工作。首先,分解数据可用性的五个性质,围绕服务能力,赋予不同的权重,设定相关的弱可用数据指标体系,收集整理弱可用数据集合。其次,以服务相关性为主题,将Web空间上的半结构化和非结构化数据作为收集、整理和存储的重心,为后续进行深入数据挖掘奠定基础。第三,将物理世界中的数据和服务作业现场的数据作为辅助支撑,按照数据可用性的完整指标,收集整理出高质量的数据可用性集合。此路径是一个循环往复的过程,会随着一项物流服务主题的结束,重新开始下一个循环。

3.2 利用数据挖掘,探寻智慧物流差异化竞争要素―细分市场

物流企业的经营思路着重点在于:首先要解决业务有无的问题,其次是开拓对自身有利的业务。对于技术应用而言,同样遵循这样一个规则,那就是无论技术先进与否,如果不能解决上述两个问题,企业也会弃之不用,遵循业务发展路径探索智慧物流数据挖掘和物流服务能力的协同路径会更具研究意义。

“互联网+”时代给物流企业带来了大量的业务机会,物流企业需要借助数据挖掘技术,突破时空限制,充分挖掘不同异构网络平台提供的各种各样的商机,寻求适合自己链入的供应链,完成业务增长任务,这是一种被动性的发展模式。

在被动性发展模式下,如何借助智慧物流数据挖掘,在时间变量约束下,快速找到适合自身物流服务能力的业务显得尤为重要。在进行智慧物流数据挖掘时,需要借助大数据已有的Hadoop MapReduce架构,完成智慧物流数据挖掘的快捷性布局;其次,以业务相关性为原则,基于Item-Based数据挖掘技术完善算法。即将现有物流服务能力进行提炼,转化成User特征值,将原有服务成功的物流业务和网上发现的离散物流业务转换成ITEM数据集,提炼关键词。第三,推测和演化ITEM和ITEM的相似度,构建USER-ITEM矩阵完成后续的智慧物流数据挖掘。在进行数据挖掘和物流服务能力匹配的过程中,不断训练和演化算法,以发掘商机为达成目标,可以有效地协助物流企业解决从互联网上发掘业务有无的问题,尽管这种路径有一定的意义,但是并不能改善物流企业需要谋求的差异化竞争态势。

其次,物流企业必须坚持主动性的发展模式,即挖掘出满意的细分市场之后,必须根据细分市场的需求特征来重构自身的物流服务能力,使供给与需求达到契合,不断地实践和磨练自己的物流服务能力,在细分市场形成竞争优势,从而形成差异性竞争优势。

构建足够大细分市场的前提条件在于能够获取独立于竞争对手所知晓的市场细分变量,这些市场细分变量的特征值往往隐藏在不同异构网络平台上的非结构化数据中,充分挖掘细分变量数据成为主动发展模式需要破解的难题。在此路径下,需要采用CONTENT-BASED和ITEM-BASED数据挖掘相结合的方法进行。首先,根据CONTENT-BASED数据挖掘算法,加入业务情感特征向量集,重构CONTENT-BASED的智慧物流数据挖掘算法,对互联网上的业务进行挖掘,找出业务集(无论是否被竞争对手完成)。其次,结合ITEM-BASED算法,对物流服务能力进行重构,依据时间快捷性和相关性原则,探寻适合的业务集。第三,设定时间段,对服务过的业务结合线下数据进行细分市场变量的可用性数据集进行推敲,将其从弱可用性转化为高质量的可用性数据集。第四,采用智慧物流提供的可视化技术对市场进行细分,探寻出满意的细分市场,根据细分市场呈现的需求特征重构自身物流服务能力,进而进入主动发展模式。

对于市场而言,并不是一成不变的,互联网时代随着信息日益公开透明,市场的变化速率将会比以往更迅速。对于积极进取的物流企业而言,需要不断地跟踪和监控已有市场,积极开拓细分市场,从而形成差异化竞争优势。

4 总 结

大数据时代已经悄然来临,数据将成为企业发展中重要的资源,充分借助互联网和大数据的技术优势,不断探寻新的商业模式,可以帮助企业尽快摆脱恶性竞争,形成差异化竞争优势。本文在收集整理智慧物流和数据挖掘相关文献的基础上,研究了竞争态势和“互联网+”机遇倒逼物流企业从数据中探索机遇的成因。接下来,论文从基于物流服务主题为中心,建立数据可用性集合,再到利用数据挖掘探寻智慧物流差异化竞争要素―细分市场方面进行了研究,并提出了部分方法。

参考文献:

[1] 宋则. “物流”其实是一种智慧[N]. 现代物流报,2007

-05-01(002).

[2] 王继祥. 物联网发展推动中国智慧物流变革[J]. 物流技术与应用,2010(6):80-83.

[3] 王之泰. 城镇化需要“智慧物流”[J]. 中国流通经济,2014,28(3):4-8.

[4] Peter Vervest, Eric van Heck, Kenneth Preiss. Louis-Francois Pau: Smart Business Networks[M]. Springer, 2005.

[5] Veloso M, Bentos C, Pereira F C. Multi-Sensor Data Fusion on Intelligent Transport Systems[D]. University of Coimbra, 2009.

[6] Gubbi J, Buyya R, Marusic S, et al. Internet of Things(IoT): A vision, architectural elements, and future directions[J]. Future Generation Computer Systems, 2013,29(7):1645-1660.

[7] 马志锋,刑汉承,郑晓妹. 一种基于Rough集的时间序列数据挖掘策略[J]. 系统工程理论与实践,2001(12):22.

[8] Agrawal R, et al. Mining association rules between sets Items in large Database[J]. Acm Sigmod Record, 1993(2):207-216.

[9] Cheung D W, et al. Maintenance of Discovered Association Rules in Large Database: An Incremental Updating Technique[D]. Hong Kong: University of Hong Kong, 1995.

[10] 郑建国,刘芳,焦李成. 自适应子波神经网络数据挖掘方法[J]. 西安电子科技大学学报(自然科学版),2002,29(4):474-476.

[11] Furuta K. Sliding mode control of a discrete systems[J]. Syst Contr Lett, 1990,14(2):145-151.

[12] 余伟,李石君,杨莎,等. Web大数据环境下的不一致跨源数据发现[J]. 计算机研究与发展,2015,52(2):295-306.