数据挖掘技术在软件工程的运用

数据挖掘技术在软件工程的运用

摘要:首先对数据挖掘技术的基本含义进行概述,从便于各项信息的了解、便于信息的正确录入、利于缩短数据处理时间三个方面,对数据挖掘技术在软件工程中的应用意义进行解析,并以此为依据,提出数据挖掘技术在软件工程中的应用意义对策。

关键词:数据挖掘技术;软件工程;应用对策

1引言

随着信息化时代的来临,传统信息处理技术已经无法满足现代化信息处理需求,无法实现大量信息精准传送和保存。数据挖掘技术的出现,可以将这一现象进行处理,实现各项信息的精准记录和传递。现阶段,数据挖掘技术已经在各个领域中广泛应用。软件工程作为近几年快速发展的产业,软件工程发展往往和信息技术发展有着直接关联。把数据挖掘技术运用到软件工程中,能够将数据挖掘技术自身作用全面激发,提升软件工程研发效率,减少软件工程管理成本投放,防止不必要问题的出现。由此可见,数据挖掘技术在软件工程中应用,具备现实性意义。下面,本文将进一步阐述和解析数据挖掘技术在软件工程中应用。

2数据挖掘技术的基本概述

从数据挖掘技术自身角度来说,其主要指一种现代化信息处理技术,和传统信息处理技术进行比较,数据挖掘技术凭借自身强大的功能,在各个领域中广泛应用。当前,数据挖掘技术没有得到全面普及和推广,大部分IT行业对数据挖掘技术应用价值缺少深入了解,依旧采用传统信息处理技术,使得信息处理效率相对不高。通常情况下,数据挖掘技术中包含了数据处理、数据转换、数据分析等功能,并且各个功能之间均存在一定关联,能够实现综合评估[1]。针对部分软件工程企业而言,通过将数据挖掘技术运用到软件工程中,可以有效提升信息处理效率,防止不必要失误出现,对企业稳定发展起到了重要作用。

3数据挖掘技术在软件工程中的应用意义

3.1便于各项信息的了解

由于数据挖掘技术中包含了传统信息处理技术中各个功能,通过把各种信息集中采集之后,根据数据类型进行分类管理。在这种信息采集方式的作用下,其涉及范畴更加广泛,可以根据数据特性展开分析,能够在大量数据中,构建完善的信息管理系统,便于快速获取和查询所需信息。通过把数据挖掘技术运用到软件工程中,能够把部分信息资源加以整合,以此让企业全方位的掌握和了解各个数据。

3.2便于信息的正确录入

数据挖掘技术中具备较强的运算功能,常规数据信息系统在开展运算工作时,消耗的时间成本比较多,甚至因为数据数量的庞大,使得运算系统出现崩溃。在数据挖掘技术的作用下,不会出现该问题,运算时间相对较短。同时,在进行数据运算的过程中,不会出现数据丢失或者混乱的现象,有效提升数据的完善性[2]。在大规模数据中,部分数据不具备应用价值,属于垃圾数据,但是由于其保存在数据处理系统中,将会影响处理系统整体运行效率,而通过应用数据挖掘技术,能够把垃圾数据从中剔除,把精准的数据录入到数据系统中,保证数据整体质量。

3.3利于缩短数据处理时间

在数据挖掘技术中能够实现数据转换,把部分杂乱数据进行处理,变成试用形式,针对这些数据而言,能够实现科学调用。在进行数据挖掘时,将会自主的选择合适分析工作,对各个模糊数据进行清理,让最终获取的数据得到科学应用。之后根据获取的相关数据,从各个角度入手,对其是否真实有效进行考核,把真实的数据进行整合,让数据成为一种可读模式。换言之,把分析结果当作新知识给管理人员提供参考。数据分析作为一项较为繁琐的流程,其各个流程均要进行反复验证才能得出,直到获取最终运算结果。通过把数据挖掘技术运用到软件工程中,能够有效提升数据质量,减少应用时间。

4数据挖掘技术在软件工程中的应用对策

4.1应用分析

4.1.1挖掘结构

数据挖掘技术在结构及流程代码等方面应用流程如下。首先,检测克隆代码方法。从克隆代码角度来说,主要指根据有关软件工程云隐标准,将部分代码进行复制的流程或者工具。假设在特殊情况下,还要综合实际情况对部分代码进行更改,同时对以上代码进行管理和检测,其目的就是防止部分故障传递,促进维护系统目标的实现。通过应用克隆代码方式[1],能够保证软件系统的顺利运行。当前,克隆代码检测方式主要有四种,第一种是标识符比较;第二种是文本对比;第三种是程序结构;第四种是度量[3]。每个克隆代码检测方式都具备特有的诊断和评估方式,在应用的过程中,应该根据实际状况合理选择。其次,Aspect挖掘法。该项技术是人们通过横切关注点获取的挖掘方式,在软件工程中,通过应用Aspect挖掘法,能够实现系统的改造。特别是在处理有关问题的过程中,能够提供诸多方式,其中,形式概念及度量分析法可以起到理想的效果。上述方式均需要借助重新构建选集,才能将横切点挖掘问题进行处理。并且,该项数据挖掘技术可以应用在各个领域,具备良好的应用功能。数据挖掘示意图见图2。

4.1.2软件项目管理

要想把数据挖掘技术运用到软件工程管理活动中,可以从两个方面入手,一个是版本控制信息挖掘中涉及了对组织关系挖掘,另一个是版本控制信息挖掘。从软件工程管理角度来说,其自身具备明显的系统及繁琐特性,对组织关系挖掘有着较高的标准,是促进各项资源科学调配和应用的依据。把整个软件工程管理流程当作主体,根据形成的电子邮件及共享文件,对数据实施挖掘,能够形成各个工种人员组织关系,防止流程混乱现象出现,确保软件工程管理工作有序落实[4]。除此之外,版本控制能够促进对文件内部信息变化情况的记录,并将其当作用户掌握版本内容的依据。通过将数据挖掘技术运用到版本控制信息中,能够有效减少系统维护成本投放,并且还能发挥警示效果,将系统修复环节中各项披露现象进行体现,从而促进软件工程管理水平的提升。

4.1.3软件开发

数据挖掘技术最初主要是把数据库当作基本进行发展的,随着其快速发展,已经由之前的理论逐渐发展到实际应用中,并且在实际应用中逐渐形成了更多深层次的科学和内容,实现一同发展。软件工程作为一个工程化学科,能够结合各个项目指标、资金及用户需求研发出新型的产品。在以往软件工程中,开发流程较为繁琐,但是随着时间的发展,其逐渐发展起来,并且得到了各个领域的应用,应用性得到了大幅度提升。把数据库挖掘技术运用到软件工程中,在数据库信息的作用下,能够保存诸多具备探究价值的内容,对软件工程开发今后发展起到了现实性意义。此外,软件工程能够掌握诸多信息挖掘内容,应用范畴较为广泛。软件工程版本能够把软件开发过程中各项信息进行统一处理,确保数据在软件开发环节中做到实时更新,保障软件开发质量。现阶段,软件开发更换数据信息中涉及了数据挖掘等内容,能够实现软件内部的划分,便于及时找出存在问题并处理,保证软件开发目标的快速实现。

4.1.4故障检测

从故障检测角度来说,对程序执行记录实施数据挖掘,能够提供程序交互模式以及说明,而上述信息均能够给软件故障定位及检查提供凭证。针对程序说明数据挖掘而言,也就是对信息追踪及逆向建模的过程,通过对流程的深入了解及优化,可以给后续维护管理工作开展提供条件[5]。现阶段,广泛应用的挖掘方式主要以常规方式为主,通过对程序行为挖掘,找出对应流程,并根据事态落实进行表述。

4.2应用方式

4.2.1分类

数据挖掘技术中包含了大量的分类方式,主要集中于对同种预测分类标号的执行动作。在实际过程中,一般应该通过建立对应分析模型,并提前结合对应流程标准输入相关数据,以此将其当作分析模式应用依据。现阶段,数据挖掘技术在软件工程应用的分类方式中,采用的分类方式主要有神经网络分类法、判断树法、贝叶斯分类法以及支持向量机等几类[6]。其中,判断树法在分类方式应用过程中,利用贪心算法将其当作逻辑依据,秉持由上至下的标准实现判定树框架的构建,而判定树中涉及了诸多子节点,各个子节点均代表对应的软件类别符号。

4.2.2聚类

聚类主要指,把探究环节中包含的各个数据,根据相关标准进行细化,细化成各个类型的流程,以此在保证相同类型对象之间具备较强相似性的同时,还能让不同类型对象之间具备明显差异。聚类和分类在本质上存在一定偏差,聚类过程划分对象往往为不可预测性,也就是无指导学习方式。聚类分析方式在其他算法处理过程中,应用范畴较为广泛,特别是数据分析独立性方面有着重要意义,不但能够充分挖掘孤立点,同时还能提升检测结果的真实性和精准性。

5结语

总而言之,随着信息化时代的来临,数据挖掘技术作为一种数据处理、找寻目标信息的重要方式,通过把数据挖掘技术运用到软件工程中,从软件开发、软件工程管理、程序代码等方面入手,加强数据挖掘,将数据挖掘作用充分发挥,在提升数据挖掘质量的同时,缩短开发时间,减少不必要成本投放,从而给我国软件工程企业创造理想效益,实现软件工程行业稳定发展。

参考文献

[1]李孟臻.浅析软件工程行业中数据挖掘的应用[J].中国新通信,2018,20(16):98.

[2]王艺霏.计算机软件工程数据挖掘及发展趋势研究[J].电脑知识与技术,2018,14(14):261-262.

[3]蒯天宇.数据挖掘技术在软件工程中的应用[J].数字技术与应用,2018,36(05):112-113.

[4]段彬,魏巍.数据挖掘在软件工程领域中的应用浅析[J].信息系统工程,2018(04):89.

[5]刘超.软件工程数据挖掘研究进展[J].农家参谋,2018(03):201.

[6]谭薇.刍议软件工程中数据挖掘技术的实践运用[J].科技创新与应用,2016(30):97.

作者:程志平 徐涢基