数据挖掘技术对软件工程的作用

数据挖掘技术对软件工程的作用

摘要:近年来,随着数据技术的不断发展,尤其是随着软件系统的不断完善和研发,软件开发已经成为一项非常复杂的系统工程。在进行软件设计的过程中,由于软件工程的活动和过程是比较复杂的,从而很难掌握。因此只有对原有的处理模式进行不断创新以及完善,才能使软件工程能够更好地应用在我国的相关领域中。基于此,笔者对软件系统发展的相关环节进行了分析以及对比。

关键词:数据挖掘技术;软件工程;应用

0引言

近年来,我国的软件系统在不断发展以及完善,数据挖掘技术也开始应用在一些领域。在软件工程中,数据技术采用了应用分类以及预测等技术,从而可以对资源进行更好的利用以及开发,能够有效提高开发效率。但是由于软件规模在不断扩大,相关的软件设计也越来越复杂[1-3]。数据挖掘技术就是通过数据手段对大量的数据进行提取以及分析,并且从中找出相关的数据,并且也解决了系统存在的问题。

1数据挖掘技术在软件工程中的应用

所谓数据挖掘技术,指数据的提取以及应用,被称作数据库中的知识。数据挖掘技术的发展基础就是数据库。在发展的过程中,相关人员将理论知识以及相关研究逐渐转变为实际的操作以及应用,并且将数据挖掘技术应用在其他领域,使数据挖掘技术能够更好地发挥作用。而软件工程最早出现在1967年,最初的软件工程主要通过维护以及构建,从而形成更加实用以及方便的软件。并且相关软件在设计的过程中,也应该依据客户所需要的内容进行开发。正因如此,应用数据挖掘技术与软件工程的前景是非常广阔的,在未来数据挖掘技术在软件工程中的应用也会得到迅猛发展[4-6]。

2挖掘技术概述

2.1执行记录

挖掘技术的执行记录主要就是对程序所运行的相关路径进行分析以及总结,并且从中找出程序中有联系的相关内容。追踪记录的根本就是要进行路径跟踪,从而达到目的。执行记录的主要作用就是为了能够更好地维护程序正常运行,以及了解程序的相关内容。在执行记录的过程中,首先应该对系统进行分析,并且也应该对软件工程的相关变化情况进行记录,最后再将所记录到的内容进行筛选,从而获取自己想要的信息。执行记录也已经成为当今系统功能的模板。

2.2漏洞检测

漏洞检测最主要的就是要找出软件中存在的一些问题,从而提高软件的体验效果以及质量。同时,漏洞修复也能用最快的时间修复软件中的漏洞,能够为用户提供更好的保障。数据挖掘技术应用在漏洞检测方面,不仅要对软件进行一系列的测试,同时也应该是相关检测,能够满足客户的需求。数据挖掘技术能够根据所记录的内容进行一定的分析,并且对得出的内容进行总结以及完善,从而在决定用哪一种测试方式来进行测试,最终使所测试的方式能够更好地符合软件的需要。在处理手机漏洞数据的过程中,数据挖掘技术首先需要对数据进行清理,然后再将有关的数据进行分析以及提取,再清理没有用的数据后,对缺失的相关内容进行弥补和修正,转换为数据进行表示。不仅如此,在利用数据挖掘技术检测漏洞的过程中,应该选择更加适当的数据模型进行验证和分析,选择更加合适的挖掘方式,让它成为测试集。同时,相关的系统也应该对得出的结果进行分析以及比较,选择最合适的结果。除此之外,在进行漏洞检测时,也应该将软件的漏洞进行描述以及分类,并且将这些漏洞的数据更新到软件数据库中。这样相关软件在遇到类似的问题时就能够做出更快的操作,从而也在一定程度上方便了漏洞检测。值得注意的是,在更新漏洞数据的过程中,也应该做好数据分类工作。

2.3挖掘开源软件

开源软件具有开放性的特点,因此在开发开源软件的过程中,也应该将其与其他软件进行区分。一般情况下,相关人员在开发软件的过程中,每一步都应该有对应的参考报告,并且也应该有更加详细以及完整的记录。开发人员组成社会网络,而因为开源软件具有一定的开放性,所以在进行设计的过程中也应该进行不断优化,从而可以使软件能够更加完善。此外,相关的工作人员也应该对开源软件进行动态挖掘,这是因为开源软件是具有变化性的,只有进行动态挖掘才能更好地进行项目管理。

2.4挖掘版本控制信息

实行挖掘版本控制信息,可以保证项目参与者和共同编辑的一致性,这样在进行更新的过程中也可以统筹全局。首先,相关人员应该正确选择挖掘版本的应用方式,并且也应该针对信息的变更从而发掘出不同的模块与总模块之间的关系,从而也可以更加清晰地了解不同模块以及系统之间的联系。使用挖掘技术也可以在一定程度上降低软件系统的维护成本,从而也可以很好地避免在后期出现相关漏洞,最终起到维护系统的作用。

3应用方法

3.1关联法

在选择关联法的过程中,相关人员以及系统必须将数据中存在的关联数据进行分类以及区分。关联法的规则在于数据的相关关联,因此进行数据关联是非常重要的。关联法的特点主要就是支持度以及置信度。

3.2分类法

所谓分类法,就是需要相关的系统对分类标号进行一系列的操作,但是进行操作的前提是建立合适的模型,只有选择合适的模型才能进行下一步操作。选择好对应模型后,就需要对数据集进行分析和整理,并且也应该对不同的数据进行分类。在分类的过程中,一般选择的就是判定树法,包括网络分类法以及支持向量机法等。为了更好地保障判定树法能够得到正常应用,可以采用贪心算法。贪心算法是判定数法最基本的一项内容,如果只是对样本容量进行分类的话,那么在分类的过程中就可能会出现错误。

3.3聚类法

在应用聚类法的过程中,首先要对数据进行分类,将数据分为多类,从而可以更好地保证数据的相似度,但是不同种类的数据对象有着不同的特点以及特征。其中,聚类法主要包括划分法、模型法、网格法等。

3.4克隆代码数据挖掘

在进行软件工程设计的过程中,原始数据挖掘的最基本要求就是检查克隆代码,这是进行数据挖掘的基础。目前,克隆代码数据挖掘有很多方式,比如文本对比法以及标识符等方法,都是最基础的方式。文本对比法主要应用了计算机对比程序,对比程序中可以对语句进行判断。利用该方式也可以很好地提高字符匹配的效率。除此之外,在优化的过程中计算机选择的主要是函数技术,而标识符就是将一些标识符号作为最基础的方式进行应用,应用的工具主要有DUP。

3.5计算机软件数据检索

计算机软件的数据检索与克隆代码是具有相似性,都属于计算机最原始的挖掘技术,而计算机数据检索主要分为三类,其中包含信息录入、数据信息查找以及数据信息查看等内容。所谓数据信息录入就是录入需要进行检索的相关信息,然后再进行下一步的操作。而所谓的信息数据查找,就是相关人员在进行数据查找的过程中,只需要将需要查找数据的关键词输入指定的位置,并且点击确定按钮进行查找,从而可以查找出与之相关的所有信息。数据信息查看就是相关人员可以根据自己所需要的内容进行数据的在线查看以及下载,可以很好地满足相关人员对于数据的需求。用户导出相关数据后也会形成一个历史记录,这样后台就可以保存用户查找信息的相关内容,并且也可以有针对性地将查到的内容进行分类,从而形成一个系统的数据库。

3.6软件项目组织管理

在新的软件项目立项之后,同时也需要借助数据挖掘技术对项目进行管理以及分析。首先,数据挖掘技术可以挖掘软件系统中的一些组成成分以及组织框架的信息,可以为工作人员提供更多的发展方向,相关工作人员也可以因此进行资源整合以及利用。在进行某一项目的研发过程中,同样也离不开各种岗位之间的相互配合以及交流,比如在进行日常信息电子交互的过程中,就可以利用数据挖掘技术使交流有序进行。不仅如此,数据挖掘技术也可以更好地理清不同人群之间的关系以及层次,这对于软件项目的整体发展也起到了非常关键的作用。其次,数据挖掘技术也可以更好地查看软件的版本信息。由于软件在长期使用过程中也会产生大量的数据,如果不能对这些数据进行分析和完善,那么也就不利于软件更新。但是如果能够利用数据挖掘技术,就可以更好地对软件系统进行维护,极大地节省了资金和时间成本。除此之外,在进行数据挖掘的过程中,如果系统软件存在一些错误,也可以被及时更正以及完善。

4结语

近年来,随着科学技术的快速发展,软件工程技术也已经应用在很多行业以及领域中,也已经成为工程技术非常重要的技术支撑之一。其中,数据挖掘技术作为非常重要的一项内容,也已经广泛应用在很多领域。但是随着更多软件的发掘,数据技术也不能依靠自身发挥作用,而是应该将数据技术与其他工程进行融合发展,从而才可以更好地保障工程技术的完整性以及可操作性。在未来,数据挖掘技术在软件工程中的应用也会越来越广泛,能够促进我国的经济发展以及科技进步。

参考文献

[1]栗元龙.数据挖掘技术在软件工程中的应用探讨[J].数字通信世界,2019(9):181.

[2]张立鉴.数据挖掘技术在软件工程中的应用研究[J].网络安全技术与应用,2019(6):47-48.

[3]张勇.软件工程行业中数据挖掘的应用探讨[J].中国新通信,2018,20(5):89.

[4]王蕊.数据挖掘技术在软件工程中的应用分析[J].信息与电脑,2018(7):131-132,135.

[5]张佳新.数据挖掘技术在软件工程中的应用探究[J].电脑编程技巧与维护,2018(4):88-89,114.

[6]耿正熙.数据挖掘技术在软件工程中的应用研究[J].信息通信,2016(11):85-88.

作者:龙艳 单位:贵阳学院