探讨区块链和数据挖掘的审计系统构建

探讨区块链和数据挖掘的审计系统构建

摘要:在科技强审新时代背景下,大数据、云计算、区块链和人工智能等新兴数据技术的深入发展,将冲击传统行业并带来翻天覆地的变革。如何将新兴数据技术集成到审计中是当前审计探索的重点。区块链是一个具有分布式共享账本和数据库,能够实现分布式数据安全存储、点对点加密传输、共识信任验证以及自动执行智能合约的新型数据技术。数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程。文章将基于区块链和大数据挖掘构建审计系统,区块链进行数据的分布式存储和管理,大数据挖掘对数据进行挖掘和分析,共同促进审计行业对数据的存储和分析。

关键词:区块链;大数据;数据挖掘;科技强审

一、引言

在科技强审新时代背景下,大数据、云计算、区块链和人工智能等新兴数据技术的深入发展,将冲击传统行业并带来翻天覆地的变革。审计作为一个用数据说话的行业,需要搜集大量数据、整理归纳数据、对数据进行分析和判断以及基于数据出具审计报告。审计行业亟需能大量处理、计算和分析审计数据的系统,为审计人员降低审计成本并提高审计效率。如何将新兴数据技术集成到审计中是当前审计探索的重点。智能审计时代目前还未到来,信息系统审计仍是实务界的主流。IT审计建立在信息系统上,但独立于信息系统本身。信息系统审计(IT审计)的目的是通过实施信息系统审计工作,对组织是否达成信息技术管理目标进行综合评价,并基于评价意见提出管理建议,协助组织信息技术管理人员有效地履行其受托责任以达成组织的信息技术管理目标。IT审计人员根据客观事实开发和使用IT审计系统,IT审计系统计划、使用、维护与审计相关的信息活动和审计活动,并对事件结果做出基本评估和反馈。审计IT实质是基于客观事实,从客观和公正的角度收集审计和评估信息,坚持公平正义的原则,最终生成披露所有信息的审计报告,并给出关于信息系统的活动反馈。在企业中应用IT审计可以为信息系统的安全性提供保证,可以对投资、开发以及信息系统的应用进行客观的评估,对企业的发展具有深远的意义。同时引入IT审计可以丰富审计的形式,改变传统审计的单一结构模式,使企业更好地适应发展,满足企业审计发展的需要。在引入和应用IT审计的过程中,企业最好同时开发自己的信息系统,加强信息的交流和传播,提高审计质量和审计效率。区块链是一个具有分布式共享账本和数据库,能够实现分布式数据安全存储、点对点加密传输、共识信任验证以及自动执行智能合约的新型数据技术。数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程。区块链对数据进行分布式存储和管理,数据挖掘对数据进行挖掘和分析,本文将基于区块链和大数据挖掘构建审计系统,解决审计数据繁而杂、无法进行有效挖掘分析等问题,共同促进审计行业对数据的存储和分析。

二、区块链应用于审计行业的适用性分析

比特币在全球的流通促使了区块链技术的崛起,比特币仅作为区块链技术的上层应用,就已经有如此广泛的应用与关注度,相信作为底层技术的区块链有更多值得探索和开发的前景。区块链不是由一个单一的技术构成,而是通过各行业辛苦的积累构成的多技术的融合。以下将通过对区块链技术的分析,阐释区块链适用于审计行业。

(一)去中心化

在TCP/IP协议中,NDP单元需要运行SPM中存储的代码,并为在Near数据处理器中运行的程序提供堆栈空间。为了避免应用程序和NDP单元之间的数据复制开销,构造的NDP系统允许NDP单元直接访问主处理器侧应用程序的虚拟地址空间。临近数据处理器需要通过TLB完成从虚拟地址到物理地址的转换。当计算任务迁移到NDP单元时,将在主处理器侧的内核空间中创建一个包含当前计算任务地址转换规则的规则表,以用于TTL丢失时查询NDP单元。基于这种地址转换机制,可以通过指针在主处理器端的应用程序和NDP单元之间传输数据,区块链各网络节点之间的数据传输原理与此相同。区块链分布式分类账户为空间管理层提供了去中心化的基本功能,着重于进一步构建分散的基础平台。命名空间管理层在分布式分类账户提供的基本平台上实现Internet命名空间的一般分散。同时它提供了可信赖的基础,依赖于这些名称空间的应用程序层,从而可以实现更接近用户业务的应用程序开发。

(二)共识机制

区块链系统中,当部分网络节点通过投票的方式对某项交易进行共识验证,一旦共识验证通过,那么就认为此交易是有效的且会被记录到区块链上。现今区块链的共识机制主要有:工作量证明机制(PoW)、权益证明机制(PoS)、股份授权证明机制(DPoS)和实用拜占庭(PBFT)。审计数据需要从被审计单位上传至审计系统服务器中,共识机制的存在可以有效避免审计数据存在的问题,如审计数据可能被篡改,由此会导致审计结果的不可靠。共识机制的存在使审计数据更加可靠与透明,区块链的各网络节点都可以对审计数据进行共识验证,区块链上各节点都是审计人员。

(三)智能合约

区块链中的智能合约一般指自动执行合约条款的计算机协议。智能合约能够保证已写入程序的合约条款会被自动执行,保证了各网络节点的公平交易。通过智能合约操作将系统操作期间生成的数据信息存储在通用记录池中。系统中有多个记录池,并且可以彼此之间交换信息,这也保证了去中心化模式下数据的安全性。为了提高系统的数据处理速度,有必要在区块链上存储尽可能少的数据信息,仅存储维持链上运行所需的信息。从上述分析可知,区块链应用于审计行业具有适用性和实用性。

三、数据挖掘应用于审计行业的适用性分析

培根和洛克代表的经验主义者批评了知识的真理和超验性观点。他们认为知识应该是人类通过感觉器官与外界形成的各种联系。获得真实知识的方法是观察和实验。笛卡尔和康德代表的理性主义与知识的经验观点不一致,他们认为难以保证通过感觉和经验获得的知识是可靠的,而通过认真思考而产生的知识是清晰可信赖的。正如同审计行业一样,人为因素正逐步退出审计过程中,用计算机程序来代替,减少人为的感觉和经验,从而可以确保审计结果的可靠性与正确性。减少人为的感觉和经验并不是予以否认,而是要把审计人员的职业判断和计算机程序相结合,两者优劣互补,共同促进审计行业的进步。所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。审计行业的大数据为数据挖掘技术的应用提供了良好的平台。由于审计数据的大量化、多样化和复杂化,以往的抽样审计方法已然不能适应审计大数据,此时需要处理数据和分析数据的系统,数据挖掘正好可以适用。数据挖掘可以寻找出潜藏在审计大数据中的微小的关键信息,以及分析出数据中的规律及勾稽关系,帮助审计人员挖掘有价值的审计信息。此外计算机系统代替审计人员实行审计,不仅可以减少审计时间提供审计效率,同时还能保障审计结果的可靠性与安全性。从上述对数据挖掘分析可知,数据挖掘是解决审计行业大数据问题的有效方法。

四、基于区块链和数据挖掘的审计系统构建

以下将对构建的基于区块链和数据挖掘的审计系统进行阐述,并对其中的数据处理层进行详细的阐释。

(一)构建审计系统模型

从上述分析可知,区块链和数据挖掘会引来审计行业的革新,推动审计行业的颠覆性发展。因此构建的审计系统主要由数据采集层、数据存储层、数据处理层和数据管理层和应用层组成,如图1所示。数据采集层的主要功能是数据采集,包括两种技术:数据采集和分析诊断。系统记录生成的数据,并通过视频监控,可穿戴设备和网络爬虫的数据获取技术将其传输到数据层。数据存储层主要功能是存储和读取审计数据。也就是说,对技术层收集的语音、文本、视频等审计数据进行预处理,并根据相应的体系结构自动将它们聚类并存储在数据库中,并建立一个用于查询和检索的索引函数。数据处理层主要功能是对收集的审计数据处理和分析,从中获取审计所需的关键信息。数据集成是数据集成处理的扩展技术,可以使用数据集成技术来识别和处理数据,还可以建立数据之间的关联。数据集成是扩展的数据集成过程,其中包括诸如关联发现和数据分类之类的功能。管理层主要功能是对系统进行管理,包括系统设置、系统更新以及初始化调整等。管理层是介于数据和应用之间的介质和桥梁,通常上层自动应用或产品化所需的数据会直接由计算层调用。数据管理的目的是保障高质量的数据结果、协调不同数据应用之间的可共享性、统一性、规范性和有效性。应用层是一个开放式的接入端口,主要功能是提供上层应用的接入端口,审计单位可根据实际需要选择应用,增加数据处理与分析。数据处理结果通过可视化技术反馈给被审计单位,完成在线审计,节约审计时间,提高审计效率。

(二)数据处理层

学术界和实务界对数据处理没有统一的定义。一般认为,数据(Data)是对事实、概念或指令的一种表达形式,可由人工或自动化装置进行处理。数据经过解释并赋予一定的意义之后,便成为信息。数据处理(dataprocessing)是对数据的采集、存储、检索、加工、变换和传输。数据处理的基本目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。自动清除模型是指通过编程清除数据。使用程序清理数据时,必须首先确定数据清理的标准,包括数据中的关键字和表单的属性标准。基于这些标准,审计单位可以通过编写相应的程序来清理和纠正数据问题。清洁程序完成并完成操作后,应测试清洁结果以确保有效处理数据。对于处理,应通过以下步骤:一是在一个或多个属性值上创建一个块函数,使用此函数将实体拆分为几个块,然后过滤最少相似的实体对以减少需要匹配的数据量;二是通过聚类算法对记录进行分类,即代表同一实体的记录位于同一类别中;三是使用给定的相似度函数或规则定义记录之间的相似度,满足阈值的记录对被认为是可匹配的。在模式匹配阶段,主要完成的是对不同来源或结构的数据进行模式级别的匹配,即找到表示相同内容的元素。由于每个数据集的来源不同,可能存在异构情况。因此,在模式匹配阶段,首先应该协调异构数据模式,并为来自不同来源的数据生成统一的结构;然后,将数据中的属性进行匹配,以在协调后将每个数据中的属性与结构进行映射;最后,映射数据中的语义关系,以确保可以正确地阐述数据。

五、审计系统在审计实践中的应用

审计是党和国家监督体系的重要组成部分,发展之势势不可挡。审计系统能够解决审计工作中的数据存储和处理问题,在审计实践中会大放异彩。

(一)审计系统保障数据的安全性和可靠性

区块链的共识机制和去中心化特征能保障审计数据的安全性和可靠性。由区块链技术作为底层系统的审计系统,将会提升对数据的保护。共识机制的原理是将数据区块上传到区块链上,其他网络节点对其进行共识验证,共识验证成功后,审计数据将会永久保存到区块链上,篡改和删除的难度极其困难。去中心化特征表明所有的网络节点并没有一个明确的中心节点,任何网络节点都可以是中心节点,这很大程度上保护了审计数据的真实和安全。

(二)审计系统实现数据的处理

数据挖掘是目前人工智能和数据库领域研究的热点问题,主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据。审计作为一个用数据说话的行业,数据的大量化、多样化和复杂化为数据挖掘提供了良好的应用平台,构建的审计系统能实现数据的处理和分析。构建基于区块链和数据挖掘的审计系统投入实践和应用还需要更多的探索。

作者:王颖 闫璐 苟勇 单位:西京学院