模式识别技术范例6篇

模式识别技术

模式识别技术范文1

关键词:数据挖掘技术;洗钱交易;模式

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)14-0204-02

1 前言

如今,我国对于反洗钱主要是金融机构依据相关管理办法上报可疑交易数据,对洗钱犯罪进行识别和调查。这种方法存在标准模糊、高误报率、海量数据以及缺乏自适应性等问题,对上报可疑交易数据的有效性与可靠性造成影响。在这种形势下,本文就提出了采用数据挖掘技术识别可疑洗钱数据,这种研究具有实用价值。

2 数据挖掘技术的流

数据挖掘也称之为数据库知识发现。如今数据挖掘技术被应用到各个领域中,比如生物医学、金融、零售业以及工程和科学等各个领域中。数据挖掘技术能够快速处理大量的金融数据,识别洗钱行为,让反洗钱过程简单化、效率化。数据挖掘技术基本步骤如下图所示:

从上图来看,数据挖掘技术过程大致分成四个阶段:

(1)选择与清洗数据;当确定好数据挖掘对象时,就需要搜索所有和对象相关的外部与内部数据,就需要从中挖掘应用数据。但是现实中的数据都含有噪音的、不完全的、不一致数据,所以必须要清洗数据过程填充空缺值,消除噪声、识别孤立点,纠正数据中不一致。

(2)集成与转换数据;数据分析中常常要涉及数据集成,数据集成就是把多个数据源中数据共同存放到一个数据存储中。在合并多个数据源时,就必须要考虑到识别实体问题,就必须要将实体名称不同的合并在一起。有一些属性具有冗余性,可通过其他属性计算所得。数据转换就是要满足挖掘所需。

(3)挖掘数据;数据经过清洗,集成以及转化后,就进入到了挖掘数据阶段。挖掘数据就是选择适当的数据挖掘技术,比如聚类、神经网络、模式识别以及孤立点挖掘等等,然后依据所选数据挖掘技术确定具体算法,之后选定算法查找感兴趣模式。

(4)评估与表示知识;评估知识,如今主要是采用了兴趣度衡量真正感兴趣的知识。依据一定兴趣度的度量,评估数据挖掘结果,对有用部分进行筛选与评估,查找能够接受的结果。对于表示知识,如今较为流行的即为可视化技术,可视化即将数据、知识与信息转化成可视表示形式过程。

3 数据挖掘技术识别可疑洗钱交易

3.1 识别流程分析

识别可疑洗钱行为属于反洗钱数据调查,主要就是通过单笔账户的历史交易时序数据中各子序列比较分析,从中发掘值得怀疑交易数据。识别的基本思路如下图所示:

(1)时序数据划分:属于一个异常的检验体系中,即为一个单一数据点是不可能提供多少信息。真正需要是从数据中挖掘一些偏离正常数据数据模式。识别可疑洗钱行为,就需要将账户历史交易记录成一个个若干相邻单笔交易形成的交易子序列,从中挖掘可疑的行为模式,最后形成可疑交易数据。

(2)属性选择:识别可疑洗钱行为就是建立到清醒认识可疑交易特征属性上。只有选择属性较为科学、全面以及真实的描述偶然行为模式特征,选择方法识别这种行为的相关数据。

(3)统计计算:对于所选偶然可疑的洗钱行为的相关属性,计算出各个子序列属性值。子序列对应桌各行为模式就构成了属性特征的向量。

(4)确定样本集:每一个行为模式特征向量视为一个研究样本,账户上所有行为模式特征向量形成了样本集。

(5)算法实现:事实上,每一个账户中大多数交易行为均属正常化,或合法化,仅仅极少数交易行为存在可疑性。孤立点就是数据集中和大部分数据相偏离,出现偏离原有并非随机因素,主要是因为完全不同的生产数据机制。

(6)标记样本:依据样本的专家知识以及孤立因子值,标记出孤立最大因子值的N个样本,挖掘偶然可疑的洗钱行为模式。

本文对交易金额的属性分析、离散系数的属性分析作为重点说明。

(1)交易金额的属性分析:Tai(交易金额)即为每一个交易的子序列交易金额总和。假如某个账户第i个子序列中共有ni笔交易,每一笔交易金额[taij]依照时序排列是:[tai1、tai2...taint],那么账户的第i子序列交易金融是[Tai=j=1nitaij],由此可见,可以求出账户交易的所有n个子序列内交易金额:[Ta1、Ta2...Tan]。每一个子序列交易金额[Ta1、Ta2……Tan]以行业的规模特征向量中一个维度,经过比较分析,就能计算出偏离成都为总偏离程度中一部分。

本文选择交易金额为研究属性,就是从大额交易角度进行考虑。在识别可疑洗钱交易的研究过程中,因账户设定成偶尔的洗钱活动,绝大多数账户是没有进行洗钱活动,所洗钱分析就会选择短平快的洗钱模式,自然交易金额增大也就更加突出。即使交易金额能够用单一属性选择数理统计进分析,但是账户交易金额是极难符合某一种标准的分布,所以就要引入其他的属性。

(2)离散系数的属性分析:Tadi(交易金额的离散系数),即为交易金额的方差[Tsi2]和均值[Tai]的商。因交易金额的异常增大了,即便可疑洗钱行为具有重要表征,但也无法判别复杂洗钱行为。而犯罪时常利用多家银行或者其他的金融机构服务开展洗钱犯罪活动,在处理每一个账户时仅仅是针对小金额的非法收入,就能够规避监管大额交易的报告制度,也就增大了反洗钱的调查工作难度。选择交易金额的离散系统为研究属性,质量交易金额平均程度就是应对洗钱行为结构化的规避行为。离散系数越小,则表明交易的金额较为平均,反之交易金额具有较大波动。以出账金额作为案例,假如某一个账户第i个子序列中共有nj笔支出交易,那么按照每一笔的出账金额taij进行排列即为:[tai1、tai2...taint];该账户的第i子序列交易的平均金额即为:[Tai=1nj=1nitaij];账户上第i子序列支出交易金额方差即为:

[Tsi2=1ni-1j=1ni(taij-Tai)2]

就可以得出账户第i子序列支出金额的离散系数是:

所以就能够求解A账户第n个子序列中交易金额的离散系统为:[Tad1、Tad2、...Tadn]。本文就是将计算出来的离散系数,作为了可疑洗钱行为的一个特征属性,和其他属性值共同形成了子序列代表的行为模式所具的特征向量。

3.2 识别方法分析

在识别可疑洗钱行为模式上,本文就是借鉴了CBLOF算法同时,并适当改进了该算法中聚类分析过程,在此基础上形成了识别方法模式。

(1)算法设计

本文数据挖掘技术的涉及过程为:

其一从任意点开始,构建一个聚类簇,设初始簇为C1;

其二对其他某点q,计算和已有聚类簇点C的距离及最小值[distance(q,cmin)];假如[distance(q,cmin)]的距离小于或者等于阀值[ε],而且q未不属于任何一簇中,可 将它加入[Cmin],假如q距离多个已有簇小于或者等于[ε],那么合并这些簇。

其三对所生成聚类依照元素数目排序;

其四重复第2、3步,对下一点实施聚类,一直到所有点均被聚类为止。

(2)挖掘局部孤立点

经过上面分析形成了若干互不包含簇,同时簇是按照包含样本数目排列,选用CBLOF算法计算每一个点LOF值。之后依据LOF值大小进行排序。值越大孤立程度越高,值越小孤立程度就越低。金融机构就能够依据资源情况与公正所需确定出报送对象。

就是将聚类簇划分成大小类,按照样本数据点所属规模及数据点和最近簇的距离,由此确定出每一个数据点LOF值。这种方式下,挖掘局部孤立点就分成了两个步骤,就是按照大小类及确定出LOF值。

首先划分大小类;假设C={C1,C2,...Ck}为数据集合D聚类结果,其中[c1?c2...?ck],确定两个参数是a与β,根据下面公式有:

[c1+c2...+ck≥D*a];[cb/cb+1≥β];其中大类是c={[cii≤b]},用LC表死,即为LC={[cii≤b]};而小类是SC={[cjj>b]}。

其次计算LOF可疑度;假如数据集合中任何数据点是P,那么点P局部偏离值(即为LOF值)是:[CBLOF(p)=cj*distance(p,ci)],该式中[t∈ci,ci∈SC,cj∈LC];因此只要确定了每一个数据点LOF值,就能够确定出账户交易行为可疑的程度。使用信息者就能够依据所需,选出LOF值最大n个对象深入进行分析与研究。

4 结束语

识别可疑洗钱的交易行为,就可以依据账户自身交易模式变化进行识别。而偶尔洗钱行为无论属于那种手段,都能通过交易金额和交易时间两维度上存在异常表现出来,交易金额表现异常增大及平均程度异常,自然也就会增大交易频率异常。这种挖掘技术对识别洗钱行为具有作用。

参考文献:

[1]李果仁.反洗钱的现状与对策研究[J].广东经济管理学院学报,2014(1).

[2]谭德彬,陈藻.基于数据挖掘技术的银行反洗钱系统[J].国金融电脑,2013(7).

[3]汤俊.基于客户行为模式识别的反洗钱数据监测与分析体系[J].中南财经政法大学学报,2015(4).

模式识别技术范文2

本文在分析输配电线路安全运行存在问题的基础上,分别从在输配电线路的管理中积极运用信息技术;强化输配电线路的技术管理等方面对输配电线路的安全运行技术进行了探讨。

【关键词】输配电线路 安全运行 问题 措施

输配电线路是一种将电力用户与供电系统连接在一起的电力传输设施,其运行安全与否直接决定着电力系统的运行质量,从而直接影响到我们乌鲁瓦提水力发电厂的经济效益。近年来,随着输配电线路事故发生率节节攀升,对人们的生命安全造成严重威胁。因此,为了确保乌鲁瓦提水力发电厂的正常运行以及用户用电的正常,我们必须采取相应维护措施,加强输配电线路的安全运行。结合多年实践经验,笔者从以下几个方面对此问题进行探究。

1 输配电线路安全运行的问题分析

在实际运行过程中,输配电线路所处的环境较为复杂,影响其安全运行的因素(见表1)也较多。笔者结合自身多年一线实践经验,分析、总结输配电网安全运行中存在的问题。

2 提高输配电线路安全运行的措施探究

2.1 在输配电线路的管理中积极运用信息技术

科技是第一生产力,在任何行业都如此。如果能够熟练运用最新科技产物将给整个输配电线路的管理工作带来极大便利。信息技术在配电网中的应用主要在管理设备、检测运行状态、管理用电等方面。安全问题一直都是电力行业的重点,要保证电力设备的安全状态必须对其进行实时监控,对出现的异常及时的进行分析排查。例如我们可以用绝缘系统为例来说明信息技术对配电网的重要作用。对电力设备来说,决定其使用年限的重要因素之一就是绝缘材料,它的使用寿命将直接决定设备的使用寿命。绝缘系统在工作过程长期暴露在电、物理、化学、自然灾害等不可抗的损害之下,将不可避免的逐渐老化,严重影响其使用性能。在严重的情况下,甚至会出现绝缘缺陷的严重问题,一旦这些问题没有及时发现并进行有效改进措施,将会引起运行障碍甚至引发安全事故。而信息技术可以自动实时监控配电网络中的各个设备和线路,一旦参数出现异常,信息技术都将可以在第一时间发现并排查,以最快的速度恢复正常。提高供电网络的可靠性。对配电网进行信息技术管理可以提供以下管理功能:

(1)输配电线路内出现故障时可以及时发现,隔离并排查恢复。

(2)整个恢复过程由电脑自动化全程控制。

(3)在输配电线路进行故障维修或维护时,能自动实现负荷平衡的配电网供电过程。

(4)对输配电线路的监控数据都显示在配有街区线路图的显示器上。

(5)可以提供用户与设备连接的信息。

(6)各种数据显示结果与检测报告可以纸质化。

(7)为进一步保证安全配电,可以为相关工作人员提供比较真实的培训演练过程。

2.2 强化输配电线路的技术管理

输配电线路的安全管理是一项涉及项目多、技术要求高、更新速度快的系统工作,在配电网的实际运行维护阶段,工作人员应积极引进和运用先进的科学技术,强化输配电网的技术管理。目前,在输配电网的运行过程中往往需要用到以下技术,如表2所示。

3 结束语

总而言之,维持输配电线路的安全运行是一项长期、系统的工作。输配电线路的正常运行是保证电力系统安全运行的关键,也是用户正常用电的安全保障。因此,对输配电线路进行安全管理是极为重要的。但是当前我国在输配电线路的安全运行和管理中还存在一定的不足之处,给输配电线路的安全运营带来了隐患。这就需要电力工作人员在日常的工作中及时发现不足,并采取一定的措施如做好日常安全管理;强化输配电线路的技术管理;在输配电线路的管理中积极运用信息技术,全面保证电力系统的安全可靠运行,给人们营造一个安全的用电环境,不断提高人们的生活品质。

参考文献

[1]吴若愚,彭学洪,张雷.输配电线路的安全运行问题与对策[J].企业技术开发(下半月),2014(06).

[2]程浩.对输配电线路安全运行的探究[J].中国科技信息,2013(15).

[3]刘达应.输电线路人为因素外力破坏原因分析和应对措施探讨[J].中国科技博览, 2011(35).

模式识别技术范文3

关键词:旋转机械;故障诊断;方法

DOI:10.16640/ki.37-1222/t.2017.10.026

随着诊断技术研究的深入,可以实现故障诊断的方法越来越多,既有对前人研究成果的完善,也有一些原创性的研究成果相继被提出,根据各类方法在实现方式上的不同,可以大致将其分为三类,第一种是通过建立合适的模型进行故障诊断,这种方法在实际的生产应用中,往往由于设备结构复杂,无法构建精准的模型,即便可以获得合适的参数模型,其耗资也会相当大,所以实际应用可行性不大。第二种方法是结合人工智能技术的专家系统,在实际应用中这种方法得到了一定的肯定,但仍然存在知识获取不全面、针对性太强、智能水平低等问题,使得故障诊断结果可靠性不强。而模式识别是故障诊断中应用最为广泛的方法,且目前很多学者都认为基于模式识别的故障诊断有很大的进步空间。

1 旋转机械故障特点

旋转机械故障的故障特点与其他类型的机械故障存在一定的区别,且是机械设备中最为常用的一类,所以有必要对其进行单独的深入研究。旋转机械故障是指有转子系统的机械设备在运行过程中出现异常的工作状态,比如不正常的噪声、异常大的振动、温度急剧升高,或者其他指标不正常。旋转机械的结构复杂,故障发生具有一定的阶段性,并且部分故障的发生有一个渐进的过程,在进行故障诊断时,必须综合考虑多项因素,使得进行准确故障诊断的难度较大。

2 旋转机械故障检测方法

2.1 模式识别

经过多年的发展,模式识别己是故障检测的重要理论基础之一。近十几年来,模式识别技术在机械设备故障诊断领域的应用己经非常普遍,每年都有相关的改进方法被。在机器人模仿人类思考能力的研究领域上,模式识别方法一直占据着十分重要地位,在机械故障诊断方法中模式识别也始终是一个先进且富有挑战的探索方向。

随着计算机技术的迅速发展,各国在旋转机械故障诊断方面都取得了很大的进步,摆脱了传统依靠技术工人经验判断的主观臆断和不准确性,特别是这几年,计算机技术的发展使得各种更加完善的算法运行更为迅速,进而推进了旋转机械故障诊断的发展。

美国是最先研究机械故障诊断技术的国家之一,其诊断技术在很多方面都属于世界先进水平,目前美国从事故障诊断研究的机构主要有电子能源研究机构、西屋电气、Bently和CSI等公司。其中西屋电气是最早应用计算机网络的,该公司自己开发的汽轮机故障诊断软件可以对远程对多台机组进行诊断。而Bently公司在转子的动力系统和故障的诊断机理方面比较领先。

我国在机械故障诊断方面的研究起步相对较晚,技术也较为落后。刚开始主要以学习研究国外相关理论为主。直到80年代初期才逐渐有了自己研发的技术,在这个阶段,大型设备的出现和各项相关技术的发展也刺激了国人对旋转机械故障诊断技术的重视,也推动了该技术的自主研发。随着国家和企业对这项技术领域的投入逐渐增大,许多学者开始涉足这个领域,并对其进行大量的探索和实验,加上与国际交流合作,我国也开发出了一些在线监测与故障诊断的软件,这也很大程度上减小了与国际上相关先进技术的差距,但事实上,我国研究水平总体还是比较落后,故障诊断技术的可靠性还需要不断提升。

2.2 人工神经网络理论

1940年左右,有关应用人工神经网络的理论开始出现,经过多年的发展,它己经被引入到许多领域,比如,智能机器的控制、神经网络计算机的研发、算法的优化、应用计算机进行图像处理、模式识别、连续续语音的识别、数据的压缩、信息处理等领域,在实践应用中取得了很好的效果,作为一项新的模式识别技术和信息处理办法,人工神经网络的应用前景十分可观。

目前,使用人工神经网络进行故障诊断的方法有很多,最常用方法是:多层感知器神经网络、BP神经网络、自组织Kohonen神经网络、和径向基函数RBF(Radial Bases Function)神经网络,也有学者将人工神经网络与各种其他方法相结合的实例。在使用人工神经网络进行故障处理时,首先检查采集到的故障信息数据,剔除多余或者不合理的异常数据,再对有效数据进行归一化处理,预处理工作完成后即可将数据输入到神经网络中进行训练学习和故障识别过程。

2002年,王守觉院士分析传统模式识别方法的缺点,认为传统的BP神经网络和RBF神经网络都是假设特征空间中包括了所有的模式类别,要实现模式识别只需要找到最佳的特征空间划分方法,但事实上,任何一个特征空间中不可能包含所有的模式类别,特征空间中必然存在模式空白区域,就像人类对某些事物表现为不认识一样。认识到这一点后,王守觉院士提出了“仿生模式识别”这一概念,与传统的基于特征空间最佳划分的方法相比,仿生模式识别最为突出的特点就是,能构造封闭的、复杂的几何形体对各类样本进行覆盖,从而达到模式识别的目的。

2.3 仿生模式识别

自从仿生模式识别这一概念被提出以来,许多学者对其进行了深入研究,并将其应用到了人脸识别、车牌识别、语音识别、字体识别等领域。并取得了良的识别效果,例如:陆飞在其硕士论文中重点对仿生模式识别中的几何模型进行了深入分析,并用超香肠神经网络作为仿生模式识别的实现方法应用到了人脸识别中,取得了良好的实验结果;刘焕云等人将仿生模式识别应用到目标识别和跟踪方面,编写了自适应目标算法,与传统方法相比,跟踪识别效果有显著的提升;王守觉院士自己也对仿生模式识别算法进行了一系列的优化,先后提出了超香肠神经网络和多权值神经网络识别实现方法,并在文献中将基于仿生模式识别的多权值神经网络应用到连续语音识别中,与目前认可度最高的基于隐马尔可夫模型(HMM)的识别方法进行比较,表现出了显著的优势。

目前有许多的编程软件都加入了神经网络的功能,其中MATLAB软件最为方便实用,并且易于操作。它除了拥有对各种图形和数据进行处理的强大功能,其开发公司一一美国的MathWorks公司一一还专门在软件中开发加入了神经网络工具箱,全面包含了人工神经网络中常用的激励函数,例如线性函数(purline函数),感知器函数((sigmoid函数)以及径向基函数(radbas函数),除了这些常用传递函数,还可以自定义相关的函数。各层网络之间的映射也有严格的设定,映射函数可自行设定。鉴于以上优点,本文采用MATLAB软件编写仿生模式识别的实现程序,以及机械故障信号的特征提取和网络测试。

参考文献:

模式识别技术范文4

摘要:本文简要介绍了语音识别技术理论基础及分类方式,所采用的关键技术以及所面临的困难与挑战,最后讨论了语音识别技术的 发展 前景和应用。

关键词:语音识别;特征提取;模式匹配;模型训练

abstract:this text briefly introduces the theoretical basis of the speech-identification technology,its mode of classification,the adopted key technique and the difficulties and challenges it have to face.then,the developing prospect ion and application of the speech-identification technology are discussed in the last part.

keywords:speech identification;character pick-up;mode matching;model training

一、语音识别技术的理论基础

语音识别技术:是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高级技术。语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支,涉及到生 理学 、心理学、语言学、 计算 机 科学 以及信号处理等诸多领域,甚至还涉及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解),其最终目标是实现人与机器进行 自然 语言通信。

不同的语音识别系统,虽然具体实现细节有所不同,但所采用的基本技术相似,一个典型语音识别系统主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。此外,还涉及到语音识别单元的选取。

(一) 语音识别单元的选取

选择识别单元是语音识别研究的第一步。语音识别单元有单词(句)、音节和音素三种,具体选择哪一种,由具体的研究任务决定。

单词(句)单元广泛应用于中小词汇语音识别系统,但不适合大词汇系统,原因在于模型库太庞大,训练模型任务繁重,模型匹配算法复杂,难以满足实时性要求。

音节单元多见于汉语语音识别,主要因为汉语是单音节结构的语言,而 英语 是多音节,并且汉语虽然有大约1300个音节,但若不考虑声调,约有408个无调音节,数量相对较少。因此,对于中、大词汇量汉语语音识别系统来说,以音节为识别单元基本是可行的。

音素单元以前多见于英语语音识别的研究中,但目前中、大词汇量汉语语音识别系统也在越来越多地采用。原因在于汉语音节仅由声母(包括零声母有22个)和韵母(共有28个)构成,且声韵母声学特性相差很大。实际应用中常把声母依后续韵母的不同而构成细化声母,这样虽然增加了模型数目,但提高了易混淆音节的区分能力。由于协同发音的影响,音素单元不稳定,所以如何获得稳定的音素单元,还有待研究。

(二) 特征参数提取技术

语音信号中含有丰富的信息,但如何从中提取出对语音识别有用的信息呢?特征提取就是完成这项工作,它对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,获得影响语音识别的重要信息。对于非特定人语音识别来讲,希望特征参数尽可能多的反映语义信息,尽量减少说话人的个人信息(对特定人语音识别来讲,则相反)。从信息论角度讲,这是信息压缩的过程。

线性预测(lp)分析技术是目前应用广泛的特征参数提取技术,许多成功的应用系统都采用基于lp技术提取的倒谱参数。但线性预测模型是纯数学模型,没有考虑人类听觉系统对语音的处理特点。

mel参数和基于感知线性预测(plp)分析提取的感知线性预测倒谱,在一定程度上模拟了人耳对语音的处理特点,应用了人耳听觉感知方面的一些研究成果。实验证明,采用这种技术,语音识别系统的性能有一定提高。

也有研究者尝试把小波分析技术应用于特征提取,但目前性能难以与上述技术相比,有待进一步研究。

(三)模式匹配及模型训练技术

模型训练是指按照一定的准则,从大量已知模式中获取表征该模式本质特征的模型参数,而模式匹配则是根据一定准则,使未知模式与模型库中的某一个模型获得最佳匹配。

语音识别所应用的模式匹配和模型训练技术主要有动态时间归正技术(dtw)、隐马尔可夫模型(hmm)和人工神经元 网络 (ann)。

dtw是较早的一种模式匹配和模型训练技术,它应用动态规划方法成功解决了语音信号特征参数序列比较时时长不等的难题,在孤立词语音识别中获得了良好性能。但因其不适合连续语音大词汇量语音识别系统,目前已被hmm模型和ann替代。

hmm模型是语音信号时变特征的有参表示法。它由相互关联的两个随机过程共同描述信号的统计特性,其中一个是隐蔽的(不可观测的)具有有限状态的markor链,另一个是与markor链的每一状态相关联的观察矢量的随机过程(可观测的)。隐蔽markor链的特征要靠可观测到的信号特征揭示。这样,语音等时变信号某一段的特征就由对应状态观察符号的随机过程描述,而信号随时间的变化由隐蔽markor链的转移概率描述。模型参数包括hmm拓扑结构、状态转移概率及描述观察符号统计特性的一组随机函数。按照随机函数的特点,hmm模型可分为离散隐马尔可夫模型(采用离散概率密度函数,简称dhmm)和连续隐马尔可夫模型(采用连续概率密度函数,简称chmm)以及半连续隐马尔可夫模型(schmm,集dhmm和chmm特点)。一般来讲,在训练数据足够的,chmm优于dhmm和schmm。hmm模型的训练和识别都已研究出有效的算法,并不断被完善,以增强hmm模型的鲁棒性。

人工神经元 网络 在语音识别中的应用是现在研究的又一热点。ann本质上是一个自适应非线性动力学系统,模拟了人类神经元活动的原理,具有自学、联想、对比、推理和概括能力。这些能力是hmm模型不具备的,但ann又不个有hmm模型的动态时间归正性能。因此,现在已有人研究如何把二者的优点有机结合起来,从而提高整个模型的鲁棒性。 二、语音识别的困难与对策

目前,语音识别方面的困难主要表现在:

(一)语音识别系统的适应性差,主要体现在对环境依赖性强,即在某种环境下采集到的语音训练系统只能在这种环境下应用,否则系统性能将急剧下降;另外一个问题是对用户的错误输入不能正确响应,使用不方便。

(二)高噪声环境下语音识别进展困难,因为此时人的发音变化很大,像声音变高,语速变慢,音调及共振峰变化等等,这就是所谓lombard效应,必须寻找新的信号分析处理方法。

(三)语言学、生 理学 、心理学方面的研究成果已有不少,但如何把这些知识量化、建模并用于语音识别,还需研究。而语言模型、语法及词法模型在中、大词汇量连续语音识别中是非常重要的。

(四)我们对人类的听觉理解、知识积累和学习机制以及大脑神经系统的控制机理等分面的认识还很不清楚;其次,把这方面的现有成果用于语音识别,还有一个艰难的过程。

(五)语音识别系统从实验室演示系统到商品的转化过程中还有许多具体问题需要解决,识别速度、拒识问题以及关键词(句)检测技术等等技术细节要解决。

三、语音识别技术的前景和应用

语音识别技术 发展 到今天,特别是中小词汇量非特定人语音识别系统识别精度已经大于98%,对特定人语音识别系统的识别精度就更高。这些技术已经能够满足通常应用的要求。由于大规模集成电路技术的发展,这些复杂的语音识别系统也已经完全可以制成专用芯片,大量生产。在西方 经济 发达国家,大量的语音识别产品已经进入市场和服务领域。一些用户交机、电话机、手机已经包含了语音识别拨号功能,还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、 旅游 、银行信息,并且取得很好的结果。

语音识别是一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。

参考 文献 :

[1]科大讯飞语音识别技术专栏. 语音识别产业的新发展. 企业 专栏.通讯世界,2007.2:(总l12期)

[2]任天平,门茂深.语音识别技术应用的进展.科技广场.河南科技,2005.2:19-20

[3]俞铁城.科大讯飞语音识别技术专栏.语音识别的发展现状.企业专栏.通讯世界,2006.2 (总122期)

[4]陈尚勤等.近代语音识别.西安: 电子 科技大学出版社,1991

模式识别技术范文5

【关键词】语音识别 模式识别 过程 统功能

1、语音识别技术原理简介

1.1语音识别技术的概念

语音识别技术(Auto Speech Recognize,简称ASR)所要解决的问题是让计算机能够“听懂”人类的语音,将语音中包含的文字信息“提取”出来。ASR技术在“能听会说”的智能计算机系统中扮演着重要角色,相当于给计算机系统安装上“耳朵”,使其具备“能听”的功能,进而实现信息时代利用“语音”这一最自然、最便捷的手段进行人机通信和交互。

1.2语音识别的系统组成

语音识别系统构建过程整体上包括两大部分:训练和识别。

1.2.1训练

训练通常是离线完成的,对预先收集好的海量语音、语言数据库进行信号处理和知识挖掘,获取语音识别系统所需要的“声学模型”和“语言模型”。

1.2.2识别

识别过程通常是在线完成的,对用户实时的语音进行自动识别,可以分为“前端”和“后端”两大模块:“前端”模块主要的作用是进行端点检测(去除多余的静音和非说话声)、降噪、特征提取等;“后端”模块的作用是利用训练好的“声学模型”和“语言模型”对用户说话的特征向量进行统计模式识别(又称“解码”),得到其包含的文字信息,此外,后端模块还存在一个“自适应”的反馈模块,可以对用户的语音进行自学习,从而对“声学模型”和“语音模型”进行必要的“校正”,进一步提高识别的准确率。

语音识别技术所面临的问题是非常艰巨和困难的。尽管早在二十世纪五十年代,世界各国就开始了对这项技术孜孜不倦的研究,特别是最近二十年,国内外非常多的研究机构和企业都加入到语音识别技术的研究领域,投入了极大的努力,也取得了丰硕的成果,但是直到今天,距离该技术得到完美解决还存在着巨大的差距,不过这并不妨碍不断进步的语音识别系统在许多相对受限的场合下获得成功的应用。

如今,语音识别技术已经发展成为涉及声学、语言学、数字信号处理、统计模式识别等多学科技术的一项综合性技术。基于语音识别技术研发的现代语音识别系统在很多场景下获得了成功的应用,不同任务条件下所采用的技术又会有所不同。

2、语音识别系统技术实现

语音识别系统选择识别基元的要求是:有准确的定义,能得到足够数据进行训练,具有一般性。系统所需的训练数据大小与模型复杂度有关,模型设计得过于复杂以至于超出了所提供的训练数据的能力,会造成系统性能的急剧下降。

2.1听写机

2.1.1概念

大词汇量、非特定人、连续语音识别系统通常称为听写机。

2.1.2基本架构

听写机是建立在前述声学模型和语言模型基础上的HMM拓扑结构,训练时对每个基元用前向后向算法获得模型参数,识别时将基元串接成词,词间加上静音模型并引入语言模型作为词间转移概率,形成循环结构,用Viterbi算法进行解码。针对汉语易于分割的特点,先进行分割再对每一段进行解码,是用以提高效率的一个简化方法。

2.1.3对话系统

用于实现人机口语对话的系统称为对话系统。目前,受技术所限,对话系统往往是面向一个狭窄领域、词汇量有限的系统,其题材有旅游查询、订票、数据库检索等等。它的前端是一个语音识别器,识别产生的N-best候选或词候选网格,由语法分析器进行分析获取语义信息,再由对话管理器确定应答信息,由语音合成器输出。基于目前的系统往往词汇量有限的情况,也可以用提取关键词的方法来获取语义信息。

3、语音识别系统特性

语音识别系统的性能受许多因素的影响,包括不同的说话人、说话方式、环境噪音、传输信道等等。具有自适应性与鲁棒性。解决办法可大致分为两类:针对语音特征的方法(以下称特征方法)和模型调整的方法(以下称模型方法)。前者需要寻找更好的、高鲁棒性的特征参数,或是在现有的特征参数基础上,加入一些特定的处理方法。后者是利用少量的自适应语料来修正或变换原有的说话人无关(SI)模型,从而使其成为说话人自适应(SA)模型。

4、语音识别的应用

语音识别专用芯片的应用领域,主要包括以下几个方面:

4.1电话通信的语音拨号。特别是在中、高档移动电话上,现已普遍的具有语音拨号的功能。随着语音识别芯片的价格降低,普通电话上也将具备语音拨号的功能。

4.2汽车的语音控制。由于在汽车的行驶过程中,驾驶员的手必须放在方向盘上,因此在汽车上拨打电话,需要使用具有语音拨号功能的免提电话通信方式。此外,对汽车的卫星导航定位系统(GPS)的操作,汽车空调、照明以及音响等设备的操作,同样也可以由语音来方便的控制。

4.3工业控制及医疗领域。当操作人员的眼或手已经被占用的情况下,在增加控制操作时,最好的办法就是增加人与机器的语音交互界面。由语音对机器发出命令,机器用语音做出应答。

4.4个人数字助理(Personal Digital Assistant,PDA)的语音交互界面。PDA的体积很小,人机界面一直是其应用和技术的瓶颈之一。由于在PDA上使用键盘非常不便,因此,现多采用手写体识别的方法输入和查询信息。但是,这种方法仍然让用户感到很不方便。现在业界一致认为,PDA的最佳人机交互界面是以语音作为传输介质的交互方法,并且已有少量应用。随着语音识别技术的提高,可以预见,在不久的将来,语音将成为PDA主要的人机交互界面。

4.5智能玩具。通过语音识别技术,我们可以与智能娃娃对话,可以用语音对玩具发出命令,让其完成一些简单的任务,甚至可以制造具有语音锁功能的电子看门狗。智能玩具有很大的市场潜力,而其关键在于降低语音芯片的价格。

4.6家电遥控。用语音可以控制电视机、VCD、空调、电扇、窗帘的操作,而且一个遥控器就可以把家中的电器皆用语音控起来,这样,可以让令人头疼的各种电器的操作变得简单易行。

参考文献:

模式识别技术范文6

【关键词】生物支付 静脉识别 指纹识别 人脸识别

一、引言

基于生物个体独特的特征的支付模式就是“生物支付”,它原理就是将人体固有的生理器官和行为特征作为客户身份信息,再与其银行账户进行关联,支付交易时通过识别其生物特征信息来完成。生物识别技术所具有的唯一性和稳定性,作为打击欺诈和身份盗窃理想方法,将替代随身携带的智能卡或者复杂的密码,极大的提高支付的安全性和可靠性。目前,据Unisys ()网站调查统计,全球范围接近70%的消费者的支持使用生物特征识别技术支付。

二、生物支付的概况

生物识别技术本质上是一种模式识别技术,即通过提取个体的生物特征数据(如指纹、人脸、虹膜、笔迹、声音、步态等),与采集数据库中的数据进行匹配,进而鉴定个体身份的。随着生物识别技术的成熟,生物支付模式孕育而生,目前在支付领域应用最广的,当属静脉识别技术和指纹识别技术。

(一)静脉识别

静脉识别是通过手掌内的静脉分布图像来对身份信息进行识别,该技术克服了指纹识别速度慢,手指有污渍或者脱皮使得无法识别等缺点,是一种提高了识别效率比较高的活体识别技术。手指静脉技术具有多项重要特点,使它在高度安全性和使用便捷性上远胜于其它生物识别技术。2014年,国外一家公司开发了一台内置生物特征的信用卡终端PulseWallet,它可以通过内置的红外照相机拍摄用户静脉,然后与用户的信用卡进行绑定。完成配对后,用户便可以直接使用手掌扫描完成支付。目前,国外一些国家已经将基于静脉支付技术的“手掌卫士”等机具安装到取款机、门禁系统、收银台等设备上,有效提高了对客户身份识别的准确性。

(二)指纹识别

到1998年,指纹识别产品占销售总额的生物识别技术的78%。每个人的指纹的纹路图案、断点和交叉点上各不相同,呈现独一无二,即使同卵双胞胎的指纹也有所不同。每个指纹都有5到7个特征信息,至少可以产生4900个独立可测量的特征信息,这足以说明指纹识别是一个更加可靠的身份鉴别方式。另外,手指样品大小约1KB,只有触摸到指纹设备了即可提供访问认证(通常小于1秒)。如今,“指纹支付”已经付诸于实践。例如在提供指纹支付服务的交易中,消费者只需通过终端上扫描手指来确认其身份信息,并从其关联的账户中自动转账支付消费款项,从而实现无需银行卡和现金,只用手指即完成整个消费过程。日前,阿里巴巴宣布,支付宝钱包和三星公司一起推出指纹支付服务,使用三星手机和支付宝钱包的用户在进行网络购物消费时,只要用手指在指纹传感器上轻轻一按,就能实现在线支付。

(三)人脸识别

人脸识别是基于人的脸部特征信息进行身份信息识别技术。通过用摄像头采集人脸的图像信息,对检测到的人脸进行脸部模式识别,通常也叫做面部识别。面部识别的主要好处是,它是无干扰,非接触的,提供连续的认证,并且由大多数用户所接受。样本大小(例如,5个人脸样本)的范围可以从1KB-2KB。芬兰创业公司最新推出一种基于人脸识别的支付平台,用户只需面对POS机屏幕刷一次脸,5秒钟之内就可以完成整个支付。它以其唯一性和稳定性,正逐步取代存折、银行卡等传统支付工具,成为未来支付结算的主媒。

据Enterprise Networks and Servers杂志报告,全球66%消费者的青睐生物支付,因为作为打击欺诈和身份盗窃理想方法。生物支付技术兴起于互联网时代,主要的生物支付包括静脉支付、人脸支付、指纹支付、虹膜支付、声纹支付等。2014年,国际生物识别集团(IBG)撰写的一份《生物识别市场与产业报告2009~2014》报告,该报告统计了全球各种生物特征识别技术的市场份额,其中,指纹识别所占市场份额最大,为66.7%;其次是人脸识别占到11.4%;新兴识别技术如虹膜识别、语音识别、静脉识别和掌形识别分别各占市场份额的8.0%、3.0%、2.4%和1.8%。

三、生物支付模式

所有的生物支付流程具体如图1所示,其中可分为两大流程即客户注册和消费支付。

流程说明:

(一)客户

客户通过识别终端中录入银行注册中存储的身份识别码,便可轻松完成支付,消费金额在关联的银行卡账户中扣除。

(二)商户

客户支付的模式同原来的银联支付平台一样,区别在于客户不是使用银行卡交易,而是身份识别码来完成消费交易。

(三)身份识别服务器(第三方)

负责对身份识别码进行解码、比对和匹配,并将认证结果反馈给银行,银行对客户信息进行相应的交易操作。

(四)银行

对客户身份信息进行注册,通过采集器录入身份识别码,并与银行卡号码建立关联后存入到身份识别服务器中的数据库中;作为收单行进行资金和手续费的核算,向客户提供交易确定消息。

图1 生物支付流程

四、生物支付模式特点

基于生物识别的支付模式的极大优势在于安全性和便利性。就安全性而言,生物特征信息呈现独一无二特点,有利于打击现今比较猖獗的银行卡欺诈行为,有效的提高了金融支付的安全性。就便利性而言,生物识别是一种“活体识别”技术,客户购物消费时无需携带大量的信用卡和身份证,个人身份信息(银行账户、个人保险和医疗记录等)都关联到自己的DNA信息里。消费者只需简单地扫描一下个人的身体信息,就可以完成支付。相比于传统支付方式,生物支付不仅减少了消费者的等待时间,而且提升了购买体验。

目前,全球各个国家的政府、企业和消费者都积极关注生物支付技术的发展进程,但是与信用卡支付和手机支付相比,由于生物支付技术的还显稚嫩,但是,它有广阔的发展前景,或许有一天,去银行取款将无需带卡,也不需输入账户密码,只要客户的一个眼神、刷手掌即可,生物识别技术终将改变传统的金融支付模式。

五、结束语