图像识别技术的基本原理范例6篇

图像识别技术的基本原理

图像识别技术的基本原理范文1

关键词:自动报靶系统;机器视觉;图像识别;图像配准;图像增强

中图分类号:TP212.12文献标识码:A文章编号:1009-3044(2008)33-1500-02

Summary on Automatic Target-scoring System

HUANG Ming, Wang Hao-hua, LIANG Xu

(School of Software Technology, Dalian Jiaotong University, Dalian 116028, China)

Abstract: An automatic target-scoring system is proposed, which based on machine vision. CCD camera was used to observe targets’ surface continuously. According to the feature and change of the images of targets’ surface observed by CCD, the technology of computer pattern recognition was used to detect the position of real shell in the target surface. Then the position was described in digital by coding target surface.In the process of observation, the technology on enhancement and matching of gray-scale, image matching technology in geometry, and wavelet transform algorithms were used to solve the effect on the accuracy of the identification due to changes in light, wind, and other factors. In practice, the system can achieve ideal accuracy, reduce the misstatements and omissions greatly. It was also high-precision, low-cost,and reliable system, can be used in military drill and shooting competitions. It will be meaningful and have good prospect.

Key words: automatic target-scoring system; machine vision; imagine recognition; imagine matching; imagine enhancement

1 引言

在专业与非专业军事训练中,实弹射击是最基本的训练项目。传统的实弹射击采用人工报靶。传统人工报靶主要有四个方面的不足:1)依赖于报靶者的判靶经验,效率比较低。2)当靶板上弹着点多时,报靶员很难识别新旧弹孔,报靶误差极大,直接影响射击训练质量。3)射击未完全结束时,补靶员现身靶壕外或在补靶员察看靶板报靶和补靶时,射击位管理者若稍有疏忽,就易出现枪支走火,造成人员伤亡,安全隐患极大。4)容易出现弄虚作假的现象。为了克服传统人工报靶有不足和满足军事训练现代化需求,提高部队射击水平,自动报靶的研究和应用对推进军队现代化将具有普遍意义。本文介绍基于机器视觉的自动报靶系统的基本原理和关键技术,该系统使用图像识别,图像配准和图像增强等技术,在实际的训练和考核中能够发挥较好的作用,有良好的应用前景。

2 图像与图像处理的概念

图像(Image)就是采用各种观测系统获得的,能够为人类视觉系统所感觉的实体。图像的范围非常广泛,包括:各类图片(Picture),如照片、X光片;各类光学图像,如电影、电视画面;人们的有形想像以及外部描述,绘画、绘图;等等。图像处理技术可分为两大类,即模拟图像处理和数字图像处理。

图1 通用的数字图像处理系统框图

数字图像处理是指,使用数字计算机对图像进行加工与处理。传统的数字图像处理技术主要集中在图像的获取、变换、增加、恢复(还原)、压缩编码、分割与边缘提取等方面;随着计算机与信息技术的发展,图像特征分析、图像配准、图像融合、图像分类、图像识别、基于内容的图像检索与图像数字水印等领域取得进展,这些图像处理技术具有智能化功能,因而称之为智能图像处理技术。

数字图像处理方法大致可分为两大类,即空域法和变换域法。1)空域法是把图像看作是平面中各个像素组成的集合,然后直接对这个二维函数进行相应的处理。2)变换域法是首先对图像进行正交变换,得到变换域系数矩阵,然后再进行各种处理,处理后再将其反变换到空间域,得到处理结果。

3 基于机器视觉的自动报靶系统

此类产品是以计算机为图像识别和处理理论为基础,它没有在靶体上安装任何光电传感设备。在实弹射击过程中,它使用摄像头对常规的标准靶画面进行采集,根据采集来的靶图像的特点和变化,利用计算机图像识别(Image Recognition)和处理技术找出靶图像中的真实弹点,使用这种自动报靶系统就好像是使用了一个“电子眼”,它会代替报靶人员的眼睛,在整个实弹射击过程中不间断的对靶画面进行观测。对不同靶位上的每一次射击都采用相同的算法、规则和精度来判定,不存在受主观因素影响的问题。比手工报靶更客观,更公正,有较高的可用性。

实现此系统的软件核心技术主要是数字图像处理技术中的计算机图像识别、图像配准以及图像增加等技术。在观测过程中,采用图像灰度配准与增强技术以及图像的几何配准技术来解决由于光照变化、大风等干扰因素对识别精度的影响。在此过程中,还要由其他优秀算法来配合,提高性能与精度,例如小波变换等。

3.1 基于机器视觉的自动报靶系统的实现原理

机器视觉的概念是利用CCD摄像机等设备代替人眼,结合计算机视觉、数字图像处理、和计算机控制技术实现对摄像机所摄取的图像的分析过程。

其核心原理是:在整个实弹射击的过程中,利用CCD摄像机不间断地对靶面进行观测,根据采集的靶面图像的特点和变化,利用计算机图像识别技术检测靶面图像中的真实弹点,然后通过弹点在靶面图中的位置来对着弹点区域进行编码。在观测过程中,采用图像灰度配准与增强技术以及图像的几何配准技术来解决由于光照变化、大风等干扰因素对识别精度的影响。在此过程中,还要由其他优秀算法来配合,提高性能与精度,例如小波变换等。

通过以上论述可见,本系统由图像采集设备、图形采集卡、图形处理软件、计算机及显示部分组成。具体的配置如下:购买一个CCD摄像头、一块图形采集卡、一台普通计算机及编写相应的软件,其中图形采集卡可选择大恒公司或杭州海康威视数字技术有限公司生产的。为完成本系统的功能与性能指标,主要工作集中在软件的编程与实现上。

3.2 基于机器视觉的自动报靶系统的核心技术

实现本系统的软件核心技术主要是数字图像处理技术中的计算机图像识别、图像配准以及图像增加等技术。

3.2.1 图像识别技术

图像识别是对图像进行预处理后,再经分割和描述,提取有效的特征,进而加以判决分类的图像处理技术。

一个图像识别系统可分为三个主要部分,第一部分是图像信息的获取,对图像识别来说就是把图片、底片、文字图形等用采集设备变换为电信号。第二部分是信息的特征提取,它的作用在于把调查了解到的数据材料进行加工、整理、分析、归纳以去伪存真,抽出能反映事物本质的特征。第三部分是判决,做出结论的过程,与判决的方式密切相关。

图2 图像识别系统框图

在图像识别的发展过程中,出现了四类有代表性的理论和方法。即统计图像识别方法、句法(或结构)图像识别方法、模糊图像识别方法和神经网络图像识别方法。

3.2.2 图像配准技术

图像配准是指同一目标的两幅(或两幅以上)图像在空间位置上的对准。图像配准的技术过程称为图像匹配(Image matching)或图像相关(Image correlation)。图像配准可分为半自动配准和全自动配准。

全自动配准是直接利用计算机完成图像配准工作,大致可分为基于灰度与基于特征两类。基于灰度的方法有:空间相关法、不变矩阵、频域相关法。此方法具有精度高的优点,但计算复杂度高。基于特征的方法有两个重要环节:特征提取和特征匹配。本方法与小波变换等结合,进一步提高了图像配准的精度与运算速度。

3.2.3 图像增加技术

图像增加的目的有两个:一是改善图像的视觉效果,提高图像成分的清晰度;二是使图像变的更有利于计算机处理。

图像增加的方法一般分为空间域和变换域两大类。空间域方法直接对图像像素的灰度进行处理。变换域方法在图像的某个变换域中对变换系统进行处理,然后通过逆变换获得增加图像。常用的图像增加方法有:空间域单点增加、图像平滑、图像锐化、图像滤波与图像增加。

4 总结与展望

运用数字图像处理技术的自动报靶系统,在国内、外都有相应的研究,但实际系统的功能需要与性能指标各有差异,所应用的原理和方法手段不近相同,所以可从另外方面进行开发,拓展数字图像处理的领域,满足不同系统的不同需要。

在本系统中,力求将其它优秀的算法,嫁接到图像处理中,以提高图像处理的性能与精度,在我军某坦克基地的实际应用中,达到了预期的目标。由于本系统是一室外项目,光照变化、大风等干扰因素会对识别精度造成一定影响,还需通过一些方法或算法来弥补这些不足。本系统所要研究报靶系统所采用的方法不仅有着精度高的优点,而且完全满足部队实弹射击需求,稍作改动之后还可用于运动类报靶,具有广阔的应用前景和研究价值。

参考文献:

[1] 张军,颜树华,徐琰.自动报靶系统的研究进展[J].激光与红外,2006,36(12):1152- 1154.

[2] 杨子宁.光电自动报靶系统的设计与实现[J].科学技术与工程, 2007,7(1):102-104.

[3] 陈海峰.基于图像处理技术的自动报靶系统研究[D].南京航空航天大学,2005.

图像识别技术的基本原理范文2

关键词:人脸识别应用系统;技能鉴定;设计实现

中图分类号:G640 文献标志码:A 文章编号:1674-9324(2015)30-0034-02

面向职业技能鉴定系统的人脸图像识别系统研究与开发工作,解决现阶段职业技能鉴定系统实际需求的同时,也为职业资格鉴定工作日后向异地网络化考试模式发展奠定了技术基础。该系统技术可持续发展为在异地网络化考试系统中实施对考生进行身份验证并进行实时摄像头监控技术,如可以实时监控考生双眼离开采集范围超出限定时间,系统即可自动交卷,以防止在网络化考试中极易出现的替考与作弊现象,提高职业技能鉴定工作质量。同时,对社会交通压力缓解、节省布置考场等相关社会资源与费用等方面也是具有积极研究意义的。

一、人脸图像识别技术

生物特征识别技术是指通过计算机科学技术与人体固有物理和行为特征来进行身份验证的一门科学,属于模式识别类问题。主要包括两类问题[1]:一类是基于物理特征的生物识别技术,包括人脸图像识别、虹膜识别、指纹识别、DNA识别技术等;另一类是基于行为特征的生物识别技术,包括语音识别、签名、步态识别技术等。人脸图像识别就是将待识别的人脸与已知人脸进行比较,得出相似程度的相关信息。我们常说的人脸识别还可以分为确认和辩认两种情况。确认是一对一进行图像比较的过程,辨认是一对多进行图像匹配比对的过程[2]。

二、开发背景与需求分析

1.项目开发背景。近年来,随着国家经济体制结构不断变化,社会用工需求对于具有高级技术资格的高技能人才需求越来越大。职业技能培训与职业技能资格的考核与鉴定工作需求量与社会认可程度也大大增加了。职业技能培训与职业资格鉴定工作量与日俱增,得到了社会普遍认可。随着职业技能鉴定工作需求量的增加,职业技能鉴定考试中验证考生身份问题呈现出日益严重化且监考教师验证考生身份工作量不断增加的现象。在现有职业资格考试系统的基础上研发人脸图像识别系统模块,用以帮助监考教师验证考生身份,同时将职业技能鉴定工作全面推进信息化。

2.功能需求分析。在职业资格鉴定系统中应用生物特征识别技术,研制“人脸图像识别”系统模块。该系统模块可以通过人脸识别技术进行身份验证:考生进入考场后,系统首先需要通过摄像头获取到考生考试当天的人脸图像,并对采集到的人脸图像进行一系列图像处理工作,这个处理过程也称图像预处理。再同图像数据库中的图像进行比照,如果考生身份得到正确的确认,即可进入注册信息审核确认页面;否则,拒绝进入。实现智能化验证考生身份的功能,以达到辅助监考老师验证考生身份、降低监考老师监考工作量和提高职业资格考试严肃性与严谨性的目的。

3.开发环境需求分析。硬件资源:CPU要求PentiumⅣ及以上;内存要求2G及以上;视频采集卡、USB2.0接口摄像头。软件资源:开放式标准操作系统,如Windows2000,Windows XP,Windows 7等。程序设计语言处理软件。如:Visual C++、JAVA、MATLAB、SQLServer等。熟悉VC++、C++、JAVA、MATLAB、SQLServer等高级程序设计语言。

三、系统设计

1.总体设计。本课题研究属于人脸图像的确认识别。其研究内容包括四个主要部分:一是人脸检测技术,二是人脸定位技术,三是人脸表征技术,四是人脸鉴别技术。人脸图像识别模块的工作过程是:(1)获取人脸图像:通过采集设备获取输入图像,并生成其面纹编码。(2)建立人脸图像档案:通过采集人脸图像或获取照片文件上的人脸图像进行信息处理,生成特征向量。(3)人脸特征的检索与对比:将待比对的人脸图像特征向量与人脸图像档案中的人脸图像特征向量进行检索与对比。(4)输出识别结果:进行身份的确认或是身份的选择。人脸图像识别系统的工作原理为:考生首先需要在考试报名现场进行第一次照片采集,照片采集成功后,系统会自动对采集到的照片进行图像预处理操作、提取面部特征,并将提取到的特征数据存入数据库;考试当天,考生进入考场后,需要进行第二次照片采集,识别系统会将采集到的照片进行图像预处理操作、提取面部特征,得到考生考试当日采集照片的人脸面部特征值后,人脸识别系统会将两次采集到的人脸图像特征值进行对比识别。即将考试当天提取到的面部特征值与数据库中的人脸面部特征值进行对比与识别,最终得出识别结果。实现考生身份的验证与识别。

2.采集模块功能设计。人脸图像采集模块功能:负责获取人脸图像,图像可能来自与计算机连接的摄像头也可能来自人脸图像存储的数据库。将采集到的人脸图像转换为可处理的数字图像格式,进行图像信息存取。

3.图像预处理模块功能设计。图像预处理操作包括对图像进行多种图像处理操作,以使图像本身具有的特征能够更加明显地在图像中表现出来。目的是为后面的人脸特征提取模块提供基础操作处理。本项目中,需在图像预处理模块中进行的图像处理操作有:灰度均衡化、图像二值化和边缘检测等技术操作。

4.人脸特征提取模块功能设计。该模块的工作原理是对获取到的人脸图像进行特征提取,主要包括人脸检测及定位、图像标准化、特征提取三个子功能。

5.人脸图像判定模块功能设计。该模块工作原理是通过模式识别中的分类决策把识别对象归为一类。即确定某一个差别规则,进行检测对比,最后输出识别的结果。本系统中的具体操作即需要将数据库中人脸图像与对应考生现场采集到的人脸图像特征信息进行对比,并得出对比值。再进一步对该对比结果值进一步分析,如果其范围在我们所确认的范围内,我们就认为现场采集图像的考生与注册日人像图像的采集人为同一人,即身份确认通过。否则,则拒绝考生进入答题系统。

四、系统功能实现

人脸图像识别系统功能实现共分为人脸图像采集模块、图像预处理模块、人脸特征提取模块、人脸图像识别模块四个子模块的功能实现。人脸特征提取的效果的好坏对识别准确率效果有重大的影响。本系统采用的特征提取方法是PCA特征提取方法。本系统中人脸图像识别功能的分类决策问题可以分解为两大核心任务问题:SVM分类器识别过程与最近邻分类器识别过程。

1.PCA经典主成分分析。主成分分析算法是一种经典的统计方法,这种线性变化被广泛地应用在数据和分析中,是用来描述和表征细微差异的有力工具。在语音和图像信号处理时,经常会遇到高维的向量空间的数据处理问题,而这些高维数据往往存在较大程度的相关冗余,所以希望从高维空间的数据中找出具有代表性的低维子空间,从而对数据更容易地进行分析和处理。本系统功能实现方法为:首先把待检图像转换成特征脸,作为最初训练图像集的基本组件。利用PCA方法进入处理:在通过操作得到特征脸空间后将待检测图像的线性变换特征投影到该子空间中,最后是将得到的结果与投影后的训练图像相比较,最终得出识别结果。

2.特征脸法。该方法将人脸看作一个二维的灰度变化的模板,这样就可以将人脸图像看成只是一个高维图像空间中很小的一部分。然后利用人脸图像由高维空间通过低维空间进行表征这一工作原理得到一个经过优化的人脸图像坐标系统。

3.SVM分类器识别。假设识别样本有x类,记为S1,S2,…,Sx。则首先需要设计正样本训练器,如本操作中根据题意需设计x个SVM分类器;然后进行负样本训练器的设计,本操作根据题意设为其所有样本Sj(j1)个。接下来将每个测试样本输入到x个分类器中,计算样本与这p个分类器所代表的各个训练样本之间的距离。在输出结果中,如果只有值为正1,我们就可判定出该样本的类别了。如果有多于一个的分类器输出结果为正1,那么后面就需要用最近邻分类技术了。

4.最近邻分类器识别。一幅N*N像素的图像可以看成是由这幅图像的像素空间中的所有点组成的,图像就可以看作是由N2个像素点组成。具体的操作就是通过把图像投影相应的矢量空间后,利用投影间的各种距离值来对图像的相似度以进行判定。如果两点间距离最短,我们就会认为它们可能属于同一子类中。但对于本操作系统,仅有这些信息是远远不够的,除了需要判定待检测的人脸图像在人脸库中,还需要确定这个人就是某个人,也就是说接下来还要继续进行相似度的再判断。一般我们采用计算特征向量的余弦夹角的方法来进行相似度的判断。

五、测试与结论

在人脸图像识别功能测试中,使用SVM分类器结合最近邻分类器识别人脸图像进行测试。测试时,以一个考场30人为例,即需要一个30个人共150张人脸图像库作为测试用库。在待检测图像经过图像格式转化与一系列预处理操作与特征提取处理操作后,将处理后的数据信息进行保存后,即可调取图像库中的平均图像特征值与图像特征值数据信息进行对比识别了。测试中,每个测试者都可采用多个训练样本与多个对应的测试样本。对于考生在采集图像时经常会出现的面部表情微变及面部采集角度有一定偏离的情况,测试的处理操作是相同的,经过与图像库图像的对比识别发现当方差相似度阐值θ为0.8时会有比较理想的识别效果。测试正确识别率高于90%,足以证明该方法的有效性及实用性。

参考文献:

图像识别技术的基本原理范文3

    【论文摘 要】全息技术是物理学中的重大发现,近年来在各个行业得到广泛的应用。作为全息技术中的两个重要部分——CCD和计算机图像处理技术,在推动数字全息新一轮发展中起到至关重要的作用。本文将着重从计算机应用方面阐述图像处理技术在全息中的应用。

    全息技术是物理学中一重要发现,越来越多的应用于各个行业。伴随着CCD技术和计算机技术的发展,全息技术也得到一次质的飞跃,从传统光学全息到数字全息。传统光学全息将物光和参考光干涉得到全息照片来记录光的振幅和相位信息,而数字全息则用CCD记录物光和参考光的干涉,形成数字全息图,再通过计算机图像处理技术处理全息图。因此,影响数字全息技术发展有两个重要方面:CCD技术和计算机图像处理技术。

    1.图像处理技术。图像是现代社会人们获取信息的一个主要手段。人们用各种观测系统以不同的形式和手段获得图像,以拓展其认识的范围。图像以各种形式出现,可视的、不可视的,抽象的、实际的,计算机可以处理的和不适合计算机处理的。但究其本质来说,图像主要分为两大类:一类是模拟图像,包括光学图像、照相图像、电视图像等。它的处理速度快,但精度和灵活性差。另一类是数字图像。它是将连续的模拟图像离散化后处理变成为计算机能够辨识的点阵图像。从数字上看,数字图像就是被量化的二维采样数组。它是计算机技术发展的产物,具有精度高、处理方便和重复性好等特点。

    图像处理就是将图像转化为一个数字矩阵存放在计算机中,并采用一定的算法对其进行处理。图像处理的基础是数学,最主要任务就是各种算法的设计和实现。目前,图像处理技术已经在很多方面有着广泛的应用。如通讯技术、遥感技术、生物医学、工业生产、计算机科学等等。根据应用领域的不同要求,可以将图像处理技术划分为许多分支,其中比较重要的分支有:①图像数字化:通过采样和量化将模拟图像变成便于计算机处理的数字形式。③图像的增强和复原:主要目的是增强图像中的有用信息,削弱干扰和噪声,使图像清晰或将转化为更适合分析的形式。③图像编码:在满足一定的保真条件下,对图像进行编码处理,达到压缩图像信息量,简化图像的目的。以便于存储和传输。④图像重建:主要是利用采集的数据来重建出图像。图像重建的主要算法有代数法、傅立叶反投影法和使用广泛的卷积反投影法等。⑤模式识别:识别是图像处理的主要目的。如:指纹鉴别、人脸识别等是模式识别的内容。当今的模式识别方法通常有三种:统计识别法、句法结构模式识别法和模糊识别法。⑥计算机图形学:用计算机将实际上不存在的,只是概念上所表示的物体进行图像处理和显现出来。

    2.计算机图像处理技术在全息学中的应用。图像处理技术在全息中的应用主要表现在:一是计算全息,基于计算机图形学将计算机技术与光全息技术结合起来,通过计算机模拟、计算、处理,制作出全息图。因此它可以记录物理上不存在的实物。二是利用图像的增强和复原,图像编码技术等对数字全息图像质进行提高以及实现的各种算法。它的应用大致可以分为两大类,即空域法和频域法:①空域法:这种方法是把图像看作是平面中各个像素组成的集合,然后直接对这一二维函数进行相应的处理。空域处理法主要有下面两大类:一是领域处理法。其中包括梯度运算(Gradient Algorithm),拉普拉斯算子运算(Laplacian Operator) ,平滑算子运算(Smoothing Operator)和卷积运算(Convolution Algorithm)。二是点处理法。包括灰度处理 (grey processing),面积、周长、体积、重心运算等等。②频域法:数字图像处理的频域处理方法是首先对图像进行正交变换,得到变换频域系列阵列,然后再施行各种处理,处理后再反变换到空间域,得到处理结果。这类处包括:滤波、数据压缩、特征提取等处理。

    3.模拟实验。本文运用matlab软件,利用图像处理技术,编写了程序,以模拟计算全息和实现全息图像的滤波。

    本文将运用matlab程序设计语言实现计算全息的制作、再现过程。标有“涉”一字,图像尺寸为1024像素×1024像素;。模拟实验中用到的参数为:激光模拟了氦氖激光器,波长为638.2nm;再现距离为40cm;因为原始物图的尺寸用像素为单位表示,所以像素分辨率为1。

    从模拟实验中可以看出,数字全息的处理过程其实就是计算机图像处理在全息技术的应用过程。利用计算机图像处理技术对全息图进行了记录,将物光和参考光干涉得到了全息图。并利用图像的增强和复原对图像进行了处理,以消除噪声,得到更好的全息再现象。

    参考文献:

    [1]周灿林,亢一澜.数字全息干涉法用于变形测量.光子学报,2004,13(2):171-173。

    [2]刘诚,李银柱,李良钰等.数字全息测量技术中消除零级衍射像的方法[J].中国激光,2001,A28(11):1024-1026。

图像识别技术的基本原理范文4

关键词: 教学内容; 教学方法; 考核方式; 实践教学

中图分类号:TP399 文献标志码:A 文章编号:1006-8228(2014)10-76-02

Discussion and practice on "image processing technology"

Zhang Yongmei, Ma Li, He Li

(School of Information Engineering, North China University of Technology, Beijing 100144, China)

Abstract: The disadvantages, the characteristics and the content of the current teaching for "Image Processing Technology" are analyzed. Four teaching procedures including the selection of textbooks and expansion materials for initiative learning, application of modern teaching models and methods, strengthening teaching practice and reforming appraisal methods have been discussed and practiced. The result shows that it has obtained better teaching effects, improved the students' interest in learning and motivation to participate in scientific research, as well as the ability to solve practical problems.

Key words: teaching content; teaching method; assessment way; teaching practice

0 引言

图像信息是获取信息的重要来源,图像处理研究对于科学理论研究和工程应用有重要影响。研究图像处理和通信是导向智能计算机、智能机器人或多媒体通信系统的必由之路。现有的图像处理技术在很多方面给人们生活、学习、工作带来极大的便利,如:视频广播、遥感图像、医学图像(计算机X射线断层扫描技术CT,以及核磁共振成像MRI)等,计算机的发展使处理更复杂的图像成为可能。

图像处理是计算机应用领域中的一个重要方面,是模式识别、计算机视觉、图像通讯、多媒体技术等学科的基础,是一门涉及多领域的交叉学科。在图像处理技术课程的教学中,不但要让学生掌握其基本概念和原理,还要让不同层次的学生能够理解和掌握图像处理在其应用领域的最新发展,故传统的常规教学已经不能满足课程的发展要求。目前的教学不足之处主要体现在:传统的图像处理技术教学大多数偏重于理论,缺乏图像处理技术与实践相结合的环节。本文结合计算机学科的特点和多年的教学经验,对图像处理技术课程的教学模式与实践进行了探讨。

1 课程特点和教学内容分析

人类通过眼、耳、鼻、舌、身接受信息,感知世界。约有75%的信息是通过视觉系统获取的。图像处理是利用计算机处理所获取视觉信息的技术[1]。图像处理技术的理论基础涉及了众多学科,包括数学、物理、信号处理和计算机科学等多个学科的知识,其内容广泛,理论抽象,不易理解。图像处理技术还有很强的实用性,因此理论和实践的结合是本课程的关键,注重基础理论和技术的教学,以及加强学生实践能力和课题研究能力的培养是本课程的主要教学目的。

图像处理技术已经成为众多高校的一门重要课程,该课程主要介绍图像的数学描述、图像的数字化、图像变换、图像增强、图像恢复、图像编码、图像重建、图像分割与边缘提取、图像的分析和识别等基本的图像处理方法,使学生能熟练地掌握图像处理的基本过程,并能应用这些基本方法开发图像处理系统。通过这样的内容设置,使学生能够真正掌握图像处理技术的基本思想和技术,为深入学习打下坚实基础[2]。

2 教学环节的探讨和实践

2.1 教材的选用和自主学习扩充性资料的选用

图像处理技术发展日新月异,虽然该课程已经有很多可选教材,但大部分教材内容比较陈旧,许多新的算法,新的思想都没有提到,学生无法从这些教材中获取图像处理最新的技术和发展趋势,因此我们选择了章毓晋编著、清华大学出版社的《图像工程》系列教材。该教材全面介绍了图像工程的第一层次――图像处理,图像工程的第二层次――图像分析,图像工程的第三层次――图像理解的基本概念、基本原理、典型方法、实用技术以及国际上相关研究的最新成果。同时我们要求学生将国外的经典图像处理的书籍作为参考书目,如:Rafael C Gonzalez主编的《Digital Image Processing》,并建议学生关注图像处理的一些重要期刊和国际会议,如:IEEE Transactions on Medical Imaging、IEEE Transactions on Pattern Analysis and Machine Intelligence、IEEE International Conference on Image Processing、电子学报、CT理论与应用研究、模式识别与人工智能等。这样学生能熟悉一些专业术语,了解最新的前沿动态,并具备一定的英文文献阅读能力,为今后的科研和工作打下了坚实基础。

要求学生自主学习一些最新方法和技术,例如,深入分析中华人民共和国设计制造的玉兔号月球车的结构,给出玉兔号月球车如何通过全景相机、测月雷达、粒子激发X射线谱仪、红外光谱仪等仪器,对月表进行三维光学成像、红外光谱分析,开展月壤厚度和结构科学探测,对月表物质主要元素进行现场分析等探测的原理和方法。又例如,探讨将遥感图像应用于5.12汶川大地震的方法,2008年5月14日上午,中国科学院的两架高性能遥感飞机飞赴汶川,对地震灾区开展遥感监测和灾情评估工作,这两架飞机可分别提供高分辨率光学和雷达图像,具有全天候快速获取大面积灾情数据的能力,探讨如何根据汶川地震前、后图像,给出建筑物、河流、山体等关键区域的变化检测结果,为国务院和相关部门的抗震救灾工作提供咨询服务和决策依据。

2.2 采用现代化教学模式与方法

为了使复杂的算法和抽象的知识更加形象化,便于学生理解和提高学习兴趣,我们充分运用现代电子技术、工具和方法,采用多媒体形式进行课堂教学,利用VC、MATLAB编写一些典型的图像处理程序,并在课堂上演示这些程序,增加了课堂的信息量,提高了学生的学习兴趣,激发了学生自主学习,同时也为实验环节的开展奠定了一定的编程基础[3]。

此外,我们深入分析MOOCs、SPOCs以及“翻转课堂”教学模式等国际流行教育新概念,尝试开展图像处理技术的MOOCs,包括从课堂教学、学生学习进程、学生的学习体验、师生互动过程等教与学过程的完整系统在线实现。MOOCs是一个改变学习方式的时代产物,受到全球各地的重视。国内教育部三个教指委(计算机类专业、软件工程专业、计算机课程)2013年底专门召开会议研讨MOOCs。我们建立了校内MOOCs平台并对学生开放,将其作为课堂外学习的有效补充,这样可以方便学生随时随地学习,或者进行预习和复习。我们尝试了结合图像处理技术的MOOCs,探索创新教学模式与方法,稳步提高教学质量。

2.3 加强实践教学

图像处理技术可以广泛应用于数字电视、视频通话、宇宙探测、自然灾害预测、环境污染的监测、气象云图等应用领域,而教材一般只涉及到理论知识和算法,或者是对应用的简单介绍,对其设计实现介绍得很少,所以必须加强实践教学,将理论与实践结合起来,使理论指导实践,实践加强理论[4-5]。要求学生利用VC或者MATLAB进行实际程序设计,培养学生分析问题、解决问题的能力,具备图像处理系统的开发能力。

根据课程的教学要求设置了四个课外实验。①图像变换实验。要求对输入的图像,分别采用傅里叶变换、离散余弦变换、小波变换进行图像变换,分别给出变换前后的图像,并分析图像变换前后的视觉效果。②图像增强实验。将给定的图像进行增强处理,要求至少使用线性变换增强、对数变换增强、指数变换增强以及伪彩色增强处理,分析增强后的视觉效果。③图像编码实验。将给定的图像进行压缩处理,要求采用 Huffman编码方法,并计算压缩比。分析图像压缩后的视觉效果,并对图像压缩效果进行客观评价。④图像分割与边缘提取实验。分别利用边缘检测法、阈值分割法进行图像分割;分析图像分割后的视觉效果。学生完成所有实验后,我们安排了实验指导课,解决学生在实验中遇到的问题,进一步提高学生的算法设计能力和编程能力。

在课程教学中,我们还安排了三次专题讨论课,由教师指定具体题目,学生通过查阅相关文献,深入分析基本原理和方法,设计相应的算法,编程实现,并给出实验结果及分析,充分调动学生学习的积极性,提高学生利用理论知识解决实际问题的能力。三次专题讨论课分别是:

⑴ 数字图像表示及其处理专题讨论课。题目为:用VC或者Matlab实现常见图像文件格式的显示;常见的图像文件格式,以及用VC或者Matlab实现图像格式转换;给出国内外先进的图像处理系统软、硬件,名称、作用,以及先进性的体现。

⑵ 图像变换专题讨论课。题目为:给出小波变换常用的小波基的基本原理、具体应用,以及用VC或者Matlab的具体实现;给出小波变换、脊波变换、子波变换的基本原理、具体应用,用VC或者Matlab的具体实现;给出小波变换以及小波变换在图像处理中的具体应用,以及用VC或者Matlab的具体实现;给出快速傅里叶变换算法的具体内容,以及时间复杂度或者运行时间的分析。

⑶ 图像编码专题讨论课。题目为:给出小波变换图像编码的基本思想与特点,编码中需要解决的问题,实验结果及分析;给出基于感兴趣区域的小波图像编码方法的基本思想,具体步骤,实验结果及分析;给出几种图像编码质量评价方法,具体实现,实验结果及分析;给出基于子波变换的图像编码基本思想与特点,具体步骤,实验结果及分析。

此外,鼓励学生积极参与本校教师主持的科研项目,如国家自然科学基金、863项目、科技支撑计划,以及北京市自然科学基金等项目。这些项目涉及到视音频检索、视音频理解、视音频处理、网络信息分析、文字处理、信息检索、网络行为分析、图像识别等研究方向。通过参与项目,系统地锻炼了学生的科研能力和思维创新能力,也为今后的科研工作打下了坚实基础。

2.4 改革考核评价方式

考核是对学生学习成果的检验,考核目标不仅要检验学生对课堂教学内容的掌握程度,而且要对提高学生发现问题、思考问题、解决问题的能力起到作用。为了避免出现平时不努力,考前突击的情况,我们对传统的考核方式进行了改革。本课程的考核由两部分组成:平时成绩(占30%)和期末考试成绩(70%)。将平时的上课出勤、作业、实验和专题讨论成绩列入平时成绩。在整个教学过程中,严格要求学生,使学生重视教学的各个环节。

3 结束语

随着信息技术的不断发展和完善,图像处理技术也越来越多地运用在各个领域,因此图像处理技术的课程教学也应该不断发展。本文对图像处理技术课程的教学内容、教材选择、教学方法和考核方式进行了探讨,提高了学生学习的兴趣和参与科研的积极性,以及解决实际问题的能力,为学生学习图像处理新方法奠定了理论基础,为他们进一步开展相关方向的研究和应用打下了良好基础。今后将进一步研究图像处理技术的教学方法,并将理论与实践紧密联系起来。

参考文献:

[1] 章毓晋.图像工程(上册):图像处理(第3版)[M].清华大学出版社,

2012.

[2] 黄朝兵,杨杰.图像处理课程教学体系的探索与实践[J].电气电子教

学学报,2012.34(2):17-19

[3] 李向群,王书文.《数字图像处理课程》的教学改革[J].微计算机信息,

2010.26(3):212-214

[4] 陈青.“数字图像处理”教学中思维能力培养的实践[J].上海理工大学

学报(社会科学版),2013.35(4):356-359

图像识别技术的基本原理范文5

关键词:模式识别 图像分割 识别方法 特征提取

中图分类号:TP391 文献标识码:A 文章编号:1674-098X(2014)07(a)-0228-01

1 图像分割

作为一种图像技术,图像分割得到了人们广泛的研究与重视,并在实践中也得到应用。在图像应用中,图像分割技术可以在需要进行图像目标提取的工作中发挥重要的作用。如生物医学图像分析、遥感图像分析、文档图像处理、生产过程控制、在线产品检验以及工业自动化中都应用了图像分割技术。应用领域的不同也让图像分割技术具有着不同的名称,如目标追踪技术、目标识别技术、阀值化技术、目标轮廓技术等,这些技术的核心或者本身等同于图像分割技术。图像分割是将某个图像分为具有自身特色的几个区域,并对感兴趣区域提取的过程与技术。这里所提出的特色包括像素的纹理、颜色、灰度等,目标经过预先定义后可以指向单个区域,也可以指向多个区域。由于在研究图像和应用图像的过程中,往往只是对图像的某个部分感兴趣,所以为了对这些部分进行分析与辨识,有必要将他们提取和分离出来,并对他们进行利用,由此可见,图像分割是对图像进行处理以及分析的重要步骤。图像分割的方法多年来一直得到了人们的重视,基于多样化的分割算法基础上,将图像进行分割与分类的方法也非常多,比较通用的分类是根据图像中相邻像素在像素值方面表现出的两个性质:相似性与不连续性。虽然区域内部中的像素都具有相似性,但是不同区域边界上却具有着不连续性,因此,分割算法可以以此为依据分为基于边界的算法和基于区域的算法两种,另外,以分割过程中所使用的处理方法的差异,分割算法可以分为串行算法与并行算法。

2 模式识别理论基础上的图像分割

一般而言,模式识别需要由设计与实现两个过程来组成,设计指的是使用样本开展分类器设计,实现指的是使用设计完成的分类器来对待识别的样本开展分类决策。随着模式识别理论以及技术的发展,模式识别方法也得到了一定程度地创新,当前的模式识别方法主要包括统计模式识别方法;以句法规则结构化模式为依据的模式识别方法以及神经元网络模式识别方法。

图像分割所具有的难点在于分割依据的确定,即难以根据具有确定性的判定标准来对需要分割的图像各个部分开展判断以确定分割对象的位置,因此,基于知识的多特征多级判别的变化域分割概念被提出。在这一概念中,需要对特征进行分析,确定分割对象之间最明显的区分特征来作为分割依据,随后可以根据特征标准来使用经典的图像分割技术分割特征空间并得到可靠的位置结构。同时以分割精确度的差异为依据,开展多特征多级的分割,即在进行特征抽取后以具体需求为依据再次开展特征抽取或者开展多次的特征抽取,每一个提取过程中所使用的特征依据都需要达到减少分析区域的效果,并在此基础上对分割范围进行进一步的确定。具体而言,基于模式识别理论对分割问题作出考虑,分割对象可以根据图像本身的结构特性和统计特性分为分割类与非分割类。每一种事物都具有某些特征来与其他事物进行区分,所以在图像分割过程中也必然能够提取出一些和分割背景具有差异的特征来当做分割依据。在对定位对象进行分割的过程中,可以选择由这些特征所构成的特征空间来开展定位识别,所以本文认为,可以将图像分割的对象当做模式识别对象,把图像分割过程当做模式识别中识别特定模式类并以特征模式类特征为依据来进行分割的过程。

基于模式识别理论的图像分割主要分为四个步骤。

一是对分割对象本身所具有的所有特性做出分析,为分割需要提供依据。在图像分割过程中,选取这些特征的原则为更好、更容易的区分分割对象。在此方面又包括以下几点内容:可靠性,属于同类对象的特征应当相似。区别性,属于不同类别的识别对象所具有的特征值应当存在差异。独立性,在分割过程中所使用的特征应当不存在紧密关联。虽然十分相似的特征可以进行组合,但是不能当做相同的特征。对数量进行控制。特征个数的增加会增大模式识别系统在进行图像分割过程中的复杂程度,其中用于结构测试的样本数量会随着特征量的增加呈现出指数关系的增长。在模式识别理论基础上的图像分割工作中,一般需要开展大量的实验、计算与分析才能够充分了解分割对象所具有的特性,同时需要在具体的图像分割过程中寻找能够区别于复杂背景且稳定、有效的特征来当做图像分割的依据。

二是通过特征空间转换将图像转换成为确定特征基础上的特征空间。在此过程中变换域方法、神经网络方法以及模糊理论等方法都可以作为变换方法。这主要是由于图像分割过程中的复杂背景会产生很多的不确定性因素,并对特征的确定产生干扰,所以在开展图像分割之前,有必要采用数学方法和一些其他的学科理论来变换图像,其目的主要在于让特征这一作为图像分割的依据更加突出。

三是根据已经明确的特征范围和特征标准,采用合理的分割技术来分割特征空间,同时以分割对象的特征标准度范围和标准度量值为依据来匹配图像中的各个区域以确定需要进行分割的区域。另外在分割图像的过程中,最底层环节为图像处理技术,分割中的工作都需要建立在图像处理技术基础上。

四是当分割精度没有达到需求和要求时,有必要进一步开展特征选择,即对以上三个部分进行重复。

综上所述,模式识别理论对于提高图像分割效果而言发挥着重要作用。无论是模式识别理论还是图像分割作为一种具有先进性和现代化特点的技术都具有着良好的应用前景,但是在此过程中,需要认识到二者的发展以及应用价值的提升都需要二者本身做出不断的完善。单从模式识别理论在图像分割中的应用于完善方面来看,首先需要对单识别器的性能进行进一步的提高;其次有必要继续强化对多分类器集成方法的谈论与研究。这对于增加模式识别理论在图像分割方面的应用价值具有重要意义。

参考文献

[1] 靳富丽.模式识别理论及其应用[J].湖北广播电视大学学报,2007(12).

[2] 曾庆鹏,吴水秀,王明文.模式识别中的特征提取研究[J].微计算机信息,2008(1).

[3] 林晓霞,杨晓东.二值图像的模式识别方式[J].福建电脑,2005(6).

图像识别技术的基本原理范文6

关键词:内容过滤;网络监控技术

1 引言

进入新的世纪,网络化和信息化不断地改变着我们这个时代,也深刻地影响着我们的生活。信息化发展到现在,它的触角已经伸向了各个领域。网络信息资源的共享规模不断扩大,互联网已经成为了全球最重要的信息交流载体和主要的交流方式,网络信息安全问题也越来越突出。一般的网络都是安装了网络防火墙等保障网络信息安全的设施,但是这些安全措施不能够检查关于信息内容问题,因此基于内容过滤的网络监控技术就显得非常重要,这对网络的建设和发展将会产生重大的影响。

2 基于内容过滤的网络监控技术介绍

过滤的几个基本的步骤对于任何过滤技术都是相同的:首先要知道想要过滤掉什么内容,然后用不同的方法对比要过滤的内容和监控内容,最后把与要过滤内容相同的部分过滤掉。第一步中的过滤内容由人为设定。其中最难实现的是第二步。首先是获取要监控的信息,目前最新的基于内容的网络监控系统DFNMS的架构如图1,其中的七个模块分别对应七种不同形式的信息。它的原理是:首先,伪造一个虚拟服务器,截获信息并向发送者反馈信息发送成功的提示,然后对信息进行比对分析,把不合格的信息过滤掉,把合格的信息发送到目的地以达到过滤的效果。其次是信息的比对和分析。随着互联网的发展,网络中出现了大量良莠不齐的内容,这些内容形式多样,再加上汉语表达博大精深的特点,使得要判断监测内容是否是要过滤掉的不良信息非常困难[1]。而且,网络信息数量庞大,这就要就过滤技术既能准确的识别出要过滤的信息,又能快速高效地完成这个过程。识别不良信息的方法也是各种过滤技术的区别所在。目前国内外的过滤技术主要有四种:基于因特网内容分级平台过滤(PICS)、数据库过滤、关键字过滤以及基于内容理解的过滤。

3 文本内容理解的过滤技术

文本内容的过滤技术主要是在关键字词检索方法的基础上,通过各种语言处理的方法以及数据分析技术通过对文章的内容及语境等要素理解文本的内容,然后发现目标信息的过滤技术。例如我们检查的文本中有“枪支”这个词汇,如果不对其文本的结构和语境就将它过滤掉,就会错误地过滤掉军事理论教材或者军事科普知识等信息。所以文本内容理解的过滤技术在基于内容过滤的网络监控中得到广泛运用[2]。

3.1 文本内容的预处理

文本内容的预处理主要是将信息源中无关的文本剔除,保留和敏感词汇有关联的文本部分,并按照一定的量化指标对文本信息的特征描述字词进行量化分析,然后将对文本具有识别性特征的信息提取出来。这些具有识别性特征的信息能够对需要过滤的文本内容进行有效表达。

3.2 文本内容的匹配算法

文本内容的匹配算法影响着对信息进行过滤的速度,一般情况下它由匹配算法模型来决定。目前在实际操作中常用到的理论模型有向量空间模型和贝叶斯决策模型。向量空间决策模型是将文档用它的特征识别项按照所占的权重来分析的一个高维向量表示,在对文本的过滤分析中就可以运用向量的计算原则,可以极大地降低了工作的复杂性。但是该方法也有缺点,因为在对文本特征识别项的权重确定方面很难做到精确,所以对文章的计算量较大。而贝叶斯决策模型是依托贝叶斯理论而建立的。在文档识别的时候,它首先是对文档的所属类别进行分类。文章分类的概率等于有识别性特征的信息所属概率的综合表达,最后根据总和概率的计算选出概率最大的类别文档作为需要过滤的内容。

4 图像内容分析的过滤技术

所谓图像内容分析过滤技术是指,基于图像所显现的色彩、纹理、形状以及图像内容的空间关系等显性特征作为索引,利用图像的这些外观特征的相似度和匹配程度进行过滤的技术。图像内容分析过滤技术还被广泛地应用其他图像特征和语义特征的图像内容进行判定。目前为止,图像内容分析过滤技术的最主要研究手段就是机器学习,从丰富而复杂的图像信息中找到规律性的特征,然而,很多时候计算机无法从海量的图片信息和千变万化的图像中准确地识别需要过滤的图像,尤其是在全局视觉内容不能很好地表现图像语义的时候,计算机对图像的区分就显得比较困难。影响这项技术发展的因素主要有图像的内容过于丰富或者图像处理复杂,要解决这样的问题,还需要从以下几个方面努力[3],首先,是叙述问题的数学建模;其次,是叙述语义特征和图像内容;然后是规律和标准的建立;最后是图像相似度的标准以及索引的技术。随着最近几年来科学知识和计算机技术的高速发展,很多技术都得到了相应的进步,图像内容分析过滤技术也同样获得了可喜的进展。

[参考文献]

[1]彭昱忠,元昌安,王艳,等.基于内容理解的不良信息过滤技术研究[J].计算机应用研究,2009(02):33-36.