计算机立体视觉技术范例6篇

计算机立体视觉技术

计算机立体视觉技术范文1

[关键词]计算机视觉;视觉框架;三维表示

中图分类号:TP338.6 文献标识码:A 文章编号:1009-914X(2015)47-0112-01

1 计算机数字视觉技术研究的地位

长期以来,人类持续不断地试图从多个角度去了解生物视觉和神经系统的奥秘,这些努力的阶段性理论研究成果已经在人们的生产生活中发挥了不可估量的作用。计算机视觉(CV)研究的主要内容是通过计算机分析景物的二维图像,从中获得三维世界的结构和属性等信息,进而完成诸如在复杂的环境中识别和导航等任务。计算机视觉研究的重要性是不言而喻的,会产生深远的经济和科学的影响。

20世纪下半叶以来,很多研究者都曾试图通过视觉传感器和计算机软硬件模拟出人类对三维世界图像的采集、处理、分析和学习能力,以便使计算机和机器人系统具有智能化的视觉功能。今天,数字图像相关的软硬件技术在人们生活中的广泛使用,数字图像已经成为当代社会信息来源的重要构成因素,各种图像处理与分析的需求和应用也不断促使数字视觉技术的革新。数字视觉技术的应用十分广泛,如数字图像检索管理、医学影像分析、智能安检、人机交互等。

数字视觉技术是人工智能技术的重要组成部分,也是当今计算机科学研究的前沿领域,经过近年的不断发展。已逐步形成一套以数字信号处理技术、计算机图形图像、信息论和语义学相互结合的综合性技术,并具有较强的边缘性和学科交叉性。

2 计算机数字视觉技术研究的核心问题

视觉问题复杂性的本质在于相对声音等物理信号的描述,视觉信号充满了非常丰富的信息,描述起来也更加困难。如何攻克图像信息提取过程中的各种难题一直是当今计算机图像学研究的热点问题,而且在科学家们还未完全破译生物视觉系统的奥秘的前提下,大多数问题只能采用逆向推导机制,依据已知或假设的关联将视觉系统的输入数字图像和输出语义描述对应起来。基于概率论和数理统计的数学模型是最适合解决这类逆推问题的工具,这也是目前领域普遍采用各种统计模型和机器学习算法的本质原因。

物体的三维表示是计算机视觉研究的一个关键问题。八元树(octree)表示法是一种紧凑、简洁的物体三维表示法,近年来这种表示法被广泛地应用到计算机视觉的研究领域。广义八元树表示法的优点是不受视图个数的限制,通过增加观察方向可以计算出更加精确的物体三维表示。主要缺点是需要进行多次坐标变换,在计算机上实现时需要研究相应的离散技术。线性八元树(linearoctree)是较八元树更加简洁的表示形式。

3 计算机视觉技术结构及其研究基本框架

计算机视觉技术内在的逆推机制决定了其在系统开发时必须将原始图像数据与其蕴含的知识之间的语义鸿沟加以弥补,在满足特定应用需求的前提下进行合理的图像内容简化和假设,形成目前普遍使用的计算机视觉系统结构:即图像数据层、图像特征描述层及图像知识获取层。由于各种图像特征都有其优点及不足之处目前趋势是结合不同种类的特征对图像内容进行综合表述,以建立较为可靠的图像信息模型,比如利用时空体数据结构 对人体行为等视频内容进行描述。

计算机视觉技术的研究主要围绕着四个基本理论框架:以Marr视觉计算理论为核心的深度重建框架;以感知特征群集为主线的基于知识的视觉框架;以“感知一动作”为基础的主动视觉理论框架;以综合集成理论为指导的视觉集成框架。其中,视觉集成理论框架是计算机视觉研究中一个较新的理论框架,并越来越多地受到cv研究者的关注。视觉集成理论的研究内容大致可以分为三个方面,第一方面的研究内容是关于视觉信息与其它类型信息的集成。第二方面的研究内容是关于视觉表示和视觉模型的集成。视觉表示方法主要分为三类:图像表示、表面表示、物体表示。视觉模型王要分为图像模型、结构和形状模型、运动和动态模型、不确定性模型。集成的视觉系统应该能够充分利用这些方法的优点。第二方面的研究内容是系统的集成。

4 计算机视觉的发展历程及其趋势

一般认为,计算机视觉技术研究始于20世纪50年代中期,当时的努力主要集中在二维景物图像的分析。区别在于,图像处理的目的是通过处理原始图像得到在某一方面更有利的新图像。模式识别关心的则是将一些模式归入预先定义的有限类别中,主要研究的是二维模式。而计算机视觉主要考虑的是对三维世界的描述和理解。

一般来说,比较一致的观点认为,计算机视觉的研究起始于1965年Rboesrt开创性的工作。Rboert对“积木世界”研究取得的成功激起了人们很高的期望。

60年代末70年代初期,计算机视觉研究领域的很多工作是关于低层视觉处理,从图像中提取重要的强度变化信息――边缘检测。然而,人们很快就认识到很多重要的物体属性无法只通过分析图像的灰度变化得出。到了70年代初期,问题更加明朗化,低层视觉处理无法从单幅图像中普遍地获取对景物的有用描述,计算机视觉的研究领域普遍地发生危机。为了摆脱困境,计算机视觉迫切地需要有一个统一的理论框架作指导。70年代中期到80年代初期,计算机视觉的研究领域首次出现了一个理论框架:视觉计算理论框架,将视觉系统从概念上分成几个独立的模块。80年代后期,计算机视觉的研究领域出现了主动视觉(`vtievsiino)的理论框架。

近年的研究结果表明,单一的图像特征描述机制,无论是对底层像素级特征的描述还是顶层语义特征的描述。都仅能在有限范围内对图像的内容进行建模。巧妙融合多种图像特征因此成为近年图像信息描述方面的主要趋势,近年来,计算机视觉的另一个理论框架――视觉的集成方法越来越多地受到重视。一个重要的趋势是用于识别真实世界中较为复杂的图像内容的技术,适合描述真实场景的各种特征不断得到发展。随着目前互联网络技术的不断发展,另一个值得重视的趋势是计算机图像技术与互联网技术、社交媒体技术等其它计算机技术的融合。

6 结语

计算机视觉识别技术虽然是一门新兴学科。但应用前景十分广阔,对其技术的有效性、易用性、实时性及稳定性能等方面有着较高的要求。因此。其技术面临着前所未有的机遇和挑战,该领域的发展亦有过激烈的争论和反思。但是,不可否认的是,计算机视觉技术研究在许多应用领域的应用前景都是广阔的、不可估量的。

参考文献

[1] 马玉真,陶立英,王新华. 计算机视觉技术的应用[J]. 试验技术与试验机. 2006(01)

[2] 潘春洪,张彩霞. 计算机视觉简述[J]. 自动化博览. 2005(05)

[3] 孙瑾,顾宏斌. 计算机视觉系统框架结构研究[J]. 计算机工程与应用. 2004(12)

[4] 王天珍. 计算机视觉研究进展[J]. 武汉汽车工业大学学报. 1998(01)

计算机立体视觉技术范文2

关键词:计算机;视觉检测技术;原理;应用

中图分类号:TP391.41

受到CIMS的推动和影响,诸多企业的发展趋势逐步趋向于个性化以及自动化,这种大的发展趋势间接的对我国的计算机辅助技术提出了更高的要求,计算机相关技术的发展面临着更加严峻的挑战。就现阶段分析来看,计算机辅助检测技术在现代诸多企业中得到了广泛的应用。随着柔性制造系统的不断进步与发展,驱动图像处理软件、现场总线技术的日趋成熟,检测系统的灵敏性、智能化特点愈发受到人们的关注,在这种大的发展趋势之下,计算机视觉检测技术得到了较快的发展。基于计算机视觉系统现已经广泛应用于现场监控、工况监视等诸多环境之中。

1 关于对视觉技术的相关研究

1.1 基于计算机的视觉检测技术的原理分析和探究

图像技术主要指的就是通过各种途径所实现的对图像的获取以及进一步的深入加工和处理技术。根据视觉检测技术的抽象程度以及对图像处理方式的不同,可以大致将图像的处理和加工技术划分为三个最主要的层次,这三个层次分别是图像的加工处理、图像的分析以及对于图像的理解。将这三个层次进行进一步的结合,便是图像工程。计算机视觉检测技术是一门新兴的计算机检测技术,该技术建立在对计算机视觉研究的基础之上,吸收和借鉴相关的研究成果,借助于传感器来实施三维测量,进而有效获得被测物体的空间具置信息,故而可以很好的满足当代制造业的发展需求。区别于一般的图像处理系统,计算机视觉检测技术所获取的相关数据信息更为精准和迅速,其环境适应性更强。

基于计算机的视觉检测技术注重计算理论的辅导作用,以应用为目标进行视觉技术分析。自上世纪七十年代以来,我国关于对计算机视觉检测技术的研究又取得了显著的进步,并且逐步迈入更为实质性的研究阶段,在该阶段中,逐步开始从通过从多个角度(诸如光学角度、生理学角度以及投影射影角度等等)对其成像问题加以分析。以Marr为代表的专家更是建立了一些一般性的视觉性处理模型来辅助该技术的研究。

1.2 视觉检测技术中传感器的作用

在计算机的控制下配有相关的视觉检测系统,在该视觉检测系统中,主要有三个主要方面的主要作用:第一,对于视觉传感器模型的分析以及确定;第二,进行图像数据分散与整理的相关工作;第三,CAD模型的建立。传感器的主要作用就是对测量棒材的多个截面进行分析,将所收集得到的数据经由图像采集卡采集后,传到相关的图像处理系统中,进而进一步辅助准确的模型的建立。

2 基于计算机的视觉检测技术的应用研究分析

2.1 基于计算机的视觉检测技术的发展状况研究

在研究的初步阶段,相关技术人员借助于数字化的图像处理技术,主要就是为了进一步提高所获得的数字照片的清晰度和质量要求,进而更为精准、科学、规范的对照片所提供的信息加以辨别,为航空卫星图片的读取、识别和分类做准备。在这一系列的视觉工作中,其中最为主要和常见的工作主要是包括分类、识别判读以及三维结构的构建。

基于计算机的视觉检测技术借助于对计算机视觉技术,将所获得的被观察物品的相关信息加以信号转换,并传递给图像处理系统,图像处理系统通过甄别和判断不同照片像素的分布和亮度等讯息,将其进一步转换成为数字化信号,接下来由计算机的图像系统抽出符合目标特征的信号加以运算,对下一步的设备动作加以决定和执行。

就现阶段而言,我国的计算机视觉检测技术系统在诸多领域均有所应用,最为典型的领域诸如医学的辅助诊断、机器人的感应系统、智能化的人机接口等均是建立在该技术的基础之上。借助于计算机视觉技术这一手段,可以有效提高对产品检测的效率,提高精准度,这种新型的视觉检测技术相比较于传统的人眼在流水线上的跟进,其具有显著的优越性,其获取测量结构迅速、检测结果可以直接被观察、可以进行自动识别以及定位准确和实时性的特点,这就很好的避免了由于人的一些主观性因素所导致的误差出现。

二十世纪以来,基于生物特性的计算机视觉检测技术得到了空前的发展,具体表现在人脸识别、生硬识别、指纹识别以及虹膜的识别中,形式日趋灵活和复杂多变。借助于计算机的视觉检测技术,可以有效对用户的身份进行鉴定和识别、判定用户的特殊信息等。除此之外,还可以将基于计算机的视觉识别技术逐步推广到其他领域,如海关的安全检查以及出口、入口的安全控制等领域。

2.2 基于计算机的视觉检测技术的相关应用分析

2.2.1 数码相机中所采用的图像采集技术

视觉检测技术的一个显著特点就是有效提高了生产的柔性和自动化程度,本世纪以来,数码相机凭借其高分辨率,快速成像、显像,功能丰富多变以及性价比较高的特定风靡全球,逐步取代了传统的照相机,传统的照相机主要采用的是CCD 摄像头,其主要的核心及时采集卡,显然这种采集系统已经逐步落后于时展的脚步,现已逐步被淘汰。

2.2.2 微文字识别系统的相关研发和设计

随着科学技术的不断进步与发展,大规模集成电路得到了较快的进步,基于计算机的视觉检测系统的成本得到了极大的降低,基于计算机视觉检测技术的微文字识别系统的研发也被提到了日程中来。微文字识别系统的处理芯片大多是借助于数字信号处理芯片来实现图像的识别,进而借助先进的语音合成技术将朗读变为可能。此外,为了便于使用,该系统的体积被尽可能的缩小,并且可根据美观度和实用性等设计为各种形状。

2.2.3 特殊用纸水印在线检测系统

基于计算机的视觉检测技术可以在某一特定领域代替人的主观判断,诸如水印质量的自动检测方面。区别于普通的工作人员,计算机可以实现长时间工作,对于误差范围的控制可以通过设置等实现,而且在计算机执行任务期间,所受到的客观和主观因素相对较少,这就极大程度上避免了由于人的因素所导致的失误性操作,进而有效提高了工作效率以及检测的精准度。这一优点,在水印质量标准的认定中具有十分重要的意义和作用,通过研发一定的程序和软件,可以制定出一套操作性强、权威性较高的水印清晰度量化标准。

3 基于计算机的视觉检测技术的发展展望

综合分析来看,计算机视觉检测技术现已有大约四十年的历史,作为一种新兴的检测技术,该技术的显著优越性不言而喻,该检测技术以其高精度、反应灵敏迅速、智能化、自动化等特点被广泛应用于诸多领域和行业之中,并取得了显著的成,可以说,该技术具有十分广阔的发展前景。但是,不可否认,基于计算机的视觉检测技术并不是十分的成熟,在其设计和研发过程中仍然存在着诸多不足,而且视觉检测技术是一项设计到心理、生理等多方面知识的复杂性技术,涉及领域众多,更强大功能的实现需要人类知识的不断拓展和延伸,因此,必须意识到该检测技术发展道路上的困难和挑战。

4 结束语

随着科学技术的不断进步与发展,经济的发展对于新技术的研发提出了更高的挑战,再者由于广大人民群众生活质量的不断提高,对于生活水平也有了进一步的认识和了解。基于计算机的视觉检测技术的研发和进步,无疑更好推动了高速发展的经济,不断满足了人民群众日益提高生活需求。由此来看,深入对视觉检测技术的研究和探究无疑具有十分重要的作用,笔者衷心希望,以上关于对我国基于计算机的视觉检测技术的相关探究能够被相关负责人合理的吸收和采纳,进而更好的推动科学技术的创新和进步,推动经济的不断进步与发展。

参考文献:

[1]李旭港.计算机视觉及其发展与应用[J].中国科技纵横,2010(06):42.

[2]张江明,张娟.浅谈制造业中计算机视觉检测技术的应用与发展[J].科技创新导报,2011(24):1.

计算机立体视觉技术范文3

关键词:计算机视觉;课程创新;教学改革

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2016)20-0118-02

计算机视觉课程是人工智能学科的分支学科,对互联网技术的发展有着重要的推进作用。随着时代的飞速变迁,越来越多的学生对这一领域产生了浓厚的兴趣,计算机视觉课程在信息专业中也开始占据重要的地位。如何让学生对这门课程保持长久的兴趣,如何培养学生的专业能力和实践能力,是当前高校应该考虑的问题。经过近几年的教学实践后,很多高校已经逐步确定了通过实际应用培养学生兴趣的教学方法,在满足学生对计算机视觉应用需求的同时,加深了学生对理论知识的理解,这已经成为了当前高校计算机视觉课程教学的重要模式。

一、计算机视觉课程的特点

近年来,随着计算机网络的飞速发展,计算机视觉的应用也越来越广泛,成为了信息相关专业学生的一门必修课。计算机视觉课程涉及众多领域,包括人工智能与模式识别、应用数学等,其覆盖范围广,综合性较强。具体来说,计算机视觉课程有以下几个特点:一是内容广泛,理论抽象。计算机视觉是一门新技术,随着时代的变迁,互联网新技术的更新日新月异,这就使得课程内容的更新过快,内容广泛,教师很难在第一时间向学生输送所有的课程知识。二是计算机视觉课程涉及多个学科领域,并且所涉及的领域知识内容复杂,表达抽象,这对学生的学习来说是一个较大的障碍。三是实践性强。计算机视觉课程的知识内容来源于各种专业不同的领域,操作性极强,学生只有在具有一定的工程项目综合能力后,才能进行计算机视觉应用和操作。

二、计算机视觉与计算机图形学、数字图像处理之间的联系和区别

1.计算机视觉与计算机图形学的联系与区别。计算机视觉一般输入的都是图像或图像序列,其输入资料主要来自usb摄像头或是相机。经过处理后,计算机视觉输出的是对图像序列和图像对应的对真实世界的一种理解,在这一方面,计算机视觉有识别车牌、人脸的作用。而计算机图形学则是一种对虚拟场景的描述。它一般是由多个多边性数组组成,每个多边性有三个顶点,输出的是二维像素数组。在增强现实的应用中,人们不仅需要用计算机视觉来提高对物体识别和姿态获取的效率,还需要用到计算机图形学对虚拟三维物体的叠加方法。

2.计算机视觉与数字图像处理的联系和区别。首先,计算机视觉与数字图像处理之间的联系在于数字图像处理是计算机视觉处理的基础,而计算机视觉的研究成果也可以作为数字处理的素材。其次,计算机视觉与数字图像处理之间的区别在于图形是一种纯数字化、矢量的单位,而图像则不仅包括图形,有时还包括来自现实世界的信号,并且图形的处理不是一种简单的堆积,计算机视觉的处理要从图像中找到一些统计数据和信息,并做进一步的数据分析。

三、高校计算机视觉课程教学的创新策略

1.以工程应用为导向的课程内容。鉴于学习本课程的学生在毕业之后多数会进入相关工程企业或者研究院工作,因此,在对学生进行培养时,高校一方面要考虑到学生的知识接受度,另一方面要设置以工程应用为导向的课程内容,帮助学生更好的进入企业或研究院开展工作。高校在进行计算机视觉课程教学创新时,首先要创新课程教材,摒弃以往枯燥的理论书籍,多选取一些实践性和应用性强的教材。考虑到国内教材的滞后性和学生基础的薄弱性,高校应该选择以下两本书作为学生的专用教材:一本是我国著名教授贾云得编纂的《机器学习》,这部教材深刻体现了时展的教学要求,书中不仅详细讲述了计算机视觉中的一些基本知识,包括计算机视觉的基本概念、算法及其应用,还有一些经典的数字图像处理方法和视觉应用分析,对学生了解基础知识和实践内容有着重要的意义;另外一本是国内外十分推崇的计算机视觉著作,它是美国教授Richard Szeliski教授的作品。该书在2010年出版,获得了众多业界人士的好评。Richard Szeliski教授是华盛顿大学的兼职教授,也是微软研究院交互视觉与多媒体的主任,他对计算机视觉的发展和未来走向十分清楚,也深刻了解产业界和大学需要什么样的计算机视觉课程教材。因此,这本教材面向应用,与当今最新的科技成果紧密相连,综合论述了计算机视觉在各个领域的发展,展示了计算机视觉的最新研究成果和未来的发展趋势。此外,本书中还有详细的国外研究案例和更加深入的应用案例,适合学生开展探究性学习。两本教材都是遵循以工程应用为导向的原则,对学生开放性思维的培养有着重要的意义。

2.面向科技最新成果的课程定位。计算机视觉是一门新技术,科技创新是其发展的原动力,因此,高校在进行课程安排时,应该将当今计算机视觉领域的重要的科技成果作为计算机课程的基本教学内容。要想以科技最新成果定位计算机视觉课程,高校要做到以下两个方面:(1)选取涵盖最新成果的教材。考虑到不同学生的数字图像处理基础不一的问题,学校可以在课程中补充一些有关数字图像处理的基础内容。在选择教材内容时,计算机视觉课程的内容应该包括数字图像处理、视觉学习和模式识别这三大部分。数字图像处理是视觉课程的基础内容,主要向学生介绍数字图像处理和计算机视觉所涉及的一些基础知识,包括图像的分割和检测、图像滤波的处理等。数字图像处理是整个计算机课程学习的重要基础内容,其课时可占总课时的二分之一。其次,视觉部分是近几年来计算机视觉的最新科技成果,内容主要包括摄像机的几何设定和计算机摄影机的序列处理等。作为最前沿的科技领域,视觉部分将会是该课程后期的重点内容,与实践作业紧密结合。而模式识别则更多的是新技术的一种工程应用,学生会更多的涉及到实践操作,更好的培养学生的实践能力。(2)强化学生自学和调研能力。课程调研和实践是信息专业学生强化能力的重要方法之一,高校可以在课程项目中引入新技术的探究,在使课程在具有基础性、研究性的同时,具有一定的前沿性,还能让学生在第一时间了解到最新的科技成果和互联网应用技术。在课程调研和实践中,高校必须要强化学生的自学和调研能力,在调研时给每一个小组安排一位高年级研究生作为指导,每组学生独立完成任务,高年级研究生只做引导和辅助的作用。学生在自我设置调研程序,查找资料,理解和熟悉相关程序的时候,能够更加掌握最新科技成果的内容,同时还提高了学生的自学能力和团队协作能力。

3.工程实践化的教学形式。工程项目综合能力是信息专业的学生必须具备的素质之一,因此在计算机视觉课程的教学过程中,培养学生的工程实践能力是教学目标之一。高校可以采取以下两种方法:(1)选取适当的工程实例。对于信息专业的学生而言,计算机视觉课程各个独立的算法和方法较多,彼此没有过多的联系。这对学生来说过于抽象,不易理解,因此教师不应当仅仅限于知识的传授,还应该选取一些适当的工程实例,将知识体系串联在一起,加深学会对教学内容的理解,从而达到良好的教学效果。例如,在教学过程中,教师可以着重介绍手机制造的例子。手机是现在学生十分熟悉的产品,用手机举例更加贴近学生的生活,教师可以详细介绍手机键盘和主板的制造过程,并在这一过程中将所学的算法和理论融合进去,加深学生对知识的理解。其次,教师在手机讲解时,还可以引导学生思考类似的产品制造,从而引出数码相机的制造原理,和学生一起探讨其制造算法。这种做法不仅可以帮助学生学习,还可以让学生拓宽思路,发散思维,不断创新计算机视觉领域。(2)选择合适的实际应用。计算机视觉课程是一门实践性和操作性极强的学科,因此,为了学生更好的学习,教师要将理论工程实践化,选择合适的实际应用来提高学生的实践能力。教师可以安排学生进入手机制造厂房,给学生上一堂别开生面的实践课,详细介绍每个制造流程,并向学生不断抛出与课程有关的问题,引发学生的思考,比如选择什么样的模板匹配法可以更为简单。学生在不断的解答和提问中,对学科知识的了解也会逐步加深。其次,高校可以建立专门的实训基地,学生可以在基地里实践操作,将理论转化为实物,亲自尝试做出模型,这种做法可以极大地提高学生的实践能力,使学生更快的将理论转化为实际。

四、结语

在新形势下,高校应不断创新计算机视觉课程的教学模式,并以此展开教学活动,培养学生的实践能力和创新精神。将工程应用和科技最新成果结合的教学模式,有利于解决理论和实践相脱节的问题,在增强学生学习兴趣、提高学生独立分析能力的同时,还使学生接触了国际最新的研究成果,拓宽了学生的思路,这对学生未来的发展有着重要的意义。

参考文献:

[1]郭小勤,曹广忠.计算机视觉课程的CDIO教学改革实践[J].理工高教研究,2010,(05).

[2]伦向敏,侯一民.高校《计算机视觉》课程辅助教学系统的研究[J].教育教学论坛,2012,(18).

[3]陈芳林,刘亚东,沈辉.在《计算机视觉》课程中引入研讨式教学模式[J].当地教育理论和实践,2013,(07).

[4]杨晨.视觉传达设计专业插画设计课程创新与实践人才培养机制探究[J].艺术科技,2015,(05).

[5]蒋辰.基于数字媒体环境的视觉传达设计专业综合实验课程改革探证[J].文艺生活:中旬刊,2015,(07).

[6]张胜利.视觉传达设计专业中色彩风景写生课程多元立体化教学模式的构建[J].美术教育研究,2015,(08).

计算机立体视觉技术范文4

关键词:虚拟现实(VR);虚拟环境人机交互

一、引言

在信息技术发展的今天,人们的交流越来越多的依靠网络、广播、电视等媒体得到相关的信息资料,但是这些媒体提供的信息往往是经过抽象的,在很大程度上人们不能及时有效的进行理解吸收,解决这一问题人们只能借助于实物模型,但随着计算机技术的迅猛发展,使得人与计算机的交互成为可能,虚拟现实(VR)技术就是借助于这个基础上实现了人机交互,操作者可以通过键盘、鼠标、头盔、数据手套等工具与计算机间的交互,真正成为虚拟环境中的一员,较真实的感知和操作虚拟世界中的各种对象,达到理解和掌握知识、为生产生活服务的目的。

二、虚拟现实技术简介

虚拟现实(简称VR),又称灵境技术,是以浸没感、交互性和构想为基本特征的计算机高级人机界面,是迅速发展的一项综合性计算机、图形交互技术。它综合利用了计算机图形学、仿真技术、多媒体技术、人工智能技术、计算机网络技术、并行处理技术和多传感器技术,模拟人的视觉、听觉、触觉等感官功能,使人能够沉浸在计算机生成的虚拟境界中,并能够通过语言、手势等自然的方式与之进行实时交互,创建了一种适人化的多维信息空间。使用者不仅能够通过虚拟现实系统感受到在客观物理世界中所经历的“身临其境”的逼真性,而且能够突破空间、时间以及其他客观限制,感受到在真实世界中无法亲身经历的体验。计算机技术的迅速发展为我们提供了许多解决问题的新方法。虚拟现实技术的产生与发展也同样如此,目前虚拟现实系统的研究现状主要涉及到三个研究领域:依靠计算机图形方式建立实时的三维视觉效果、构建对虚拟世界的观察界面和使用虚拟现实技术加强其在现实世界中的应用。

三、虚拟现实技术特征及其系统的关键技术

从本质上说,虚拟现实就是一种先进的计算机用户接口,它通过给用户同时提供诸如视、听、触等各种直观而又自然的实时感知交互手段、最大限度地方便用户的操作,从而减轻用户的负担、提高整个系统的工作效率。因此虚拟现实技术具有以下四个重要特征。

(一)多感知性。所谓多感知性就是指导包括视觉感知外,还包括听觉、力觉、触觉和运动感知、甚至包括味觉感知、嗅觉感知等。

(二)存在感。又称临场感,它是指用户感到作为主角存在于模拟环境中的真实程度。理想的模拟环境应该达到使用户难以分辨真假的程度。

(三)交互性。它是指用户对模拟环境内物体的可操作程度和从环境得到反馈的自然程度(包括实时性)。我们借助与我们8的感觉器官,在虚拟的环境中体验真实的环境。

(四)自主性是指虚拟环境中物体依据物理定律进行动作的程度。虚拟现实系统的关键技术主要由动态环境建模技术、实时三维图形生成技术、立体显示和传感器技术、应用系统开发工具和系统集成技术等五个方面组成。其中动态环境建模技术的目的是根据应用的需要获取实际环境的三维数据,并利用获取的三维数据建立相应的虚拟环境模型。而三维图形的生成技术关键是如何实现“实时”生成。立体显示和传感器技术是虚拟现实中实施交互能力的关键。

四、当今虚拟现实技术的应用领域

虚拟现实技术的应用前景十分广阔。目前在娱乐、教育及艺术领域的应用占据主流,其次是军事与航空、医学领域,机器人和商业领域都占有一定比例,另外在可视化计算、制造业等领域也有相当的比重。下面简要介绍其部分应用。

(一)娱乐、艺术与教育领域。丰富的感觉能力与3D显示环境使得VR成为理想的视频游戏工具。如Chicago(芝加哥)开放了关于3025年的一场未来战争的世界上第一台大型可供多人使用的VR娱乐系统;1992年的一台称为“LegealQust”的系统由于增加了人工智能功能,使计算机具备了自学习功能,大大增强了趣味性及难度,使该系统获该年度VR产品奖。作为传输显示信息的媒体,VR所具有的临场参与感与交互能力可以将静态的艺术转化为动态的,可以使观赏者更好地欣赏作者的思想艺术,提高了艺术表现能力。

(二)军事与航天工业领域。模拟与练一直是军事与航天工业中的一个重要课题,这为VR提供了广阔的应用前景。美国国防部高级研究计划局DARPA自80年代起一直致力于研究称为SIMNET的虚拟战场系统,以提供坦克协同训练,该系统可联结200多台模拟器。另外利用VR技术,可模拟零重力环境,以代替现在非标准的水下训练宇航员的方法。

(三)医学领域。VR在医学方面的应用具有十分重要的现实意义。在虚拟环境中,可以建立虚拟的人体模型,借助于跟踪球、HMD、感觉手套,学员们可以很容易了解人体内部各器官结构,这比现有的采用教科书的方式要有效得多。Pieper及Satara等研究者在90年代初基于两个SGI工作站建立了一个虚拟外科手术训练器,用于腿部及腹部外科手术模拟。这个虚拟的环境包括虚拟的手术台与手术灯,虚拟的外科工具(如手术刀、注射器、手术钳等),虚拟的人体模型与器官等。借助于HMD及感觉手套,使用者可以对虚拟的人体模型进行手术。另外,在远距离遥控外科手术,复杂手术的计划安排,手术过程的信息指导,手术后果预测及改善残疾人生恬状况,乃至新型药物的研制等方面,VR技术都有十分重要的意义。

(四)管理工程领域。VR在管理工程方面也显示出了无与伦比的优越性。如设计一新型建筑物时,可以在建筑物动工之前用VR技术显示一下;当财政发生危机时,可以帮助分析大量的股票、债券等方面的数据以寻找对策等等。以上仅列出虚拟现实的部分应用前景,可以预见,在不久的将来,虚拟现实技术将会影响甚至改变我们的观念与习惯,并将深入到人们的日常工作与生活。:

计算机立体视觉技术范文5

关键词:双目立体视觉计算机视觉立体匹配摄像机标定特征提取

双目立体视觉是计算机视觉的一个重要分支,即由不同位置的两台或者一台摄像机(CCD)经过移动或旋转拍摄同一幅场景,通过计算空间点在两幅国像中的视差,获得该点的三维坐标值。80年代美国麻省理工学院人工智能实验室的Marr提出了一种视觉计算理论并应用在双睛匹配上,使两张有视差的平面图产生在深度的立体图形,奠定了双目立体视觉发展理论基础。相比其他类的体视方法,如透镜板三维成像、投影式三维显示、全息照相术等,双目本视直接模拟人类双眼处理景物的方式,可靠简便,在许多领域均极具应用价值,如微操作系统的位姿检测与控制、机器人导航与航测、三维测量学及虚拟现实等。

1双目体视的技术特点

双目标视技术的实现可分为以下步骤:图像获取、摄像机标定、特征提取、图像匹配和三维重建,下面依次介绍各个步骤的实现方法和技术特点。

1.1图像获取

双目体视的图像获取是由不同位置的两台或者一台摄像机(CCD)经过移动或旋转拍摄同一幅场景,获取立体图像对。其针孔模型如图1。假定摄像机C1与C2的角距和内部参数都相等,两摄像机的光轴互相平行,二维成像平面X1O1Y1和X2O2Y2重合,P1与P2分别是空间点P在C1与C2上的成像点。但一般情况下,针孔模型两个摄像机的内部参数不可能完成相同,摄像机安装时无法看到光轴和成像平面,故实际中难以应用。

上海交大在理论上对会摄式双目体视系统的测量精度与系统结构参数之间的关系作了详尽分析,并通过试验指出,对某一特定点进行三角测量。该点测量误差与两CCD光轴夹角是一复杂的函数关系;若两摄像头光轴夹角一定,则被测坐标与摄像头坐标系之间距离越大,测量得到点距离的误差就越大。在满足测量范围的前提下,应选择两CCD之间夹角在50℃~80℃之间。

1.2摄像机的标定

对双目体视而言,CCD摄像机、数码相机是利用计算机技术对物理世界进行重建前的基本测量工具,对它们的标定是实现立体视觉基本而又关键的一步。通常先采用单摄像机的标定方法,分别得到两个摄像机的内、外参数;再通过同一世界坐标中的一组定标点来建立两个摄像机之间的位置关系。目前常用的单摄像机标定方法主要有:

(1)摄影测量学的传统设备标定法。利用至少17个参数描述摄像机与三维物体空间的结束关系,计算量非常大。

(2)直接线性变换性。涉及的参数少、便于计算。

(3)透视变换短阵法。从透视变换的角度来建立摄像机的成像模型,无需初始值,可进行实时计算。

(4)相机标定的两步法。首先采用透视短阵变换的方法求解线性系统的摄像机参数,再以求得的参数为初始值,考虑畸变因素,利用最优化方法求得非线性解,标定精度较高。

(5)双平面标定法。

在双摄像机标定中,需要精确的外部参数。由于结构配置很难准确,两个摄像机的距离和视角受到限制,一般都需要至少6个以上(建议取10个以上)的已知世界坐标点,才能得到比较满意的参数矩阵,所以实际测量过程不但复杂,而且效果并不一定理想,大大地限制了其应用范围。此外双摄像机标定还需考虑镜头的非线性校正、测量范围和精度的问题,目前户外的应用还有少。

上海大学通信与信息工程学院提出了基于神经网络的双目立体视觉摄像机标定方法。首先对摄像机进行线性标定,然后通过网络训练建立起三维空间点位置补偿的多层前馈神经网络模型。此方法对双目立体视觉摄像机的标定具有较好的通用性,但是精确测量控制点的世界坐标和图像坐标是一项严格的工作。因此神经网络中训练样本集的获得非常困难。

1.3特征点提取

立体像对中需要撮的特征点应满足以下要求:与传感器类型及抽取特征所用技术等相适应;具有足够的鲁棒性和一致性。需要说明的是:在进行特征点像的坐标提取前,需对获取的图像进行预处理。因为在图像获取过程中,存在一系列的噪声源,通过此处理可显著改进图像质量,使图像征点更加突出。

1.4立体匹配

立体匹配是双目体视中最关系、困难的一步。与普通的图像配准不同,立体像对之间的差异是由摄像时观察点的不同引起的,而不是由其它如景物本身的变化、运动所引起的。根据匹配基元的不同,立体匹配可分为区域匹配、特征匹配和相位匹配三大类。

区域匹配算法的实质是利用局部窗口之间灰度信息的相关程度,它在变化平缓且细节丰富的地方可以达到较高的精度。但该算法的匹配窗大小难以选择,通常借助于窗口形状技术来改善视差不连续处的匹配;其次是计算量大、速度慢,采取由粗至精分级匹配策略能大大减少搜索空间的大小,与匹配窗大小无关的互相关运算能显著提高运算速度。

特片匹配不直接依赖于灰度,具有较强的抗干扰性,计算量小,速度快。但也同样存一些不足:特征在图像中的稀疏性决定特征匹配只能得到稀疏的视差场;特征的撮和定位过程直接影响匹配结果的精确度。改善办法是将特征匹配的鲁棒性和区域匹配的致密性充分结合,利用对高频噪声不敏感的模型来提取和定位特征。

相位匹配是近二十年才发展起来的一类匹配算法。相位作为匹配基元,本身反映信号的结构信息,对图像的高频噪声有很好的抑制作用,适于并行处理,能获得亚像素级精度的致密视差。但存在相位奇点和相位卷绕的问题,需加入自适应滤波器解决。

1.5三维重建

在得到空间任一点在两个图像中的对应坐标和两摄像机参数矩阵的条件下,即可进行空间点的重建。通过建立以该点的世界坐标为未知数的4个线性方程,可以用最小二乘法求解得该点的世界坐标。实际重建通常采用外极线结束法。空间眯、两摄像机的光心这三点组成的平面分别与两个成像平面的交线称为该空间点在这两个成像平面中的极线。一旦两摄像机的内外参数确定,就可通过两个成像平面上的极线的约束关系建立对应点之间的关系,并由此联立方程,求得图像点的世界坐标值。对图像的全像素的三维重建目前仅能针对某一具体目标,计算量大且效果不明显。

2双目体视的最新应用

2.1国外研究动态

双目体视目前主要应用于四个领域:机器人导航、微操作系统的参数检测、三维测量和虚拟现实。

日本大阪大学自适应机械系统研究院研制了一种自适应双目视觉伺服系统,利用双目体视的原理,如每幅图像中相对静止的三个标志为参考,实时计算目标图像的雅可比短阵,从而预测出目标下一步运动方向,实现了对动方式未知的目标的自适应跟踪。该系统仅要求两幅图像中都有静止的参考标志,无需摄像机参数。而传统的视觉跟踪伺服系统需事先知道摄像机的运动、光学等参数和目标的运动方式。

日本奈良科技大学信息科学学院提出了一种基于双目立体视觉的增强现实系统(AR)注册方法,通过动态修正特征点的位置提高注册精度。该系统将单摄像机注册(MR)与立体视觉注册(SR)相结合,利用MR和三个标志点算出特征点在每个图像上的二维坐标和误差,利用SR和图像对计算出特征点的三维位置总误差,反复修正特征点在图像对上的二维坐标,直至三维总误差小于某个阈值。该方法比仅使用MR或SR方法大大提高了AR系统注册深度和精度。实验结果如图2,白板上三角开的三顶点被作为单摄像机标定的特征点,三个三角形上的模型为虚拟场景,乌龟是真实场景,可见基本上难以区分出虚拟场景(恐龙)和现实场景(乌龟)。

日本东京大学将实时双目立体视觉和机器人整体姿态信息集成,开发了仿真机器人动态行长导航系统。该系统实现分两个步骤:首先,利用平面分割算法分离所拍摄图像对中的地面与障碍物,再结合机器人身体姿态的信息,将图像从摄像机的二维平面坐标系转换到描述躯体姿态的世界坐标系,建立机器人周围区域的地图;基次根据实时建立的地图进行障碍物检测,从而确定机器人的行走方向。

日本冈山大学使用立体显微镜、两个CCD摄像头、微操作器等研制了使用立体显微镜控制微操作器的视觉反馈系统,用于对细胞进行操作,对钟子进行基因注射和微装配等。

麻省理工学院计算机系统提出了一种新的用于智能交通工具的传感器融合方式,由雷达系统提供目标深度的大致范围,利用双目立体视觉提供粗略的目标深度信息,结合改进的图像分割算法,能够在高速环境下对视频图像中的目标位置进行分割,而传统的目标分割算法难以在高速实时环境中得到令人满意的结果,系统框图如图3。

华盛顿大学与微软公司合作为火星卫星“探测者”号研制了宽基线立体视觉系统,使“探测者”号能够在火星上对其即将跨越的几千米内的地形进行精确的定位玫导航。系统使用同一个摄像机在“探测者”的不同位置上拍摄图像对,拍摄间距越大,基线越宽,能观测到越远的地貌。系统采用非线性优化得到两次拍摄图像时摄像机的相对准确的位置,利用鲁棒性强的最大似然概率法结合高效的立体搜索进行图像匹配,得到亚像素精度的视差,并根据此视差计算图像对中各点的三维坐标。相比传统的体视系统,能够更精确地绘制“探测者”号周围的地貌和以更高的精度观测到更远的地形。

2.2国内研究动态

浙江大学机械系统完全利用透视成像原理,采用双目体视方法实现了对多自由度机械装置的动态、精确位姿检测,仅需从两幅对应图像中抽取必要的特征点的三维坐标,信息量少,处理速度快,尤其适于动态情况。与手眼系统相比,被测物的运动对摄像机没有影响,且不需知道被测物的运动先验知识和限制条件,有利于提高检测精度。

东南大学电子工程系基于双目立体视觉,提出了一种灰度相关多峰值视差绝对值极小化立体匹配新方法,可对三维不规则物体(偏转线圈)的三维空间坐标进行非接触精密测量。

哈工大采用异构双目活动视觉系统实现了全自主足球机器人导航。将一个固定摄像机和一个可以水平旋转的摄像机,分别安装在机器人的顶部和中下部,可以同时监视不同方位视点,体现出比人类视觉优越的一面。通过合理的资源分配及协调机制,使机器人在视野范围、测跟精度及处理速度方面达到最佳匹配。双目协调技术可使机器人同时捕捉多个有效目标,观测相遇目标时通过数据融合,也可提高测量精度。在实际比赛中其他传感器失效的情况下,仅仅依靠双目协调仍然可以实现全自主足球机器人导航。

火星863计划课题“人体三维尺寸的非接触测量”,采用“双视点投影光栅三维测量”原理,由双摄像机获取图像对,通过计算机进行图像数据处理,不仅可以获取服装设计所需的特征尺寸,还可根据需要获取人体图像上任意一点的三维坐标。该系统已通过中国人民总后勤部军需部鉴定。可达到的技术指标为:数据采集时间小于5s/人;提供身高、胸围、腰围、臀围等围度的测量精度不低于1.0cm。

3双目体视的发展方向

就又目立体视觉技术的发展现状而言,要构造出类似于人眼的通用双目立体视觉系统,还有很长的路要走,进一步的研究方向可归纳如下:

(1)如何建立更有效的双目体视模型,能更充分地反映立体视觉不确定性的本质属性,为匹配提供更多的约束信息,降低立体匹配的难度。

(2)探索新的适用于全面立体视觉的计算理论和匹配策略,选择有效的匹配准则和算法结构,以解决存在灰度失真、几何畸变(透视、旋转、缩放等)、噪声干扰、特殊结构(平坦匹域、重复相似结构等)及遮掩景物的匹配问题;

(3)算法向并行化发展,提高速度,减少运算量,增强系统的实用性。

计算机立体视觉技术范文6

【关键词】数字技术;艺术发展,影视特点

影视制作的目的有两个,直接原因是给大众带来视觉冲击,促进大众消费。对于其根本原因,在一定程度上,我们可以将影视的制作看成是艺术的制作,而艺术效果恰恰蕴含在影视的制作过程中。近几年,随着科技的不断发展,数字技术被引入影视的制作过程中,数字技术和影视制作技术的相互融合,对于传统的影视制作是一次大的变革,进而使影视的制作发生了翻天覆地的变化。再者,将传统影视技术的优点和数字技术相互融合,形成一种新的制作技术,这种技术融合数字技术和传统技术两方面的优势,更大地推动了我国影视事业的发展。

一、数字技术的影视特点

数字技术可以快速“成长”,得力于计算机技术的发展。那么什么是数字技术呢?就是借助计算机技术对信息进行处理,将信息转化计算机语言,完成对信息的运算,加工以及存储的一项技术。数字化技术的应用使视频具有更好的视觉效果,因而,从数字技术应用的视角上看,影视制作的发展进入一个崭新的局面。众所周知,传统的影视,其视觉效果都是趋于平面化,而数字技术则对图像进行三维立体处理,给人一种三维立体的视觉效果,无论是在声音上,还是在图形结合上,都带给观众身临其境的感觉。

二、数字技术对影视技术的影响分析

(一)影视素材创作数字化。在对影视进行制作时,对于素材的编辑和选取也是借助计算机技术来完成的。其大致过程可分为两个部分,首先是抓取和处理采集的素材,将不同的素材进行有机合成,素材在进行处理之后,形成一种新的影视元素,基于这个原因,所有的原始素材都可以进行二度创作,二度创作包括对原始素材的分解、合成以及重组。其次就要对素材进行后期的处理,其处理过程也包括对信息的采集和制作,继而形成初级的影视作品,最后再利用计算机对作品进行处理,最终形成设计者需要的资源。动漫、图片以及音频效果的形成也离不开数字技术的参与,而动漫、图片以及音频又是影视作品的重要组成部分。为使影视作品具有更加丰富的效果,设计者以信息采集等形式对后期的数字化合成进行处理。为满足人们的审美要求,设计者在进行影视创作时,还要增加一定的美术绘画技术。(二)影视素材存储数字化。储存能力发生变化是影视素材数字化最大的特点。众所周知,传统的储存方式有电影胶片、磁带,甚至是纸质记录等,储存量较小,占据的空间大。随着科技的发展,这些方式逐步被市场淘汰,进而数字技术被引入到影视素材的储存上。将素材信息转化为数字信息,再利用压缩技术将其压缩到数据硬盘上,不仅节约了大量的空间,其储存能力也大大提升,除了数据硬盘之外,数字录像机也可以大量储存影视信息。随着科技发展,近几年又出现储存量更大的储存设备——半导体储存。素材储存数字化在信息的储存方面占据两大优势,一是大容量、大储存;二是信息的编写能力较强,可以对不同类型的信息进行归类,便于日后对信息的查询和选择,从而节约了影视作品的制作时间。(三)3D技术的广泛使用。所谓3D技术,就是以数字化技术为支持,在制作效果上注重三维立体结构——尽可能模拟现实的人物、建筑以及场景等,进而使画面达到逼真、真实和自然的艺术效果。如美国影片《独立日——卷土重来》,其中大量运用了3D技术,使得场面更加真实。

三、数字时代的影视艺术发展趋势

随着大众对于影视作品要求的提高,数字化技术已无法满足人们的需求,这就需要将数字化技术和科技、艺术相结合,并朝着科技化、技术化的方向发展。要想成功转型,就要以科技的快速发展为前提,只有科技得到长足的发展,影视技术才能得到实质的发展。实现科技、艺术以及影视的大融合,还需要很长的路要走,首先应具备过硬的计算机知识,其次对艺术也要有一定程度的了解,再者,还要不断吸收先进的科学技术。

四、结语

综上所述,现阶段,数字技术在影视艺术发展中占据着十分重要的地位。数字技术作为科技发展的产物,它在影视艺术中的广泛应用,使影视技术更趋于科技化和丰富化,数字技术推动影视艺术的发展,而影视艺术又是数字技术发展的具体体现。

参考文献:

[1]叶玲.计算机多媒体技术在影视后期制作中的应用分析[J].科技创业家,2013(18):255-256.

[2]邓毅梅.影视后期制作中计算机多媒体技术的应用研究[J].现代职业教育,2015(23):47-47.