计算机视觉的主要任务范例6篇

计算机视觉的主要任务

计算机视觉的主要任务范文1

关键词 计算机;图形设计;视觉传达系统

中图分类号:TP391 文献标识码:A 文章编号:1671-7597(2013)12-0031-01

目前来讲,计算机图形设计并非一个新鲜事物,因为在20世纪80年代,部分国家就利用计算机设计过图形。该设计方式传到我国,并展开了新的历程。而与计算机图形设计相比,视觉传达技术出现的时间更早,然而站在学科视角来讲,视觉传达依然属于较为年轻的范畴。视觉传达就是把视觉符号当作一个传达信息的通道,人类利用视觉符号展开信息共享与沟通,且该方式同样是人类信息资源传播中一种关键手段。根据有关数据统计,利用视觉传达系统传播的信息占人类信息的70%,然而由于在人类感官系统内,对外部环境中所传播的信息,视觉系统占有主要地位。因此,假使信息接收过程中,人类是依靠视觉系统完成的,并利用另一个感官完成其他信息的接收,如果两者之间发生冲突,人类的反应也会随之变化。

1 计算机成图图形设计与视觉传达系统概述

1.1 设计思路

在计算机成图图形设计与视觉传达系统设计过程中,设计人员不但要放开手脚,大胆做,还应该具有一定的弹性,不能被技巧与知识水平所制约,从而创造具有自身特点且与常规不符的作品,这无疑将成为设计的独到之处。通常情况下,人们将视觉传达系统设计当作一个展现思维的方式,尤其是在设计过程中把图形与文字有机结合,互相作用,且呈现出对方的优点,所以,视觉设计在对符号进行设计的过程中,应该尽可能对其进行优化,将符号自身的优点完美展现出来,进而在整体中表达其思想。

1.2 设计技术与方法

设计工作者应该紧随时展的脚步,充分利用计算机这一先进科学工具,将最好的设计思想表达给大众。此外,由于全球信息技术的迅猛发展,在电影制作与广告方面,均要求运用到计算机成图图形设计,而且设计人员在设计时,也能利用不同的工具,对图形的清晰度进行适度的调整,进而让大众获得不错的视觉感受。

1)提炼客体。图形设计的创作来源主要是客体的表现以及对其的观察。然而在设计过程中必须抓住客体主要的特性,忽略不重要的特性,运用最简单的图形将其所包含的意思表达出来。设计人员在对客体进行提炼的过程中,不但要把握物体的共性,还必须注意其个性。图形设计在提炼客体时涵盖了两个方面的思想:提炼设计的任务;提炼和主题思想有关的图形。

2)重组图形。所谓的重组图形就是把图形中的构成部分进行科学有序的结合。图形的素材就好比是产品的原料,还必须对其进行生产加工方能成为最终的成品。其中最具决定性的一个部分就是图形结构的安排。对图形进行不一样的组合能够产生不同的图形,现今最为常见的重组形式有置换、同构以及轮廓线的矛盾、共生等等。所谓的同构就是将两个或两个以上的形象结合为一个统一的整体,其目的就是依托某个图形形象表现出其他图形的特点。在同构的作用,能够使图形形象更为厚重,有内涵,营造更为新奇的感觉。

2 视觉传达系统内图形设计的特征

2.1 明确的主题思想

设计人员在对图形进行设计的过程中,首先就必须对其基本内容进行规划,明确主题思想,也就是确定自身所要体现的核心内容。例如美的冰箱的广告都要求突出一个作用,即保鲜,那么设计人员在图形设计中必须抓住的关键思想就是鲜活,这一特征不但是该广告设计的目标,同时是图形设计的主题。而这个主题必须具备独特性,能和竞争对手区分开来,有助于大众去选择该产品。主题和图形应该相互作用,主题的主要载体就是图形,而图形的灵魂就是主题思想,主题思想通过图形体现出来。主题思想在初期形成过程中有很多因素都是不明确的,例如表达形式的多元化、视觉元素的多样化以及受众喜好的多样化等。以上述中“鲜活”主题来讲,运动场等视觉元素均能表达该特性,但在表达形式上可以采用不一样的方式,例如影构、置换以及同构等。另外,站在目标受众角度来看,家庭主妇是冰箱使用者,因此在设计过程中必须对其进行调查,了解其特征。设计人员将这些因素都结合起来,分析所要设计的主题,最后明确恰当的表达方式。

2.2 图形设计的任务

在进行视觉传达系统设计过程中,每一个图形设计任务的提出均有一定的原因,例如商业广告的设计,它是在经济因素的基础上提出的;包装的设计,其目的是为了宣传企业文化、形象或者是打造产品形象;公益广告的设计,其目的向广大受众传播一种思想与信念。而所处社会的经济状况与大众的接受水平对图形设计任务的提出有一定的影响力。图形传播是在一定的社会背景下进行的,例如当时的风俗、文化等。在对图形进行设计的过程中,必须确保图形的内容和形式与上述客观背景相配合。

2.3 形象生动

图形设计与绘画是不一样的,绘画时必须确保物和物的协调统一,因此画家在绘画过程中必须先了解所画物体的形象。但是图形则并非如此,图形设计必须选取大众所能接受的物体,这就说明图形设计过程必须选取生活中较为常见的物品作为载体,只有这样设计出来的产品方能让大众记住,并且让大众所理解其中的含义。

3 结束语

总而言之,在当前社会,国家快速发展的主要源头在于科学技术的进步。在各行各业的发展当中,计算机成图图形设计与视觉传达系统设计得到了普遍的运用。所以,人们只有不断的对技术进行更新,不断的对视觉传达系统设计进行分析,进而将计算机成图图形设计运用到生活与工作中,促进社会的快速发展。目前各行各业都面临着巨大的压力与挑战,所以计算机图形设计应该与时展相适应,以便寻求更好的发展前景,尤其是在与视觉传达系统设计有机结合时,应该互相作用、互相影响,那么在不远的未来将会出现新的发展。

参考文献

计算机视觉的主要任务范文2

关键字:摄影测量技术;摄影测量学;并行计算机;发展趋势

中图分类号: [TU198+.3]文献标识码:A文章编号:

一、摄影测量学的发展

(一)摄影测量学的含义

将三维空间的图像已二维的方式呈现在图像上,这是一个退化过程。摄影测量学的目标,就是研究怎样通过二维图像,将目标重建的三维信息。

摄影测量学主要有两方面:

(1)物体空间的三维特性和系统成像投影的关系,这属于测量学范围内的知识。

(2)从单幅和多幅图像中自动提取图像目标,这属于计算机视觉方面的知识。

现如今,随着摄影测量的三角测量理论和计算机多视觉的理论越来越成熟,摄影测量的研究已经涉及到第二个方面,那就是图像目标的定位上。它和传统的图像处理不同,它更注重图像目标的定位和精确度。

摄影测量要对二维、三维定量测量,就要把图像和成像系统联系起来,但一般的图像处理和系统成像无关。所以,摄像测量的重要特征,就是摄像系统的高精度标定。一般的摄影测量工作都涉及到专业的摄像测量相机,这些专业的摄像测量相机通常都有标定设备和方法。但在实际摄影测量工作中,往往采用的都是比较普通的摄像机或者照相机,经过测定方法的不同,可以让非测量型的摄像机或者照相机达到测量要求,用于高精度的测量。

(二)摄影测量的历史

摄影测量和计算机视觉是摄影测量学的两大根基。自1839年摄影诞生后,人们就通过照片来进行各种测量和研究。如何提高测量精度,一直都是个永恒的话题,经过之前的模拟摄影测量、再到解析摄影测量,现在已经进入了数字测量阶段,数字测量具有相当完备的测量理论和方法。因为一般的摄影测量对测量设备的要求很高,测量的方法也太过于复杂,所以摄影测量主要用在国家或者军事等大结构层面上,但在普通民用领域中,摄影测量仪器却少之又少。

二、摄影测量技术的架构

并行计算机分为共享存储器计算机系统和消息传递计算机系统两大类。因为摄影测量数据较为密集,所以往往采用具有超强扩展性的消息传递并行计算机系统,在系统中增加处理硬件,实现处理系统的增量式扩展。计算机集群的摄影测量可以分为以下4部分:

(一)任务输入和产品输出接口,主要负责图形化界面接受用户的任务,在完成任务后,将完成好的产品以可视化的模式提供给用户,方便用户对产品的检查。

(二)系统管理和任务调度智能化分析用户的任务,把任务分为多个并行处理的子任务,分到计算机群,同时帮助计算机群处理各项任务;该子系统还会对这个并行计算机系统提供管理功能。

(三)分布数据管理系统为计算机提供数据存储服务,属于分布并行存储体系结构,所有的影响都会被划分成影像瓦块,在并行处理模式中对数据进行管理,很大程度提高了数据检索的速度。

(四)并行处理子系统属于自动化影像处理,该算法的层次包括计算机主机并行和计算机内部并行;计算机主机间并行采用的是并行结构,是由任务来调度主机的任务集;计算机内部并行是采用共享存储器并行的计算模式,主要用于多线程技术,将计算机的多核处理优势发挥到极致。

三、目前摄影测量的现状

自上世纪20世纪六十年代起,模拟测量经过了漫长的发展历程,摄影测量技术的发展,都是围绕着价格昂贵的测量仪器所进行的。随着计算机技术、模数转化技术和自动控制技术的不断发展和进步,人们在1961年生产出了世界上第一台解析测图仪器。到七十年代,因微电子技术的发展,让计算机变得更加渺小、性能也在不断增强,解析测图仪也逐渐成为了主要的测图仪器。但摄影测量的技术人员们并没有因此而得到满足。直至90年代后,摄影测量技术获得了迅猛发展,并以逐渐投入到实用化阶段。对于我国而言,摄影测量技术对工作者们来说,是机遇和挑战并存的。

虽然我国的摄影测量技术正处于一个不可多得的发展好时机,但我们依然要认识到,摆在我们面前的各种问题和挑战。

(一)从摄影测量的工作上而言,地貌的测绘、DEM模块的建立等,还有很多问题需要人们去解决,特别是全自动化提取还有很大的差距;目前虽然在自动定向算法、特征提取、影响分割分类、目标重建和自动化三角测量等方面取得了优异的成绩,并设计且应用了一些理论,但是在摄影测量的研究上,我们还是处于一个初级阶段,有些测量如果想用于实际,那离目标还相距甚远,尤其是在语义信息的自动提取方面。

(二)摄影测量技术作为空间信息科学的主要组成部分,摄影测量怎样才能更好的与GPS集成,更好发挥出它的优势,我们仍需要做很多工作。想要实现数字中国,摄影测量责无旁贷,当时要真正达到这个目标,我们还需要做大量努力。

四、摄影测量的基本理念

在现代数字化、智能化等众多信息技术主流的推动下,摄影测量也步入了智能摄影测量的时代。与模拟摄影测量和解析摄影测量等摄影测量的理念相比,智能摄影测量的理念有以下几点:

(一)摄影测量是一个非线性过程。

(二)摄影测量只能通过非线性系统来完成。

(三)摄影测量整个过程是一个具有智能主体内在结构和机制的,以摄影测量为主线的视觉系统,统称为摄影测量机。

(四)摄影测量机通过工程设计,把约束内在的信息处理过程复杂化,使一切问题至少有一个系统性的目标解法。

智能摄影测量工作将为摄影测量的发展阶段解决和研究以下问题:

摄影测量工作中的非线性过程分析。

智能摄影测量的设计目标将要解决的各种问题。

智能摄影测量机的主要类型,针对不同的用途。

智能摄影的结构,应该包含哪些组件,组件之间的依赖关系。

智能摄影中,每个组件的目标、原理的实现等。

参考文献:

[1] 张健,刘航冶,杨明等.摄影测量高性能处理关键技术研究[J].地理与地理信息科学,2010,26(3):109-110.

[2] 于起峰,尚洋.摄像测量学简介与展望[J].科技导报,2008,26(24):84-88.

计算机视觉的主要任务范文3

关键词 图表加工,规则模型,认知过程模型,计算模型,层次框架模型。

分类号 B842

古埃及人绘制地图来表示复杂的空间信息,在某种意义上创作了第一种图形显示;在莎士比亚时代,人们使用“划线”和“标记”系统来记录数量关系[1]。Playfair在《商业与政治地图册(The Commercial and Political Atlas)》一书中区分了饼图、直条图、直方图和线形图等,率先对图表显示进行科学研究(参见文献[2])。Playfair明确指出,对于呈现定量数据,使用模拟符号比使用词汇和数字更有效(参见文献[3])。

图表(graph and table)作为一种重要的信息记录、展示和传递方式,已经被广泛地应用到科学[1]、工程[4]、教育[5]、商业和媒体[6]等领域中,并发挥着重要的作用。图表不仅有突出的视觉和空间特征,而且有表征数量关系的图表构成成分,因此,图表加工与人们对图表的知觉加工和对图表构成成分的概念加工密不可分。如何更好地设计和制作图表以有效地记录和展示信息,如何快速有效正确地理解并获取图表所传递的信息,已成为认知心理学家关注的重要问题,其研究成果具有明显的应用价值。

近年来,研究者们提出了许多有关图表加工的理论模型,试图说明图表加工过程的特点与规律。基于已有的图表加工理论所涉及的认知加工过程的复杂程度,我们将其区分为两大类,第一类较为简单,包括规则模型(rule model)、认知过程模型(cognitive process model)和计算模型(computational model),而第二类是2004年提出的层次框架模型(hierarchical framework model),涉及的认知加工过程相对比较复杂。本文将首先介绍第一类模型,并进行简要评述;然后,介绍和评述层次框架模型;最后,在总结已有图表加工理论的基础上,试图指出以往图表加工研究中存在的问题,并提出未来的发展方向。

1 规则模型

规则模型指出了图表设计过程中应遵循的基本准则,主要可以分为分析模型(analytic model)和兼容模型(compatibility model)两大类。分析模型主要侧重于从图表自身的角度出发来考虑图表设计的原则,而兼容模型的特点在于从图表和任务的兼容性方面来考虑图表设计的原则。

1.1 分析模型

分析模型中所论述的图表设计的基本原则,大多是基于认知心理学家的直觉和经验,只有少数基于实证数据。Bertin的《图表记号学(Semiology of Graphics)》一书着重分析了图表显示的视觉特性,并详细地阐述了用于设置和显示数量变化的图表生成技术[7]。他把图表设计问题划分为不同的类别,认为在设计图表时应该考虑图表拟显示的信息成分的组织水平(名义的、顺序的、等距的和比例的),并指出表征信息某一成分的变量必须具有和它们所表征的信息成分至少相同的组织水平。

Tufte则提出了数据-笔墨比率(data-ink ratio)原则(参见文献[3])。这一原则认为,图应该只用来表示重要的信息,因此,应该使不能表达数据点或数据点之间关系的描述减至最少,以减少混淆。Gillan和Richman进一步指出,数据笔墨比率越高,则完成系列判断所用的时间越短,准确性越高;整合性的任务(如总体比较、综合判断)比聚焦性任务(如单值提取)更易受数据-笔墨比率的影响[8]。他们的实验结果表明,图形背景的使用可能会干扰读者对图表信息的加工(尤其是当读者完成整合性任务时),其结果会增加反应时间,降低准确性[8]。

Kosslyn在编码、知觉和表征的不同层面上对图表进行了句法的(syntactic)、语义的(semantic)和实效的(pragmatic)分析,指出了影响图表阅读难易程度的因素[9]。Zhang关注表征维度(representing dimensions)和被表征维度(represented dimensions)之间的关系,指出只有当表征维度能够充分必要地表征被表征维度时,表征方式才是最优的,也就是说,表征维度和被表征维度应该在量尺类型上匹配[10]。

综上所述,分析模型主要侧重于从图表自身出发来考虑图表设计的原则。分析模型的主要问题在于,它们很少考虑任务类型、图表读者的知识经验以及这些因素之间的交互作用,并且缺乏实证研究支持。具体而言,Bertin侧重于对图表设计原则的叙述,并没有提供相应的实验证据。Kosslyn的图表理论[9]和Zhang的表征原则[10]也缺乏实验数据的支持。虽然Tufte的数据-笔墨比率原则得到了一些实验数据的支持,但其概念却有点扩大化了。例如,在线形图中,数据是由各个点来表达的,点与点的连线并不传递数据,根据Tufte提出的原则,这些多余的连线应该被删除。但是,如果删除这些多余的连线就会削弱人们完成某些任务(如趋势评估)的能力,因为这些连线为图表读者提供了线条斜率的突显特征(参见文献[3])。

1.2 兼容模型

兼容模型即任务-显示兼容性(task-display compatibility)模型[3],认为不同的显示方式适用于不同的任务,如果任务不同,那么最佳的显示方式也应有所不同。Vessey在“认知匹配理论”(cognitive fit theory)中对这一模型进行了详细的阐述,旨在说明图和表两种信息呈现方式之间的差别以及它们所支持的任务类型[11,12]。Vessey指出,图主要用来呈现空间信息,而表主要用来呈现符号信息。任务主要可以区分为两大类:一类为“符号”(symbolic)任务,包括提取离散数值;而另一类为“空间”(spatial)任务,包括觉察或判断数值之间关系(如大小比较、趋势判断等)。根据兼容模型,当呈现方式和任务均为空间的或均为符号的时候,两者是兼容的,其任务绩效要明显高于两者不兼容情景下的任务绩效。但是,Vessey的实验结果只是部分地符合模型的预测。

兼容模型的一个主要变式是“接近―兼容性原则”(proximity-compatibility principle,简称为PCP),即任务和显示方式应该同时是低接近性的或者同时是高接近性的[3,13,14]。低接近性任务要求使用单个数据点(如提取具体数值);而高接近性任务则要求使用数据点的构型(如比较趋势)。在低接近性的显示方式中,数值之间距离较大或者分开显示(如数据表);而在高接近性的显示方式中,数据之间分布紧密并可组成视觉构型(如客体显示,object display)。PCP表明,当任务的接近性与显示方式的接近性相兼容的时候,绩效最好。Renshaw 等人使用眼动技术对图例的位置进行考察,结果表明在遵循PCP的条件下,读者的操作绩效较好[15]。需要说明的是,PCP不仅包括显示方式的空间接近性,还包括所使用的颜色、形状和尺寸的相似性。

我们认为,兼容模型提出了图表设计的一个重要原则,但并未说明为什么遵循兼容性原则的图表能提高图表读者的任务绩效。此外,兼容性模型只阐述了图表与任务之间的关系,并没有考虑图表读者的知识经验等因素。由于图表读者、图表和任务构成一个系统,三者之间存在着一定的交互作用,图表-任务之间的关系可能会受到图表读者知识经验的影响。前面提到的Vessey的部分实验结果与模型预期不一致,可能是图表读者不同的知识经验造成的。

2 认知过程模型

认知过程模型认为,图表理解的过程可以分解为一系列的认知加工过程,主要包括图表理解理论(theory of graph comprehension)、理解认知信息工程(understanding cognitive information engineering,简称为UCIE)的计算机程序和知觉与概念加工模型(model of perceptual and conceptual processes)。

2.1 图表理解理论

Pinker在其提出的图表理解理论中,将图表界定为向读者传达数学量尺中一组N维数值的一种表征方式,用客体的视觉维度(如:长度、位置、亮度和形状等)对应于各自表征的量尺(如:名义的、顺序的、等距的或比例的),每一个维度值对应于相应量尺的值[16]。Pinker指出,要理解图表,读者需要做两件事情。首先,他必须在心理上以一定的方式来表征图表中的元素。当读者看一张图表时,图表中的信息就会以一种强度的二维模式即网膜上的视觉阵列(visual array)作用于其神经系统,视觉阵列的原始信息通过视觉描述(visual description)被转换为记忆表征来指代图表中视觉标记的意义。其次,读者必须记住或推论出图表视觉成分所代表的相应的数学量尺。为此,Pinker提出图表图式(graph schema)的概念,即在某些领域已经被记住的图表信息,包括对至今未知信息的参量和插槽的描述。读者通过图表图式可以获得图表的视觉成分与相应的数学量尺之间的正确对应关系。

Pinker指出,为了回答特定的问题,图表读者需要把从视觉描述中获得的信息转换成概念消息(conceptual messages),并把问题转换成能够通过视觉描述来回答的形式。这将包括下面的一系列过程:(1)匹配(matching),即将图表归类为某一特定的图表类型;(2)消息汇集(message assembly),即从图表图式中产生概念消息的过程,值得注意的是,并不是图表中的所有信息都必须被转换成概念消息;(3)查询(interrogation),即基于概念问题对新信息进行编码和提取;(4)推论过程(inferential processes),即将数学和逻辑规则应用到概念消息中去,以获取新的信息。

Pinker的图表理解理论主要以命题表征为基础,关注的是人们从图表中提取信息的过程。该理论存在着以下几个方面的问题:(1)Ratwani等人指出,图表理解理论对读者的任务绩效不能提供很好的解释,没有说明读者在理解图表的过程中是如何整合信息的,如“群组”(cluster)信息是单个读取的还是以格式塔的方式形成的[17];(2)不能很好地解释问题类型对信息加工过程的影响。Ratwani等人指出,根据图表理解理论,读者读取和整合问题应该有着相同的扫描模式。然而,经验数据表明,问题类型对读者的扫描模式有着强烈的影响,视觉加工的操作是服务于读者所要回答的问题[17];(3)声明了推论是图表理解过程的一部分,但是并没有给出推论过程发生的细节;(4)没有提及领域知识的问题;(5)Trickett等人指出,这一理论没有涉及到空间转换的概念,对需要空间转换的问题难以理解[18]。

2.2 UCIE的计算机程序

在Pinker图表理解理论的基础上,Lohse采用UCIE的计算机程序来模拟读者使用图表的认知加工过程,对读者提取特定信息的加工过程做出定量预测[19]。Lohse指出图表理解包括以下认知加工过程:(1)早期的视觉加工即检测和编码图表的视觉特征;(2)短时记忆即形成从早期视觉加工过程中获得的视觉描述;(3)短时记忆的信息激发了和长时记忆中记忆痕迹的联系。他使用GOMS(goals, operators, methods, and selection rules)模型和视线追踪技术来研究图表理解的过程,同时考虑到短时记忆容量(3个组块)和持续时间(7s)有限,以及扫描过程中获取信息的难易程度不同等方面的因素,通过使用大量的“认知工程参数”(cognitive engineering parameters)来估计在假定的显示方式下完成一个具体任务所需要的时间。他进行了相关的实验研究,对扫描模式做出了具体的预测,将读者的实际绩效和计算机程序的预测绩效相比较,部分结果支持UCIE模型。

Lohse的UCIE模型为定量预测图表的理解过程迈出了重要的一步。但仍然存在诸多问题:(1)Lohse指出,实验中任务绩效的个体差异非常大,需要额外的研究来解释[19];(2)UCIE模型的预测会受到显示信息复杂程度的影响,Foster指出,这或许是由于UCIE模型使用的是较低水平的操作,而这些较低水平的操作对图表的信息复杂程度的变化比较敏感[20];(3)Meyer指出这个模型不太容易使用,因为它具有大量的认知参数,难以对各种新任务建模[21];(4)没有提供恰当的整合机制。Lohse认为在整合信息的过程中,将出现多次重复扫描的可能性,通过大量的扫描形成类群,把类群联系起来,实现多类群的推理,直到建构完所有的相关类群并做出比较[19]。然而,Ratwani等人的研究表明,图表读者一般是一次性形成类群,然后利用这些信息进行推理[22];(5)同Pinker的图表理解理论一样,UCIE也没有提及领域知识和空间成分。

2.3 知觉与概念加工模型

Carpenter和Shah在前人的基础上提出了图表理解的知觉与概念加工模型[23]。她们将图表理解看作是整合一系列复杂的知觉和概念加工过程,提出了三种类型的加工:(1)模式再认过程,即编码图表中主要的视觉模式,如线条是直的还是锯齿状的,是否有多条,它们之间是平行的还是交叉的关系。准确的编码是图表理解的前提条件;(2)模式解释过程,即对视觉模式的代码进行操作,将视觉特征转换为它们所表征的概念关系,并提取出定性、定量的关系。这些过程包括提取和视觉模式相联系的知识,如上行曲线表示增函数。当视觉模式容易激发适当的数量概念的时候,图表的理解就变得相对容易,然而,有些数量的或函数的信息获取需要复杂的推论过程;(3)整合过程,即将这些数量关系和从标签、标题中推论的指代物联系起来,包括确定被量化概念的指代物,将这些指代物和已编码的函数联系起来。指代过程的一个方面就是标定过程,包括阅读坐标轴上的图例和数量值,并将它们和相应的线条和数据点联系起来。标定过程很可能与模式再认、相关概念知识的提取发生交互作用。

Carpenter和Shah采用视线追踪技术来考察图表加工过程中涉及的认知过程,明确提出应将知觉加工和概念加工结合起来[23]。实验结果表明,图表理解需要读者阅读和重读坐标轴和图标区以获得的必要信息,而且人们并不总是能够保持从这些区域所获得的信息。她们的研究为图表中不同区域的设计提供了一定的心理学依据。

此外,认知过程模型还包括Cleveland和McGill提出的图表知觉模型(graph perceptional Model)[24,25],Gillan和Lewis提出的人-图表交互的成分模型(componential model)中的混和算法知觉(mixed arithmetic perceptual,简称为MA-P)模型[26],Meyer提出的视觉搜索模型(visual search model)[21],Gillan和Callahan提出的人-图表交互的成分模型中饼图的锚定-对齐-调整模型(anchor- align-adjust model)[27],Hollands和Spence提出的用于条图和饼图中数量辨别任务的递增估计模型(the incremental estimation model)[28],Freedman和Shah提出了基于知识的图表理解模型(a model of knowledge-based graph comprehension)[29]以及Katz等人提出的图表理解中的视觉组块假说(the visual chunks hypothesis)[30]。

3 计算模型

Peebles和Cheng对基于图表推理(graph-based reasoning,简称为GBR)的模型予以扩展,提出了计算模型[31,32]。

GBR模型(参见文献[31,32])类似于Lohse的UCIE的计算机程序,不同之处在于它认为图表推理过程中的读者行为是推理者的知觉技巧、所使用图表特性和任务的特定要求三者交互作用的函数。它假设,对于一个特定的信息提取任务,有经验的读者将利用一种程序来获得眼跳序列和对目标任务的固视信息。最终的扫描路线是否是最优的,或多或少依赖于被试有关图形的一般知识、对任务类型的熟悉程度以及完成任务所需的概念和程序。GBR模型也存在一定的局限性:(1)最优路线的假设掩盖了个体水平上重要的认知和策略因素的影响,例如,在加工的过程中,读者可能需要权衡额外的眼动与减少工作记忆负荷的策略性决策;(2)有关时间的预测停留在陈述性的水平上,需要更强有力的模型来产生定量的结果。

Peebles和Cheng以认知理论为基础,将GBR模型与具体化认知(embodied cognition)、执行加工/交互控制(executive process/interactive control)和ACT理性知觉运动(ACT rational perceptual motor)相结合,提出了图表理解的计算模型。这一模型能够结合并测试相关的认知因素(如陈述性和程序性的知识、所采取的策略和工作记忆的局限性)以及知觉运动因素(如鼠标的运动和视觉注意的转移)。与其他的认知任务分析方法一样,计算理论结合了成分单元任务执行潜伏期的假设,能够准确预测完成单一任务的时间。此外,计算模型还能够提供解释任务的重要的足够的证据,包括学习机制,可以模拟练习对绩效的影响。

计算模型不仅仅涉及图表理解中人的认知过程,还涉及到人在完成任务过程中的知觉运动因素,它将人-图表-任务看作一个系统,在认知-人造物-任务(cognition-artifact- task)的系统框架下来探讨人-图表-任务之间复杂的交互行为,并进行计算机模拟。这一模型对于简单任务(如,单值提取)绩效的预测已经相当完美,但是它难以预测复杂任务(如整合任务、推论任务)的绩效。

4 层次框架模型

上面所论述的规则模型、认知过程模型和计算模型主要集中在从显示数据点相对较少的简单图形中进行数据直接读取(如单值读取)和数据间读取(如差异比较、确定趋势等)的操作。然而,现实生活中的图表使用还涉及更复杂的信息提取过程,如股票分析家和气象预报员不仅要确定当前的数值,还要对未来的数值进行预测[33]。Trickett等人发现,以往的图表加工模型能够准确地解释简单图表和复杂图表中的数据直接读取问题;但是当应用于整合问题时,在解释读者如何从含有多个数据点的复杂图表中整合信息进行数据间读取,特别是对数据间读取的任务绩效进行预测时出现了困难;此外,更重要的是以往的图表加工模型也不能解释推论过程,因为推论需要读者超越外显呈现的数据进行数据外读取[18]。

针对以往图表加工理论模型的不足,Ratwani等人提出了层次框架模型(hierarchical framework model)[17,34,35]。这一模型认为,(1)从图表中提取信息的复杂性是有层次的,数值读取是最简单的信息提取任务,其次是整合与推论;(2)提取不同类型信息所需要的认知过程随着任务的难度以层次的形式逐渐提高的,读取数值是最基本的信息提取任务,复杂的信息整合任务除了需要简单地读取信息之外,还需要进行空间转换(spatial transformation)。空间转换是指对图表的数据进行的心理操作,例如,为了做出比较,需要在心理上将一条线移动到另一条线上,空间转换允许图表读者结合图表的不同区域,这一操作可以帮助读者比较量值和预测趋势[18],Feeney和Webber也指出,人们在执行图表理解任务时,应该尽可能自发地产生与空间特性有关的模拟表征(analogical representation)[36];(3)为了做出推论,图表读者不仅要使用整合过程,还需要使用模式外推(pattern extrapolation)和心理模型(mental model)。模式外推是指图表读者先考察已知的数据点,然后在这些数据点所组成模式的基础上做出推论;心理模型也能够用来做出推论。Trafton等人表明,当从可视化的气象图中做出推论时,气象专家能够形成定性的心理模型[33];(4)其他的一些因素如知识经验、认知努力等也会影响心理操作的执行。尽管层次框架模型指出图表读者在提取不同类型的信息时会使用不同的认知过程,但这并不是必然的,由于认知经济原则,图表读者会尽可能地使用最简单的过程去提取所需要的信息。例如,当整合信息时,如果可能的话,图表读者主要还是使用读取信息的操作,因为读取信息是最简单的信息提取方式,与空间转换相比需要的认知努力非常少。

图表加工的层次框架理论目前还处在起步阶段,还有许多的问题需要解决。例如图表读者是如何从不同类型的图表中获取信息的?如何整合这些信息并做出推论的?在获取信息、整合信息并做出推论的过程中进行了哪些心理操作?获取信息、整合信息和做出推论所需要的心理操作有何区别与联系?读者如何进行空间转换?如何形成心理模型?后续的研究有必要结合口语报告和视线追踪技术,进一步探讨上述问题,以完善现有的理论。

5 小结

综上所述,图表加工理论的发展可以分为两个阶段。第一个阶段提出了规则模型、认知过程模型和计算模型。最初的规则模型侧重于图表设计的原则,由强调图表显示的视觉特性(分析模型)发展到强调图表和任务的关系(兼容模型)。认知过程模型侧重于图表理解涉及的认知过程,由定性的认知过程描述(Pinker的图表理解理论和Carpenter等人的知觉与概念加工模型)发展到认知过程的定量预测(Lohse的UCIE的计算机程序和Peeble等人的计算模型)。计算模型不仅强调了对认知过程的定量预测,而且在人-图表-任务这一广阔的背景下来考察人-图表之间的交互作用。到目前为止,第一阶段的发展成果卓著,实现了对图表理解过程的定量预测和计算机模拟。第二个阶段提出了层次框架模型。这一模型是第一阶段模型的扩展,目前还刚刚起步,侧重于从复杂图表中来提取信息并做出推论以回答高度整合的任务,代表了未来图表加工理论的发展趋势。因此,在未来的研究工作中,在完善定量显示的信息提取模型的同时,有必要把工作重心转移到发展与完善层次框架模型上。图表加工研究的未来发展方向将可能主要表现在以下三个方面。

首先,在研究广度方面,所研究的图表不再仅仅局限于静态的、二维的、简单的图表。目前,已有少数研究者开始涉及动态的[37]、三维的[38]、复杂的[39](如动画、股票走势图、天气预报图等)图表研究。在未来的研究中,研究者可能会更关注对动态的、三维的、复杂的图表的研究,考察图表读者在动态的、三维的、复杂的图表中提取、加工和推论信息的特点和规律。同时,由于所研究图表复杂性的增加,需要注重图表读者的知识经验对图表加工的影响。专家具备专业知识的优势,他们对图表中信息的获取、加工特别是做出推论的方式可能不同于新手,这也是未来研究需要探讨的一个问题。

其次,在研究深度方面,从重视图表阅读绩效转向探索图表表征机制,以及图表和文本信息的整合机制。以往研究试图寻求适合不同任务的最佳的图表显示方式,而很少关注图表表征的机制。图表是一种重要的信息表征方式,对图表表征机制的探索必定能进一步深化人们对图表加工过程的理解,而且人们对图表的加工与对其他相关的信息(如文本信息、音频信息等)的加工关系密切,因此,未来的研究不仅要考察图表表征机制,也要考察与之相关的背景信息或上下文信息的作用。近期研究已开始涉及图表和文本信息的整合机制问题。Hegarty曾给被试呈现描述滑轮系统的文本和图片,观察其注视点的变化,结果发现,被试阅读有图片伴随的文本时,其理解过程在很大程度上是以文本导向的,观察图片是为了构建他们在最近阅读文本的过程中获得的信息的表征[40]。Rayner等人考察了被试阅读印刷广告(既有文本,也有图片信息)的过程,结果发现,被试并没有在广告的图片和文本之间交替注视,而是倾向于先阅读大的印刷区,然后阅读小的印刷区,最后才看图片[41]。

最后,在研究方法方面,将综合运用多重数据采集技术。在研究的初期阶段,可以采用观察、问卷和访谈等传统的方法来了解在不同任务条件下读者对图表形式的需求。在正式实验阶段,可以采用严格控制的实验室研究,记录被试回答相关问题的反应时、正确率。在未来对复杂图表加工的研究中,还将重视使用口语报告和视线追踪技术,甚至对被试完成任务的行为摄像,然后进行动作分析。口语报告尽管有其不足之处,但是在研究读者有意识的信息获取、加工等高级的心理过程方面仍然具有一定的优势。重要的是,我们可以将读者的口语报告作为一个指标,与其他的客观指标如反应时、正确率相结合,以探讨读者获取、加工信息的特点和规律。视线追踪技术能够对读者认知活动提供相对应的实时测量,在探讨读者获取、加工和推论图表信息的细节方面有其优势。在研究过程中,可以记录被试在图表不同区域的注视持续时间、注视次数、区域内和区域间的眼跳距离、扫描路线等指标。研究表明,读者在获取、加工和推论图表信息的过程中有其相应的眼动模式,不同的眼动模式反映了被试加工过程中的不同状态。例如,注视时间的长短、注视次数的多少在一定程度上能够反映被试加工信息时认知负荷的高低,眼跳的距离在某种程度上能够反映被试的知觉广度和所要加工的信息密度[41]。根据读者的眼动模式可以揭示图表加工过程中所包含的认知成分,从而增进人们对图表加工过程的理解。

参考文献

[1] Best L A, Smith L D, Stubbs D A. Graph use in psychology and other sciences. Behavioral Processes, 2001, 54: 155~165

[2] Spence I, Wainer H. William Playfair: A daring worthless fellow. Chance, 1997, 10: 31~34

[3] C D 威肯斯, J G 霍兰兹著. 朱祖祥等译. 工程心理学与人的作业. 第三版. 上海:华东师范大学出版社,2003. 144~188

[4] Risden K, Czerwinski M P. An initial examination of ease of use for 2D and 3D information visualizations of web content. Int. J. Human-Computer Studies, 2000, 53: 695~714

[5] Cheng P, Cupit J, Shadbolt N. Supporting diagrammatic knowledge acquisition: an ontological analysis of Cartesian graphs. Int. J. Human-Computer Studies, 2001, 54: 457~494

[6] Rayner K, Rotello C M, Stewart A J. Integrating Text and Pictorial Information: Eye Movements When Looking at Print Advertisements. Journal of Experimental Psychology: Applied, 2001, 7(3): 219~226

[7] Bertin J. Semiology of graphics. Preface to the English Edition, Madison, WI: University of Wisconsin Press, 1983, 省略/bboard/q-and-a-fetch-msg?msg_id=0000S0&topic_id=1

[8] Gillan D J, Richman E H, Minimalism and the syntax of graphs. Human Factors, 1994, 36: 619~644

[9] Kosslyn S M. Understanding charts and graphs. Applied Cognitive Psychology, 1989, 3: 185 ~ 226

[10] Zhang J. A representational analysis of relational information displays. International Journal of Human- Computer Studies, 1996, 45: 59~74

[11] Vessey I. Cognitive fit: a theory-based analysis of the graphs versus tables’ literature. Decision Sciences, 1991, 22: 219~240

[12] Vessey I. The effect of information presentation on decision-making: a cost-benefit analysis. Information & Management, 1994, 27: 103~119

[13] Wickens C D, Andre A D. Proximity compatibility and information display: effects of color, space and objectiveness on information integration. Human Factors, 1990, 32: 61~78

[14] Wickens C D, Carswell C M. The proximity compatibility principle: its psychological foundation and its relevance to display design. Human Factors, 1995, 37: 473~494

[15] Renshaw J A, Finlay J E, Tyfa D, Ward R D. Understanding visual influence in graph design through temporal and spatial eye movement characteristics. Interacting with Computers, 2004, 16: 557~578

[16] Pinker S. A theory of graph comprehension. In: R Freedle (Ed.), Artificial intelligence and the future of testing. Hillsdale, NJ: Erlbaum, 1990. 73~126

[17] Ratwani R M, Trafton J G. Real World Graph Comprehension: High-Level Questions, Complex Graphs, and Spatial Cognition. Under Review, 2004, archlab.gmu.edu/~rratwani/real_world_graph _comprehension .pdf

[18] Trickett S B, Trafton J G. Use of Spatial Transformations in Graph Comprehension. Cogsci2004, cogsci.northwestern.edu/ cogsci2004/ma/ma353.pdf

[19] Lohse G L. A cognitive model for understanding graphical perception. Human-Computer Interaction, 1993, 8(4): 353 ~ 388

[20] Foster M E. Evaluating Models of Visual Comprehension. Cogsci2003, hcrc.ed.ac.uk/comic/documents/ publications/ foster-eurocogsci-2003.pdf

[21] Meyer J. Performance with tables and graphs: Effects of training and a visual search model. Ergonomics, 2000, 43(11): 1840~1865

[22] Ratwani R M, Trafton J G, Boehm-Davis D A. Thinking graphically: Extracting local and global information. In: R Alterman, D Kirsch (Eds.), 25th. Annual Meeting of the Cognitive Science Society. Boston, MA: Erlbaum. 2003, archlab.gmu.edu/~rratwani/Thinking_Graphically.pdf

[23] Carpenter P A, Shah P. A model of the perceptual and conceptual processes in graph comprehension. Journal of Experimental Psychology: Applied, 1998, 4: 75~100

[24] Cleveland W S, McGill R. Graphical Perception and Graphical Methods for Analyzing Scientific Data. Science, 1985, 828~833

[25] Cleveland W S. A model for studying display methods of statistical graphics. Journal of Computational and Graphical Statistics, 1993, 2: 323~343

[26] Gillan D J, Lewis R. A Componential Model of Human Interaction with Graphs: 1.Linear regression modeling. Human Factors, 1994, 36: 419~440

[27] Gillan D J, Callahan A B. A Componential Model of Human Interaction with Graphs: VI. Cognitive Engineering of Pie Graphs. Human Factors, 2000, 42: 566~591

[28] Hollands J G, Spence I. The Discrimination of Graphical Elements. Applied cognitive psychology. 2001, 15: 413~431

[29] Freedman E G, Shah P. Toward a Model of Knowledge-Based Graph Comprehension. In: M Hegarty, B Meyer, N Hari Narayanan (Eds.): Diagrams 2002, LNAI 2317, 2002. 18~30

[30] Katz I R, Xi X, Kim H, Cheng P. Elicited Speech From Graph Items on the Test of Spoken English. TOEFL Research Reports, Report 74 February 2004, ftp.省略/pub/toefl/990114.pdf

[31] Peebles D, Cheng P. Extending task analytic models of graph-based reasoning: A cognitive model of problem solving with Cartesian graphs in ACT-R/PM. Cognitive Systems Research, 2002, 3: 77~86

[32] Peebles D, Cheng P. Modeling the Effect of Task and Graphical Representation on Response Latency in a Graph Reading Task. Human Factors, 2003, 45(1): 28~45

[33] Trafton J G, Trickett S B. A New Model of Graph and Visualization Usage, In: J D Moore, K Stenning (Eds.), Proceedings of the 23rd Annual Conference of the Cognitive Science Society. Mahwah, NJ: Erlbaum. 2001, aic.nrl.navy.mil/~trafton/papers/graph-comprehension.pdf

[34] Ratwani R M, Trafton J G, Boehm-Davis D A. From Specific Information Extraction to Inferences: A Hierarchical Framework of Graph Comprehension. HFES, 2004, archlab.gmu.edu/~rratwani/HFES. Hierarchical _framework.pdf

[35] Ratwani R M, Trafton J G. Making Graphical Inferences: A Hierarchical Framework. Cogsci2004, cogsci.northwestern.edu/cogsci2004/papers/paper376.pdf

[36] Feeney A, Webber L. Analogical Representation and Graph Comprehension. Lecture Notes in Computer Science, 2003, 2733: 212~221

[37] Tversky B, Morrison J B. Animation: can it facilitate? Int. J. Human-Computer Studies, 2002, 57: 247~262

[38] Kumar N, Benbasat I. The Effect of Relationship Encoding, Task Type, and Complexity on Information Representation: an Empirical Evaluation of 2D and 3D Line Graphs. MIS Quarterly, 2004, 28 (2): 255~281

[39] Belcher D, Billinghurst M, Hayes SE, Stiles R. Using Augmented Reality for Visualizing Complex Graphs in Three Dimensions. ISMAR 2003, 省略/ fileman_store/2003-ISMAR-ComplexGraphsAR.pdf

[40] Hegarty, M. Mental animation: Inferring motion from static displays of mechanical systems. Journal of Experimental Psychology: Learning, Memory, and Cognition, 1992, 18:1084~1102

[41] Rayner K, Rotello C M,Stewart A J,Keir J, Duffy S A. Integrating Text and Pictorial Information: Eye Movements When Looking at Print Advertisements. Journal of Experimental Psychology: Applied, 2001, 7 (3): 219~226

Review on Graph and Table Processing Theories

Ren Yanju 1,2Fu Xiaolan 1

(1 State Key Laboratory of Brain and Cognitive Science, Institute of Psychology, Chinese Academy of Sciences, Beijing 100101, China)

(2 Graduate School, Chinese Academy of Sciences, Beijing 100039, China)

Abstract: Graph and table, as important information representation modes, had been applied broadly. Graph and table processing refer to human cognitive processing of information in graph and table. Firstly, the article reviewed rule model, cognitive process model, and computational model; secondly, it commented the hierarchical framework model which had been put forward in 2004; and finally, it summarized the graph and table processing theories and pointed out research directions in the future.

Key words: graph and table processing, rule model, cognitive process model, computational model, hierarchical framework model.

收稿日期:2005-03-03

计算机视觉的主要任务范文4

一、以强化政治意识为立足点,加强思想道德建设

在当前审计任务越来越重、压力越来越大的新形势下,审计干部只有保持清醒的政治头脑,具有正确的政治思想、坚定的政治立场、敏锐的政治观察力和鉴别力,才能把握住审计工作方向,从而推动审计工作创新发展。为此,紧密联系实际,组织广大审计干部认真学习邓小平理论和“三个代表”重要思想,学习科学发展观和构建社会主义和谐社会等一系列重大战略思想,进一步坚定理想信念,树立正确的世界观、人生观、价值观和全心全意为人民服务的公仆意识。增强政治意识、责任意识和政治敏锐力。坚持以开展党风党纪、勤政廉政和职业道德为主要内容的经常性思想教育,强化律已意识和法制观念,时刻保持清醒的头脑。自觉践行社会主义荣辱观,严格遵守各项政策纪律,热爱审计工作,忠于审计事业。努力培养审计人员树立“依法审计,客观公正”的职业道德,坚持社会主义核心价值体系,自觉执行审计纪律,秉公执法,廉洁从审,切实维护审计机关清正廉洁、客观公正的良好形象。

二、以提升审计手段为突破点,加强审计信息化建设

随着现代科学技术特别是信息技术的迅猛发展和各类领域的广泛应用,审计手段发生了深刻的变化。为适应这一需要,始终坚持与时俱进,以新的视角认识问题,以新的思路指导建设,以推动审计信息化建设向更高层次发展,实现审计手段现代化的目标。在全面推广应用AO系统开展项目管理和数据分析的同时,加大审计方法的研究力度。在学习运用OA操作,不断完善OA系统,实现局域网互联互通的同时,高度重视审计信息资源的开发利用,促进审计信息资源管理水平不断提高,为审计工作提供强有力的技术支撑。重视人才的培训,进一步加大培训力度,在继续抓好审计署组织的计算机技术初级应用水平考试的基础上,采取“走出去、请进来”的方式,一方面每年选送2~3名审计人员参加上级审计机关举办的计算机软件应用培训,另一方面邀请地方高校或科研单位的计算机专家教授搞讲座、做辅导,提高全体审计人员的计算机操作应用水平。重视计算机软件的开发应用,鼓励自主创新,充分发挥专业技术人才的作用,切实解决计算机审计中遇到的各种难题。积极探索实行联网审计,资源共享,研究建立联网审计操作规程和质量控制措施,切实提高信息化审计水平。同时,要经常注意对网络及设备进行全面有效地清查,进一步完善网络安全防护体系,确保信息传输、处理和储存的安全保密,更好地开展审计工作。

三、以提高业务素质为关键点,加强审计干部队伍建设

审计干部队伍建设,是决定审计事业发展的基础和关键。把干部队伍建设摆上重要议事日程,按照总理提出的“建设一支作风过硬、经得起考验、高素质的审计队伍”的要求,狠抓审计干部队伍整体素质的提高,为审计事业的发展提供更为有力的支撑。一是注重整体优化,打牢组织基础。着眼新形势下审计监督职能和任务的需要,从优化组织结构入手,抓好队伍建设,改善审计人员素质和能力结构,有效地保障监督职能作用的发挥。在人员使用上,注意有序流动,适时进行内部调整交流,实行岗位轮换,把优秀人才用到重要岗位上,有效增强干部队伍的生机和活力。二是搞好业务培训,打牢业务基础。建设团结、务实、廉洁、高效审计干部队伍,使审计人员具有宽厚的理论知识、丰富的高科技知识和扎实的业务技能。因此,加大培训力度,鼓励支持他们参加各种业务培训和在职自学,不断提高审计业务水平。三是加强理论研究,打牢能力基础。加强审计理论研究是探索新形势下审计工作特点规律的迫切需要,也是审计机关实施科学决策的重要保证。引导审计干部注意在工作落实中总结经验教训,在总结分析中自我提高,把握特点规律,善于把工作实践变成理性思考,以理论研究的成果推动审计工作创新发展。四是改进机关作风,打牢效能基础。自觉践行总书记倡导的八个方面的良好作风,全面加强审计机关作风建设,大力弘扬“依法、求实、严谨、奋进、奉献”的审计精神,倡导谦虚谨慎、文明审计的作风,提倡艰苦奋斗、勤俭节约的作风,培养求真务实、严谨细致的作风,保持良好的精神风貌。

四、以争做人民满意公务员为着眼点,加强党风廉政建设

党风廉政建设是审计工作的生命线。总理指出,人民信任审计机关,把重任交给审计机关,同时也关心和注视着审计机关,这就需要严格要求,自身要正、自身要严。坚持从严治理审计队伍,深入开展警示教育,做到防微杜渐、警钟长鸣、生活正派、情趣健康,自重、自醒、自警、自励,不断夯实廉洁从审的思想道德基础,筑牢拒腐防变的思想防线。按照“为民、务实、清廉”的要求,严格执行审计纪律和各项廉政规定,认真落实审计署和省厅关于加强审计机关自身建设的各项要求。审计干部要树立正确的权力观、地位观和利益观,自觉做到以公仆之心对待权力,以平常之心对待地位,以奉献之心对待事业,向党和人民交出一份干事创业、清正廉洁的合格答卷。大力培育和弘扬“热爱祖国、忠于人民、恪尽职守、廉洁奉公、求真务实、开拓创新、顾全大局、团结协作”的公务员精神,争做人民满意的公务员。

五、以提高机关管理水平为落脚点,加强审计制度建设

计算机视觉的主要任务范文5

关键词: 中职教育 计算机教学 高校课堂

近年来,由于中职学校入学门槛不断降低,导致所招收的学生整体素质较低。中职生课堂表现为学习积极性不高,上课睡觉、玩手机、上网聊天、玩游戏……学生专业能力不强,专业素质不高,就业难以对口,同时在校学生不断流失。中职学校计算机专业面临很大危机,必须进行教学改革,提高教学质量。创建中职生计算机高效课堂,可从以下方面着手。

一、教师要提高自身业务素质

教育之计,教师为本,学校教育质量,主要取决于师资队伍的素质。计算机的发展日新月异,教师必须不断学习新的知识,提高自身能力及素质。

(一)加强学习,充实自身专业知识。

计算机学科的特点决定了计算机教师要树立终身学习的思想,时刻充实自己,掌握新知识,掌握计算机行业新动态、新情况,甚至要求自学、钻研新课程,努力掌握新技术、新方法,充实自身的专业知识。

(二)积极参加企业实践锻炼,提高综合素质能力及职业能力。

一个合格的中职计算机教师不仅要有坚实的计算机专业理论、知识功底,而且要有丰富的计算机操作技能、经验,跟上计算机技术发展的步伐。要做到这一点,计算机老师必须积极参加企业实践锻炼,了解市场需求,提高综合素质能力及职业能力。只有这样,才能满足市场需求,培养出合格的毕业生,适应用人单位的要求。

(三)积极从事科研,提高科研能力。

从事科研,将是21世纪教师区别于以往教师的一个显著标志。教师要具备一定的研究能力,善于把教学中遇到的实际问题作为研究课题,在教学实践中加以分析和研究,最终找到解决问题的最佳途径。

二、更新教学观念

在新课程理念下,教师必须改变传统的教学观念,充分认识到培养创新能力和自学能力的重要性,树立以培养学生主动获取知识与发展能力为目标的现代教育教学观念。在教学中,教师要充分应用启发式、讨论式、参与式的教学方法,把比知识更有用的即如何获得新知识的方法教给学生,营造良好的学习氛围,激发学生的学习热情,调动学生的学习积极性,发展学生的智力,开拓学生思维,培养学生勇于探索的创新能力,让学生体会到自主学习的乐趣。

三、培养学生兴趣

兴趣是最好的老师。在教学过程中,要让学生轻松、愉快、主动、高效地学习,关键是培养学生的学习兴趣。

(一)建立“主动学习”的精神需要。

要让学生积极投入到计算机课程的学习中,就应该在课程一开始快速建立对课程的精神需要。只有使学生建立起了主动学习课程的精神需要,才能从“我要学生学”变成“学生自己要学”。

(二)深化认识学习,培养学生对课程的情感。

当学生对课程的精神需要建立起来后,接下来就要深化学生对课程的认识和理解,继而对这门课程产生情感,只有这样学生的学习兴趣才会更浓厚。

(三)重视学生,赏识学生,鼓励学生,培养良好的师生情感。

师生情感在教学过程中是不可忽视的,利用师爱效应,可以激发学生的学习兴趣。大部分中职生在初中都是后进生,对学习缺乏信心。老师要关心爱护、重视、赏识、鼓励,发现他们有进步,就要及时给予肯定和鼓励。学生会认为老师很重视他,“亲其师,信其道”,不自觉地会偏爱其所教的学科,产生浓厚的学习兴趣。

四、采用先进的教学方法,创建高效课堂

(一)熟练运用“任务驱动”教学法。

美国教育家杜威说:“教学的艺术不在于传授的本领,而在于激励、唤醒、鼓舞。”只要调动学生的学习积极性,让他们自觉投身到计算机实践中,在参与中获得成功的喜悦,就能大大提高课堂教学效率。“任务驱动”的教学模式,正是具备这样的特点,在目前的中职教学中展示着旺盛的生命力。“任务驱动”教学法可称之为“单刀直入法”或“黑箱方法”。“任务驱动”法的一个显著特征是:教师的教学与学生的学习都是围绕一个目标,基于几项任务完成的,适合培养学生的自学能力和相对独立分析问题、解决问题能力,尤其适用于计算机课程的教学和学习。因此,教师要熟练运用这种教法。

(二)运用“发现式”教学法,注重培养学生自主获取知识的能力。

“发现教学法”是美国著名的教育家布鲁纳提出的。它是指教师在学生学习概念和原理时,不是将学习的内容直接教给学生,而是创设一种问题情境,给学生一些事例和问题,让学生积极思考,独立探究,自行发现并掌握相应的原理和结论。

在多年的计算机教学实践中,我感觉将“发现式”教学法运用于计算机教学中可培养学生独立思考、自行发现并掌握知识的能力与探究问题的能力。所以,在教学中,我尝试运用“发现式”教学法,努力让学生在练中学、学中练,在发现、质疑、解决问题中进步,在合作、探究、互助中培养创新思维和自主学习能力。

(三)实施“行为导向型”教学法。

所谓行动导向,是指学习是个体的行动,学生是学习的行动者,教师是学习行动的组织者、引导者、咨询者,为了“行动”来学习并通过“行动”来学习,从而实现“手脑统一”。行动导向教学法在教学中重视“案例”教学,重视“项目”教学,重视“解决实际问题”及“自我管理式的学习”。这种教学方法的作用在于既使学生更快地掌握专业技能,提高课堂教学效率,又培养学生解决实际问题的方法能力、与人协作共事的社会能力和创新精神。

总之,提高中职计算机课堂教学效率是所有计算机专业教师都必须重视的问题,在中职计算机学科教学中,教师必须转变观念,充分发挥学生的主体地位,调动广大学生的学习积极性、主动性和创造性,提高学生的学习兴趣,这样就能打造高效计算机课堂。

参考文献:

[1]蔡祖科.浅谈中职计算机专业教师教学能力提高的思考.环球市场信息.导报(理论),2011.

计算机视觉的主要任务范文6

关键词:机器视觉;边缘检测;图象识别;滤波算法

中图分类号:TP242 文献标识码:A 文章编号:1674-7712 (2013) 02-0082-01

一、机器人系统的发展及机器人视觉

机器人的发展大致经历了三个成长阶段,也即三个时代。第一代为简单个体机器人;第二代为群体劳动机器人;第三代为类似人类的智能机器人。它的未来发展方向是有知觉、有思维、能与人对话。机器人向着智能化、拟人化方向发展的道路,是没有止境的。 机器人视觉是计算机学科的一个重要分支,它综合了光学、机械、电子、计算机软硬件等方面的技术,涉及到计算机、图像处理、模式识别、人工智能、信号处理、光机电一体化等多个领域。我国机器人视觉应用主要有以下目的:用以代替人类从事危险、有害和恶劣环境、超净环境下的工作;提高劳动生产率,改变产品质量,快速相应市场需求,加强在国际市场的竞争能力。

二、机器人视觉的原理

机器视觉是机器人感知周围环境的主要途径之一。它可以通过视觉传感器获取环境的二维图像,并通过视觉处理器进行分析和解释,进而转换为符号,让机器人能够辨识物体,并确定其位置。目前成熟的光电成像技术都只能捕获二维明暗信息,而不能获得距离信息,所以直接通过这种途径获得的机器视觉也只能是二维的。随着科学技术的发展,三维立体视觉的解决方案也如雨后春笋般涌出,其中就包括双目立体视觉,狭缝光投影法,时间差法等。

(一)实现方法

1.图像的获取与预处理:用于进行三维特征提取的图像是一幅常规的二维灰度图,所以使用一个常规的CCD或CMOS图像传感器即可满足要求。图像需要进行量化处理,即把图像信息分成许多像素点,这些亮点经过A/D转换后即可输入计算机进行处理。2.边缘信息提取:边缘提取算法就是把一副灰度图像转化为二值图像,灰度图像中的轮廓在二值图像中用1表示,而非轮廓位置用0表示。边缘提取算法的种类非常地多,如Robert算子卷积法等。3.边缘检测与轮廓连结:边缘检测主要采用各种算子来发现、强化图像中那些可能存在边缘的像素点。边缘检测算子除了有Roberts算子外,还有索贝尔算子(Sobel operator)和Prewitt算子、高斯偏导滤波器以及Canny边缘检测器等。4.利用线条分类识别三维物体:提取出二维图像的轮廓信息,还不足以分析出其中的三维特征,我们必须对轮廓信息进行进一步的模式化处理,从轮廓中提取特征。5.从二维图像中提取三维特征的局限性:虽然从二维图像中提取图像的三维特征的算法对设备的要求低,处理的数据量相对较小,输出地结果也比较规整。但是这种算法也有其局限性。

(二)摄像机模型及透视技术

透视技术实际是一个非线性映射,这在实际求解时可能需要大的计算量,而且如果透视效果不明显,直接使用该模型可能会使求解变为病态。透视逆变换把三维物体转变为二维图形表示的过程称为投影变换。

三、基于视觉的机器人路径规

针对移动机器人规避障碍和寻找最优路径问题,提出了在复杂环境下移动机器人的一种路径规划方法。采用了栅格法建立了机器人工作平面的坐标系,整个系统由全局路径规划和局部避碰规划两部分组成[8]。在全局路径规划中,用改进蚁群算法规划出初步全局优化路径;局部避碰规划是在跟踪全局优化路径的过程中,通过基于滚动窗口的环境探测和碰撞预测,对动态障碍物实施有效的局部避碰策略,从而使机器人能够安全顺利的到达目标点。这种方法能在较短时间内找到最佳路径并规避障碍。

四、机器人视觉处理程序

机器人视觉处理程序的主要功能包括:(1)从USB摄像头实时读取视频数据,进行简单的预处理;(2)随后进行图像处理,主要完成空域的图像增强。通过对图像进行二值化,将目标小球从背景中提取出来;(3)计算目标的位置,进而计算出机器人头部的旋转角度,通过舵机驱动程序,控制机器人头部转动到目标所在角度,实现对目标物体的跟踪。

经过实验,机器人头部可较好地跟踪目标,实现了视觉原型系统。

(一)机器人视觉的目标与任务

目标:使机器人具有感知周围视觉世界的能力。让机器人具有对周围世界的空间物体进行传感、抽象、判断的能力,从而达到识别、理解的目的。

任务:图象的获取、预处理、图象分割与表示与描述、识别与分类、三维信息理解、景物描述、图象解释。红色部分就构成了图像分析的研究内容。

(二)视觉信息的处理

移动机器人视觉信息的处理通常由图象获取、图象分析、关系描述三部分组成。

五、结束语

移动机器人是目前机器人领域的研究重点之一,吸引着众多学者的注意。机器人的研究涉及到人工智能、控制理论、传感器技术和计算机科学等多门学科。通过阅读大量的期刊、学术论文用于进行三维特征提取的图像是一幅常规的二维灰度图,所以使用一个常规的CCD或CMOS图像传感器即可满足要求。图像需要进行量化处理。为了给形态学处理的图像提供统一的条件,计算机在把获得图像进行形态学处理前,必须先对其进行预处理。由于各方面客观条件以及个人研究能力的限制,在机器人技术中嵌入式系统的应用及视觉处理程序方面的研究还不够深入,还需要在今后的研究中不断深入探讨。21世纪是信息化的时代,随着信息技术的发展和普及,机器人视觉系统无论是在理论研究上上,还是在应用方面都将很大进展。

参考文献:

[1]段峰,王耀南.机器视觉技术及其应用综述[J].自动化博览,2002(3):43-47.

[2]李文锦,吴海彬,何祖恩.基于机器视觉的机械测量及识别技术研究[J].机床与液压,2010(1):32-51.