计算机视觉范畴范例6篇

前言:中文期刊网精心挑选了计算机视觉范畴范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

计算机视觉范畴范文1

【关键词】机器视觉;应用研究

机器视觉是一门涉及人工智能、计算机科学、图像处理、模式识别、神经生物学、心理物理学等诸多领域的交叉学科。机器视觉主要利用计算机来模拟人或再现与人类视觉有关的某些智能行为,从客观事物的图像中提取信息进行处理,并加以理解,最终用于实际检测和控制。随着现代计算机技术、现场总线技术与大规模集成电路技术的飞速发展,机器视觉技术也日臻成熟,已经广泛应用在国民经济发展的各行业。

1.机器视觉系统组成

一个典型的机器视觉应用系统包括图像捕捉、光源系统、图像数字化模块、数字图像处理模块、智能判断决策模块和机械控制执行模块,如图1所示。首先采用CCD摄像机获得被测目标的图像信号,然后通过A/D转换成数字信号传送给专用的图像处理系统,根据像素分布、亮度和色彩等信息,进行各种运算来抽取目标的特征,然后再根据预设的判别标准输出判断结果,去控制驱动执行机构进行相应处理。

总之,随着机器视觉技术自身的成熟和发展,可以预计它将在现代和未来制造企业中得到越来越广泛的应用。

2.机器视觉技术的应用

在国外,机器视觉的应用主要体现在半导体及电子行业,其中大概40%-50%都集中在半导体行业。具体如PCB印刷电路;SMT表面贴装;电子生产加工设备;机器视觉系统还在质量检测的各个方面已经得到了广泛的应用,并且其产品在应用中占据着举足轻重的地位。

而在中国,以上行业本身就属于新兴的领域,再加之机器视觉产品技术的普及不够,导致机器视觉在以上各行业的应用几乎空白。目前随着我国随着配套基础建设的完善,技术、资金的积累,各行各业对采用图像和机器视觉技术的工业自动化、智能化需求开始广泛出现,国内有关大中专院校、研究所和企业近两年在图像和机器视觉技术领域进行了积极思索和大胆的尝试,逐步开始了工业现场和其它领域的应用。

(1)工业中的应用

虽然机器视觉技术从20世纪80年代才开始起步,但由于其突出的优点,在各种工业领域被广泛应用,特别是近几年发展十分迅速,国内外的成果也是层出不穷。

在国外,机器视觉技术广泛应用于机器零部件的装配、非接触测量、产品质量检测、在线过程控制、数控机床加工、过程监控等领域。英国ROVER汽车公司800系列汽车车身轮廓尺寸精度的100%在线检测,是机器视觉系统用于工业检测中的一个较为典型的例子,该系统由62个测量单元组成,每个测量单元包括一台激光器和一个CCD摄像机,用以检测车身外壳上288个测量点。汽车车身置于测量框架下,通过软件校准车身的精确位置。测量单元的校准将会影响检测精度,因而受到特别重视。每个激光器/摄像机单元均在离线状态下经过校准。同时还有一个在离线状态下用三坐标测量机校准过的校准装置,可对摄像顶进行在线校准。检测系统以每40秒检测一个车身的速度,检测三种类型的车身。系统将检测结果与人、从CAD模型中撮出来的合格尺寸相比较,测量精度为±0。1mm。ROVER的质量检测人员用该系统来判别关键部分的尺寸一致性,如车身整体外型、门、玻璃窗口等。实践证明,该系统是成功的,并将用于ROVER公司其它系列汽车的车身检测。

机器视觉在国内的应用主要集中于检测与定位等几个方面,这样的工业产品占据了中国市场的绝大部分。机器视觉在工业检测中的应用最为常见的是对各种机械零件的几何尺寸进行测量,在半导体及电子行业,国内高等院校和科研单位也研究出基于机器视觉的管脚尺寸自动检测装置。此外,机器视觉还被用于对于如刀具等工业设备的检测和数控机床的加工。在很多工业领域存在着高精度定位的问题,如钻床数控系统钻头定位、金属板材数控加工轨迹坐标定位等。目前机器视觉技术由于其高精度的优点在这方面得到广泛的应用。华中科技大学在金属板材数控加工中利用机器视觉技术对加工轨迹坐标定位。提出一种基于机器视觉的非接触式加工轨迹坐标定位方法,完成了金属板材数字化成形中支撑模型的非接触式高精度快速定位。湖南大学进行了钻头视觉定位研究,在视觉定位中采用间接定位方式,间接实现钻头刃磨初始状态的定位。中国计量学院等单位进行了基于机器视觉的PCB数控钻机定位研究。大量的实践证明采用机器视觉系统进行定位并且综合运用数控伺服传动技术以及各种先进控制技术能够有效实现精确定位。利用机器视觉系统节约了大量的人力和物力,降低了产品生产成本。

(2)农业中的应用

计算机视觉技术在农业上的应用研究,起始于20世纪70年代末期,主要应用于植物种类的鉴别、农产品品质检测与分级等。随着计算机软硬件技术、图形图像处理技术的迅猛发展,它在农业上的应用研究有了较大的突破,在农业领域的生产前、生产中、收获时和产后的各个环节中,均可以利用计算机视觉技术来实现这些农业生产的视觉化。计算机视觉在产前的应用主要是检验种子质量;在产中的应用包括田间杂草识别、植物生长信息的监测、病虫害的监视和营养胁迫诊断等方面;在农作物收获时的应用主要体现在农业机器人的研制与开发上;在产后的应用包括水果分级和农产品的加工等。在农田作业机械上,机器视觉技术被不断的开发和应用。农药的粗放式喷洒正是农业生产中效率最低、污染最严重的环节。利用机器视觉技术可以实现农药的精量喷洒,近年来,机器视觉技术在播种机械方面的应用主要是检测播种质量;在自动收获机等农田自动作业机械上,更需要依靠机器视觉系统来确定作物行与机械的相对位置,以控制自动作业机械在作物行间自动行进,

机器视觉技术在农业生产上的应用可提高生产的自动化水平,解放劳动力,具有良好的应用前景。同时还应看到,由于农业对象的特点,机器视觉理论和技术的局限性以及硬件条件的限制,机器视觉技术在农业生产的应用距离实用和普及还有相当长的距离。相信随着相关技术的发展,很多问题会得到好的解决,机器视觉技术在农业生产中的应用会极大地加快农业现代化的进程。

(3)医学上的应用

随着药品和医疗器械安全性问题重要性的不断提升,越来越多的生产厂商将机器视觉技术引入实际生产中来,以达到提高生产效率,加强产品品质保障的目的。同样,在医疗系统中机器视觉也得到了越来越多的应用。

机器视觉科技医药领域的应用主要分为医学与药物两部分。机器视觉技术在医学疾病诊断方面的应用主要体现在两个方面:一是对(X射线成像、显微图片、B超、CT、MRI)图像增强、标记、渲染处理,主要利用数字图像处理技术、信息融合技术对X射线透视图、核磁共振图像、CT图像进行适当叠加,然后进行综合分析协助医生诊断;二是利用专家知识和3D重构对物体三维信息与运动参数进行分析并给出形象准确的解释,如诊断与手术等。机器视觉技术的应用不仅节省了人力,而且大大提高了准确率和效率。在药物方面,机器视觉系统对药用瓶的缺陷检测,也包括了药用玻璃瓶范畴,也就是说机器视觉也涉及到了医药领域,其主要检测包括尺寸检测、瓶身外观缺陷检测、瓶肩部缺陷检测、瓶口检测等。除此之外,对药剂杂质的检测、对医学用具质量的检测、对药物外包装泄露的检测等等都在保障着药物的质量安全,保障着人们的生命健康。

(4)交通领域的应用

随着计算机的普及和相关软件的不断更新升级,机器视觉技术在交通领域所发挥的作用愈为重要。机器视觉技术在交通领域的应用范围较广,主要包括视频检测系统、智能车辆的安全保障系统、车牌识别和交通指挥等。

视觉技术应用于视频检测时,视频检测系统的目标就是用数字图像处理和计算机视觉技术,通过分析交通图像序列来对车辆、行人等交通目标的运动进行检测、定位、识别和跟踪,

并对目标的交通行为进行分析、理解和判断,从而完成各种交通流数据的采集、交通事件的检测,并尽快进行相应处理。视频的交通事件和参数检测系统有高度的网络化和智能化,可实现远程监控和设置。视觉技术应用于智能车辆安全保障系统,主要用于路径识别与跟踪、障碍物识别、驾驶员状态监测、驾驶员视觉增强等。德国UBM大学Dick-manns教授领导的智能车辆研究小组一直致力于动态机器视觉领域的研究,研制的EMS-Vision视觉可较好地模拟人眼功能。车牌识别技术(VLPR)是计算机视觉和模式识别技术在现代智能交通系统中的一项重要研究课题,是实现交通管理智能化的重要环节。随着图像处理技术的日趋成熟,更多算法的融入综合,使得车牌识别技术逐渐成熟。单一算法很难达到良好的识别效果,只有多种方法结合,才能实现车牌识别的高效性和准确性。过去的10多年里,有些国家已经成功开发了一些基于视觉的道路识别和跟踪系统。其中,具有代表性的系统有:LOIS系统、GOLD系统、RALPH系统、SCARF系统和ALVINN系统等。

机器视觉技术在交通各领域都发挥着越来越重要的不可替代的作用。在取得较大成绩的同时仍有不足。其一应尽快开发出具有高性价比的实用化的激光距离成像系统,能够获取高质量的原始图片至关重要;其二,处理各种交通事件的及时性决定了所有的图像处理的速度应尽可能的快,目前的各种算法都各有优劣,如何能在最短的时间内完成图像的识别工作成为我们下一步要努力的方向。

3.发展趋势

在机器视觉赖以普及发展的诸多因素中,有技术层面的,也有商业层面的,但制造业的需求是决定性的。制造业的发展,带来了对机器视觉需求的提升;也决定了机器视觉将由过去单纯的采集、分析、传递数据,判断动作,逐渐朝着开放性的方向发展,这一趋势也预示着机器视觉将与自动化更进一步的融合。未来,中国机器视觉发展主要表现为以下一些特性:

(l)随着产业化的发展对机器视觉的需求将呈上升趋势。

(2)统一开放的标准是机器视觉发展的原动力。

(3)基于嵌入式的产品将取代板卡产品。

(4)标准化一体化解决方案是机器视觉发展的必经之路。

(5)机器视觉系统价格持续下降、功能逐渐增多。

4.结语

机器视觉技术经过20年的发展,已成为一门新兴的综合技术,在社会诸多领域得到广泛应用。大大提高了装备的智能化、自动化水平,提高了装备的使用效率、可靠性等性能。随着新技术、新理论在机器视觉系统中的应用,机器视觉将在国民经济的各个领域发挥更大的作用。

参考文献

[1]李福建,张元培.机器视觉系统组成研究[J].自动化博览,2004(2):61-63.

[2]范祥,卢道华,王佳.机器视觉在工业领域中的研究应用[J].现代制造工程,2007(6):129-133.

[3]张萍,朱政红.机器视觉技术及其在机械制造自动化中的应用[J].合肥工业大学学报(自然科学版),2007, 30(10):1292-1295.

[4]马彦平.计算机视觉技术在农业生产中的应用与展望[J].中国农业资源与区划,2009,30(4):21-27.

[5]饶秀勤.基于机器视觉的水果品质实时检测与分级生产线的关键技术研究[博士学位论文].杭州:浙江大学,2007.

[6]冯新宇,庞艳辉.车牌识别技术实现方法初探[J].交通科技与经济,200712:50-511.

[7]徐琨,贺昱曜,王夏黎.基于背景模型的运动车辆检测算法究[J].微计算机信息,2007,4-1:120-1211.

计算机视觉范畴范文2

海淀青少年活动中心明确了“聚合、融通、创新、服务”的理念,打造了阳光少年系列品牌活动,充分发挥校外教育的优势。

1.一个活动多重收获

在活动的设计中,我们注重充分挖掘同一活动在不同层面的教育价值,让学生在一个活动中有多重收获。例如,在“走进中科院计算技术研究所”活动中,从历史的角度,学生了解了我国计算技术的发展史;从科技的角度,学生认识了虹膜识别、语音识别、人脸识别、计算机视觉、3D打印技g等;从思想认识的角度,学生知道了虽然我国的计算机技术发展很快,但是,比起世界发达国家还有差距,学生应该自觉地承担起对民族、对国家的责任。

我们还组织了陶泥创作、创意美术等很多活动,让学生们在提高动手能力的同时,学习到什么是“工匠精神”,也感受到“美”是需要创造、需要尊重的。

2.满足兴趣与正确引导相结合

服务学生个性化发展是校外教育的重要任务。为此,活动中心利用自身资源优势,主动了解区域内学生的兴趣爱好和个性发展需求,开设了涵盖科技、艺术、体育三大类共五十余种兴趣课程,让学生根据自己的兴趣爱好和特长,自主选择并参加自己喜爱的兴趣小组活动。同时,活动中心不定期组织比赛、交流、参观、学习等实践活动,在活动中锻炼青少年的交往沟通能力、突发事件应对能力,督促他们严格要求自己、锻炼自己,培养优良道德品质,做到知行结合。例如,音乐小组成员及家长们来到距北京市区158公里的涞水县汤家庄庆恩小学进行扶贫慰问,感受山区孩子的生活,学会感恩父母;舞蹈小组成员们走进北京市心灵呼唤艺术团,以舞交流,在舞蹈中懂得热爱生命。

3.整合社会资源,坚持活动育人

计算机视觉范畴范文3

关键词: 机器视觉;系统组成;选型方法

中图分类号:TN949.199文献标识码:B

Machine Vision System Design Method

WANG Yun-zhe, BAI Yan-bing, ZHANG Bo

(The 2nd Research Institute of China Electronics Technology Group Corporation, Taiyuan Shanxi, 030024, China)

Abstract: The article introduces the conception and the developmental process of machine vision system, the component and fundamental theory of machine vision, expatiates on main points of designing machine vision system, classifying, choosing type, enumerates the most of manufacturers in the field of machine vision system in china.

Keywords: machine vision; system components; selection method

引 言

视觉是人类认知世界的重要手段,人类通过视觉感知外部世界信息,再通过大脑进行相应的判断,做出相应的动作。让机器像人一样也有视觉功能是人类长久以来的梦想,随着计算机、人工智能、光学、电子、控制技术的发展,特别是CCD、DSP、图像处理、模式识别、计算机视觉技术的飞速进步,一门新兴的技术――机器视觉(Machine Vision),正在将这一梦想变为现实。

1机器视觉系统概述

1.1机器视觉的发展历程

机器视觉技术出现于20世纪中期,最初用于对二维图像的分析和识别,如光学字符识别、工件表面检测、航片解读、显微图像判读等,基本上属于图像处理和识别的范畴。20世纪70年代,一些机器视觉应用系统陆续出现,70年代中期,麻省理工学院(MIT)人工智能(AI)实验室正式开设“机器视觉”课程,由国际著名学者B. K. P. Horn教授讲授。同时,MIT AI实验室吸引了国际上许多知名学者参与机器视觉的理论、算法、系统设计的研究,David Marr教授就是其中的一位,他于1973年应邀在MIT AI实验室领导一个以博士生为主体的研究小组,1977年提出了不同于“积木世界”分析方法的计算视觉理论(computational vision),该理论在80年代成为机器视觉研究领域中一个十分重要的理论框架。到了80年代中期,机器视觉获得了蓬勃发展,新概念、新方法、新理论不断涌现,比如,基于感知特征群的物体识别理论框架、主动视觉理论框架、视觉集成理论框架等。同时,计算机、电子技术、CCD、DSP、光学、机械等硬件技术的进步也是日新月异,从光源、相机、图像采集卡到计算机和嵌入式系统,几乎每一个机器视觉系统的有关环节都出现了性能的大幅提升甚至质的飞跃。更高分辨率的图像、更快的处理器、更好的光源,同时还伴随着成本的降低和体积的减小,这一切为机器视觉的发展准备了坚实的硬件平台。

1.2机器视觉系统的工作原理

在机器视觉系统中,首先是摄像机将图像传感器所接收到的光学图像,转化为计算机所能处理的电信号,传送给专用的图像处理系统,图像处理系统对这些信号进行各种运算来抽取目标的特征,如面积、长度、数量、位置等,最后,根据预设的容许度和其它条件输出结果,如尺寸、角度、偏移量、个数、合格/不合格、有/无等。视觉系统的输出并非图像视频信号,而是经过运算处理之后的检测结果(如尺寸数据),上位机(如PC和PLC)实时获得检测结果后,指挥运动系统或I/O系统执行相应的控制动作(如定位和分类等)。

2机器视觉系统设计

典型的机器视觉系统一般包括光源、光学镜头、智能相机、图像处理单元(或图像采集卡)、图像分析处理软件、监视器、通讯/输入输出单元等。

从视觉系统的运行环境分类,可分为PC-BASED系统和PLC-BASED系统。基于PC的PC-BASED系统利用了其开放性、高度的编程灵活性和良好的Windows界面,系统总体成本较低,一般需要的二次开发,用户可用它快速开发复杂高级的应用。但这种系统开发周期较长,设计人员需要有较强的软件开发能力。在基于PLC的系统中,视觉系统的作用更像是一个智能化的传感器,图像处理单元独立于系统,通过串行总线和I/O与PLC交换数据。系统硬件一般利用高速专用集成电路或嵌入式计算机进行图像处理,系统软件固化在图像处理器中,通过类似于游戏键盘的简单装置对显示在监视器中的菜单进行配置。基于PLC的系统体现了可靠性高、集成化、小型化、高速化的特点,使用简便,上手快,但与PC-BASED系统相比,成本较高。

视觉系统设计时首先要选择适合自己的运行环境,视觉组成的选择主要有下面几个步骤。

2.1工业摄像机的选择

摄像机是机器视觉系统中的一个关键组件,其最本质的功能就是将光信号转变成为有序的电信号。选择合适的摄像机也是机器视觉系统设计中的重要环节,摄像机不仅直接决定所采集到的图像分辨率、图像质量等,同时也与整个系统的运行模式直接相关。一般摄像机的选用应考虑以下几点:

(1) CCD分辨率:摄像机分辨率指的是水平分辨率,其单位为线对,即成像后可以分辨的黑白线对的数目。常用黑白摄像机的分辨率一般为380~600,彩色摄像机的分辨率为380~480,其数值越大成像越清晰。一般的监视场合,用400线左右的黑白摄像机就可以满足要求。有效像素区域的大小,即CCD芯片尺寸同样是一个重要的参数。一些常见面阵CCD芯片的尺寸通常都会以英寸表示,有1″、2/3″、1/2″、1/3″、1/4″等规格。

(2) 曝光方式(Exposure)和快门速度(Shutter):对于线阵摄像机都是逐行曝光的方式,可以选择固定行频和外触发同步的采集方式,曝光时间可以与行周期一致,也可以设定一个固定的时间;面阵摄像机有帧曝光、场曝光和滚动行曝光等几种常见方式,数字摄像机一般都提供外触发采图的功能。摄像机的电子快门一般设置为自动电子快门方式,可根据环境的亮暗自动调节快门时间,得到清晰的图像。快门速度一般可到10μs,高速摄像机还可以更快。

(3) 同步:用摄像机内同步信号发生电路产生的同步信号来完成操作,外同步使用一个外同步信号发生器,将同步信号送入摄像机的外同步输入端。

(4) 信噪比:即信号电压与噪声电压的比值,CCD摄像机信噪比的典型值在45~55dB之间,当环境照度不足时,信噪比越高的摄像机图像就越清晰。

2.2工业镜头的选择

镜头的选用应考虑以下几点:

(1) 镜头尺寸应等于或大于摄像机成像面尺寸。例如,1/3″摄像机可选1/3″~1″整个范围内的镜头,水平视角的大小都是一样的。但镜头尺寸比摄像机CCD靶面尺寸大时,将使图像视野比镜头视野小,即不能很好地利用镜头的视野。如果镜头尺寸比摄像机CCD靶面尺寸小,则会发生“隧道效应”,即图像有圆形的黑框,像在隧道里拍的一样。只是使用大于1/3″的镜头能够更多地利用成形,更精确了镜头中心光路,所以可提高图像质量和分辨率。

(2) 选用合适的镜头焦距。焦距越大,监看距离越远,水平视角越小,监视范围越窄;焦距越小,监看距离越近,水平视角越大,监视范围越宽。镜头焦距可按照以下公式估算:

f=A×L/H

其中,f-镜头焦距;A-摄像机CCD垂向尺寸;L-被摄物体到镜头距离;H-被摄物体高度。

(3) 考虑环境光线的变化,光线对图像的采集效果起着十分重要的作用。一般来说,对于光线变化不明显的环境,我们常选用手动光圈镜头,将光圈手调到一个比较理想的数值后就可不动了;如果光线变化较大,如室外24小时监看,应选用自动光圈,能够根据光线的明暗变化自动调节光圈值的大小,保证图像质量。但需注意的是,如果光线照度不均匀,特别是监视目标与背景光反差较大时,采用自动光圈镜头效果不理想。

(4) 考虑最佳监看范围。因为镜头焦距和水平视角成反比,因此既想看得远,又想看得宽阔和清晰,这是无法同时实现的。每个焦距的镜头都只能在一定范围内达到最佳的监看效果,所以如果监看的距离较远且范围较大,最好是增加摄像机的数量,或采用电动变焦镜头配合云台安装。

(5) 镜头接口与摄像机接口要一致。现在的摄像机和镜头通常都是CS型接口,CS型摄像机可以和CS型、C型镜头配接,但和C型镜头接配时,必须在镜头和摄像机之间加接配环,否则可能碰坏CCD成像面的保护玻璃,造成CCD摄像机的损坏。C型摄像机不能和CS型镜头配接。

2.3光源的选择

合适的光源是机器视觉系统成功的关键,是机器视觉系统设计的重要环节。光源具有为图像提供光源、放大特征以及缺陷、削弱混乱及背景的作用。

市面上存在的几种视觉光源:荧光灯、卤素灯+光纤导管、LED光源、特殊光源,如激光、紫外光等。几种光源的性能对比如表1所示。

从上面的比较可以看出,LED光源的稳定性和使用寿命均比荧光灯、卤素灯等要好,LED光源具有使用寿命长、响应时间短、形状自由、可自由选择颜色、制作方便、运行成本低的特点,因此得到了广泛的应用。从照明结构上可分为同轴光源、背光源、环形光源、线型光源、低角度环形光源等。

选择光源主要从检测内容是外观检查还是定位、尺寸测定,从被测物的状态、材质、颜色以及视野范围、动态还是静态,从客观条件如安装尺寸、工作距离、周围环境等几个方面加以考虑。

2.4图像采集卡的选择

机器视觉应用对图像采集卡的特性要求与多媒体、医疗及军事等应用有所不同。在机器视觉系统中,图像采集卡主要完成对模拟视频信号的数字化过程。视频信号经低通滤波、A/D转换后,转变为数字信号输出,同时通过图像处理软件对视觉图像进行处理,包括图像的增强、平滑、边缘锐化、分割、特征抽取、图像识别等,当某一事件发生时,系统应能够实时获取当时的图像,并进行分析、处理和识别。例如,当零件在传送带上进行传输时,当某一零件通过图像传感器时,机器视觉系统应实时获取它的图像,并由计算机中的算法判定其质量。在选择机器视觉系统中的图像采集卡时,需重点考虑以下几个因素:

(1) 相机的需求:所选择的图像采集卡是否支持相机?是否提供了相机所需的即插即用接口?

(2) 检验图像采集卡的数字量化能力,其噪声是否对测量结构构成了影响?

(3) 所选择的图像采集卡是否具有以下能力:

触发能力

选通能力

帧复位能力

锁相(PLL)采集能力

相机时序输出能力

输入信号调节能力

CPU进行图像处理时执行何种命令?图像采集卡是否占用大量CPU时间?

5结论

中国的机器视觉市场处在一个迅速发展期,随着市场的发展,一些国内的公司和系统集成商将成为市场的引领者,更多的客户将依赖他们在视觉和其它自动化技术方面的综合能力来解决问题,另外,将有更多的国内公司自己或者联合外国公司开发具有自主知识产权的视觉产品。能够自由而且合理地选择自己需要的视觉组件并且快速构造自己的系统,必将在很大程度上节约成本,同时提高产品的质量控制以及生产效率。

参考文献

[1] 贾云得. 机器视觉[M]. 科学出版社,2000.

计算机视觉范畴范文4

2012年4月,谷歌公司了一款“拓展现实”眼镜。它具有和智能手机一样的功能,戴上它,用户通过简单的点头、摇头、语音的方式,就可以实现日历、语音搜索、Google+、时间、温度、短信、拍照、地理位置、音乐、搜索和摄像等功能,让你可以随时随地记录并分享所看到的一切。同时,谷歌眼镜所采用的“增强现实”技术,还可以将所看到的事物的相关信息第一时间自动显示给你。

小小的眼镜为何具有如此强大的功能

据中国科学院自动化研究所模式识别国家重点实验室研究员陶建华介绍,谷歌眼镜的制作,需要多种技术的配合,比如计算机视觉技术、图形图像处理技术、信息检索技术、语音识别和合成技术、对话管理技术等。同时,他还指出,“因为谷歌眼镜本身是一个穿戴式设备,与我们正常使用的桌面电脑不同,它要考虑更多的问题,所以还需要进行与穿戴式硬件平台相关的改进工作”。

正如陶建华所言,谷歌眼镜功能的实现需要多种技术的配合,谷歌眼镜中配备了投影显示器、摄像头、触控板、麦克风、喇叭、各种传感器、陀螺仪以及多种通信模式。除此之外,据国外媒体报道,谷歌眼镜还计划采用声音“骨传导”技术。这项技术可以确保系统指令声音和外部环境声音互不干扰:一方面可以有效地提取佩戴者的声音,降低环境噪音的影响,提高语音识别结果,同时系统指令声音也仅佩戴者可听,佩戴者听取系统声音时仍可清晰听到外部声音。就是这些技术的相互作用,成就了这款我们期待中的“神奇”眼镜,而谷歌眼镜也被美国《时代》杂志评选为2012年最佳发明之一。

能否实现还存在不确定性

虽然有支持者热情的期待,但质疑声还是不绝于耳。

一位电子产品分析师表示:“谷歌眼镜需要各种前沿技术,包括语音和图像识别技术,以及电池和通讯方面的技术,目前这些技术还没有完全实现,需要完善。”

确实如此,目前的谷歌眼镜还存在着很多不确定性。比如说,目前的原型产品电池续航时间只有6个小时,如果想在郊游的时候用它来拍照、摄影,可能用不了多久就会面临没电的尴尬。除此之外,谷歌眼镜上网将采用WiFi和蓝牙技术,不支持3G频率,因此,在WiFi覆盖不到的地区,谷歌眼镜也将无能为力。

还有不少人表示,即便谷歌眼镜确实如其所宣传的那般,但是,戴着它依然会给人带来困扰。比如在佩戴谷歌眼镜时,用户的右眼必须看着视野右上方的投影仪微光,才能看清楚数据与文字,这样很可能会造成注意力分散,带来潜在的风险。除此之外,佩戴谷歌眼镜会不会对人的视力造成影响,会不会对人的大脑产生辐射?因为眼镜还没有正式,所以还没有确凿的证据去验证这些猜测,但这些疑问确实困扰着很多跃跃欲试的人。

计算机视觉范畴范文5

最近一段时间,“人工智能 ” (Artificial Intelligence)与机器人再度 成为好莱坞造梦工厂的热点题材。《超验 骇客》(Transcendence)和《她》(Her) 是这种经典题材延伸出的最新的分支。 前者讲述的是科学家将物理世界的自己 数字化、再反过来影响物理世界的故事, 后者则是一个在不久的将来可以肯定会 发生的爱情故事(当然反过来的话,让机 器爱上主人,我觉得没可能发生)。或许 是未能成功将旧食材做出新味道,观众 们对这两部新作的反响都不是很热烈。 在我看来,幻想有朝一日机器统治 世界的电影其实都难以解决一个简单却 无法回避的问题,那就是促使机器攫取 权力的动机。自然界的猛兽当然会互相 攻击来确定族群的领导者,也有很多人 会把更大的权力、更多的金钱视为必生 追求的目标。生物学家、心理学家通常会 把造成类似普遍现象的原因归结于与生 俱来的繁殖本能――但这种规律显然不 适用于无机体。一台计算机会在意自己 有多少伴侣、多少后代吗?它们会向往一 个满是机械味道的世界、并不惜为此将 一切阻碍新世界形成的人与物全部消灭 吗?无论如何,电影里、现实中的机器都 越来越聪明、越来越有“人性”了,但去 掉所有的幻想、只保留科学后的真实情 况是怎样的?

四级小台阶,机器难攀越

最近一段时间,AI的概念似乎过热 了。这是我的真实感受――其实,较之过 去五十年里的同类,今天所谓的“智能机 器”的能力提升都还只是量变,远远达不

到质变的标准。 机器――或者说人们日常会依赖的 工具的能力质变大概有四级小台阶。 第一级,功能(Capabiliby)。功能 是工具的价值点。从石刀石斧、鼎镬簋 盂、埙筝钟磬到今天的跑车、游轮、客 机,工具万千,各有所用。 第二级,智能(Intelligence)。今 天,在“智能”的概念阐释中,记忆力、算 数和弈棋(不包括围棋)几种能力应是 到了被排除的时候。而IQ(Intelligence Quotient)测试是个有趣的话题――由于 测试全程通常都会给出各种选项,机器 在应对这种智能商数的挑战时其实是有 很大的几率得高分的,我猜测,未来十年 内,将会出现IQ测试拿最高分的机器。 第三级,智力(Intellect)。智力比智 能更高一筹,“力”这个字里包含了判断 力、创造力等信息。对人类来说,每天我 们面对的都不是选择题,又或是有着无 穷选项的选择题。 第四级,智慧(Wisdom)。智慧往往 是由丰富阅历、深邃思考积淀而来的洞 察――所以我们经常说某位长者智慧深 广、堪为导师。所有的智能都不是用选项 的形式来表述的,就像火种,它能在特定 的时刻引燃人们思想的火花,照映前路。 哪怕再过很久很久,机器也不大可能产生 真正的智慧。 截至目前,全世界最“聪明”的机器 也只是站在了第二级台阶上――AI这个 概念的大部分意涵其实是“功能”,还有 一定的“智能”。“智能”与“智力”只差 一个字,但对机器而言却好像是鸿沟天 堑,极难攀越――至于让机器具备“智 慧”,剧作家和导演当然会继续开发此类 题材的科幻电影,但科学家们大抵不相 信会有成真的那一天。

没有智慧,但处处皆智能

随着计算器基础研究的持续积淀, 随着被互联网及其背后与日俱增的数据 中心所生成和保存的数据量越来越庞 大,机器一定可以帮我们做更多的事, 从繁复艰深的演算到远行代驾和清扫 房间……问题是,机器会进化到足以替 我们思考和决断的地步么?我们真的需 要像人一样有想法、有情感的机器来陪 伴么? 从计算能力来看,计算机早已超越 人脑,但这不意味着计算机有智慧―― 迄今为止,各种类型的计算器都仍只是 人脑部分功能(主要是记忆与运算)的延 展。说起AI,不少人会追溯近百年前科幻 作家们的拟想或是六十四年前图灵提出 的假说,但在我看来,整个人类文明史都 贯穿了对机器智能的追求。 击败了卡斯珀罗夫的IBM“深蓝” 被许多人视为AI研究的里程碑。但在对 弈时,能想出更多后续杀招、对方可能的 应手、由此带来的变化、变化后对应的棋 路调整的棋手赢面显然更大,而计算机 在此方面的优势不言而喻。人脑只能设 想出几步、十几步棋,但机器则能模拟出 所有的可能性。也就是说,即便不是“深 蓝”,也迟早会有其他的计算机选手挑战 人类成功,而且基于当前的信息科技发 展水平,如果将国际象棋世界冠军的人机 之争变成每年例行的赛事,那极有可能已 无人能够战胜机器对手――哪怕只是一 台Windows Phone。 当然,计算机棋手短期内还无法攻 陷源起于中国的围棋的阵地,这很让我们 为老祖宗的深邃智慧感到自豪――根据 专家的说法,围棋的变化复杂度是象棋 变化的10122倍。可以想象,若仅仅将下象 棋的“思维模式”移植给围棋计算机,例如提升机器性能、存储棋谱、优化算法、 分析应手与变化、做出“判断”,因为需 实时处理的计算量太大,现有的最强大 的计算机也还是不可能战胜人类大师。 机器能够战胜下象棋时的人脑,却对下 围棋时的人脑无能为力,这是个有趣的启 示――计算机棋手就算成为世界冠军, 也不具备哪怕是1个字节的智慧。

让机器用自己的方式思考和成长

“耳聪目明”是对人的夸赞。科学家 们一直在尝试让计算机能用人类的方式 来了解世界,所以语音识别和计算机视觉 始终是AI研究的重点。比如Siri、Cornata 和谷歌无人汽车内的360度摄像头。 假设人人都爱机器人,在通往产品 的道路上也还是有着许多障碍。比如, 从桌上的茶壶里倒杯茶而不打翻杯子 或洒出茶水,这对人类小孩来说都不算 挑战――孩子们不假思索就可以完成任 务。但对最“聪明”的机器人而言,却要经 过艰难复杂的运算。首先他要看到桌子, 认出茶壶和茶杯,用适当的力度拿起茶壶 (手指太粗可能还不成),举起茶壶、以 刚刚好的角度对准茶杯,实施倒茶的动 作,还得判断怎样才能让杯中的茶水将 满不溢。就算碰巧成功了一次,下一轮换 全然不同的桌子、茶壶、茶杯,还是可能 会失败。 长期以来,从事AI研究的科学家, 也包括那些执迷于创造出类人机器的学 者,总是梦想着将人类思考、计划、执行 的能力移植给机器,但是否人怎样行动, 机器就应怎样行动?是否人达成目标的 路径是由A到B,机器就应遵循完全一样 的路径?这种研究诚然有着非同寻常的 价值,却也会因“赋予钢铁工具以人的特 征才算成功”的偏执而举步维艰。 另一条思路是跳出窠臼,站在机器 的角度去模拟和延展人的思维,而不是 用人的视角和习惯去限制机器。装备了 雷达传感器、全景摄像头和激光测距仪 的无人驾驶汽车就很酷。i-Robot清洁 机器人也是,她的身材圆润扁平,一点儿也不像人,但吸尘时比两米高的机器保 洁员好用。 最初,AI研究遭遇的瓶颈是,人的 逻辑思考模式几乎无法复制给机器,无论 是将低阶的声音、影像、气味等信号升华 到认知,还是把有共性的现象抽炼成规 律,都不是机器所能掌握的技能――机 器学习与大数据将AI研究带入春天,最 近还出现了深度学习、深度神经网络等新 概念。更大规模的数据量和更少的假设、 限制可以让机器用自己擅长的方式(数据 存储、挖掘、分析)“思考”和成长,进而 在实用化路途上走得更快更远。

计算机视觉范畴范文6

关键词:人工智能;智能化计算机辅助教学;专家系统;知识库

中图分类号:TP18文献标识码:A文章编号:1009-3044(2007)12-21667-02

The Application of Artificial Intelligence in Education

HU Ji-li,YIN Yun-xia

( Anhui University of Traditional Chinese Medicine, Hefei 230038,China)

Abstract:As a result of the interpenetration of older branches into each other, scientific theories and their application of Artificial Intelligence have expanded into nearly all the areas of human activity. This paper introduces the application of Artificial Intelligence in education, especially deals with Intelligence Computer Aided Instruction based on the artificial Intelligence.

Key words:Artificial Intelligence;CAI;expert system;knowledge base

1 引言

人工智能作为当今世界三大尖端技术(空间技术、能源技术和人工智能技术)之一,是计算机科学的一个分支,它的目标是构造能表现出一定智能行为的。人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识、心理学和哲学、机器学习、计算机视觉等。总的说来,人工智能的目的就是让计算机这台机器能够像人一样思考。人工智能的研究更多的是结合具体领域进行的,主要研究领域有专家系统、机器学习、模式识别、自然语言理解、自动定理证明、自动程序设计、机器人学、博弈、智能决定支持系统和人工神经网络。它总的来说是面向应用的,随着人工智能的诞生和发展, 人们开始把计算机用于教学领域。同时, 自七十年代以来, 有教学能力的专家系统得到研制。人工智能技术与专家系统的成就, 促使人们把问题求解、知识表示这些技术引入计算机辅助教学(CAI) , 这便是智能型计算机辅助教学(CAI)。

近几十年来, 随着人工智能技术的日渐成熟, 它的一些研究成果被陆续应用到教学领域, 推进了教育发展改革和教学现代化进程。人工智能在教学系统的重要性也已形成共识。

2 人工智能在教育中的作用

目前在教育技术中涉及到AI的主要有以下领域:

2.1 知识的表示与访问

基于人工智能的知识表示是以知识为对象,以计算机的软硬件和计算机科学及人工智能和专家系统技术为工具,以哲学、心理学和逻辑学等为方法和指导,将知识表达成计算机可以直接处理的“知识库”,使用“计算机的智能”来模拟人类专家或“人类智能”,对知识进行快速、精确、自动、科学的处理。它不属于通常的“数据管理或信息管理”的“数据”层次,而是属于“知识处理”或“知识”的智能化层次。其主要内容是对于知识进行形式化的表示、自动化的推理,智能化的教学或创造。计算机辅助教育是其中重要的组成部分。

2.2 符号计算

符号计算包括数值计算、符号计算和函数作图。其代表软件是Mathematica,当该软件在1988年第一次,对科技及很多其他领域的计算机使用方式产生了深刻的影响。Mathematica 1.0时,商业周报将其列入当年最重要的十大新产品名单。这标志着现代科技计算的开始。Mathematica也被大量地用于教育:有成百上千的课程,从高中课程到研究生课程用它作基础。随着各种学生版的,Mathematica也已成为全世界各种不同专业学生的重要工具。

2.3 对学生错误的自动诊断

采用人工智能技术,使得教学过程中系统可以自动诊断学生的学习水平,不仅能发现学生的错误,而且能指出学生错误的根源,从而做出有针对性的辅导或学习建议。而且根据学生的特点自动选择教学内容,自动调整教学进度,自动选择教学策略与方法。

2.4 实现智能性超媒体教学系统

超媒体系统有理想的教学环境,容易激发学生的学习兴趣和学习主动性,但不能保证达到预期的学习目的,而且由于不了解所要教的对象,所以不能做到有针对性的指导,不能因材施教。智能辅助教学系统正好与此相反。将二者结合起来,就可实现性能互补,从而研究制出新一代高性能的智能超媒体教学系统。

3 人工智能应用于教育的新方向:ICAI

3.1 传统CAI的不足

传统的CAI由于其集成性、交互性、多媒体性等特点,在教学中可以极大地激发学生的学习动机,提高教师的教学效率和学生的学习效率。但在使用过程中,CAI的一些弱点也逐渐暴露出来。主要表现有:

(1)缺乏人机交互能力

现有CAI 大多以光盘作为信息的载体, 将教材中的内容以多媒体的形式展现出来, 教学信息是按预置的教学流程机械式地提供给学生的, 学生接受起来很被动。而且在课堂教学中, 一般也只能通过教师按预定的课件流程进行操作, 无论学生还是教师都不能很好地参与教与学的过程, 因此人机交互没有很好地实现。

(2)缺乏教师与学生的互动

现有的CAI 课件在学生自学、进行操作使用时,如何学习都是学生自己的事。教师不能完全了解学生的情况,学生在碰到问题时,也不能向教师求助,师生之间是互相封闭的,软件所起的积极效果大打折扣。同时由于缺乏网络支持,现有的绝大多数CAI 课件是在单机环境下运行的,它们无法利用网络的优势使知识内容快速更新,也更无法提供便捷的学习讨论空间、随时随地的师生交流方式以及远程教学实现的条件。

(3)缺乏智能性

要想面对不同情况的学生进行不同程度的教学过程, 使学生的学习变为主动, 并能由系统自动地提供助学信息而有选择地学习,要想使教师的教学能积极地参与进去并根据系统提供的信息按照学生的认知模型为其准备最适合的学习内容, 给予不同方式的教学模式与方法, 没有智能性的CAI 课件系统, 是很难实现以上目的并达到良好教学效果的。由此可见,现有的CAI 随着人们要求的提高, 已经不能尽如人意。因此以智能CAI 为代表的新的计算机辅助教学系统将是教师在教育技术上需要不断探求、努力实现的发展方向索。

3.2 ICAI-人工智能与多媒体技术的结合

为了克服传统CAI的缺点,需要在知识表示、推理方法和自然语言理解等方面应用人工智能原理。因此很多专家提出了智能计算机辅助教学(ICAI),智能计算机辅助教学(Intelligence Computer Assisted Instruction-ICAI)以认知学为理论基础。将人工智能技术应用于CAI,是智能化的CAI。在ICAI系统中,允许学生与计算机进行较自由的对话,学生的应答不限于数字或简单的短语。系统能够判定学生应答的正确程度,并给予适当的反馈,而不是简单地说“对”或“错”。ICAI的宗旨在于利用现有计算机技术实现较好的人工智能,模仿人类的交互方式、思维习惯及情绪流动,修饰和掩盖计算机的缺陷。

3.3 ICAI的优点

(1)将教学内容与教学策略分开,根据学生的认知模型提供的信息,通过智能系统的搜索与推理,动态生成适合于个别化教学的内容与策略。

(2)通过智能诊断机制判断学生的学习水平,分析学生产生错误的原因,同时向学生提出更改建议、以及进一步学习内容的建议。

(3)通过对全体学生出现的错误分布统计,智能诊断机制将向教师提供教学重点、方式、测试重点、题型的建议。

(4)为教师提供友好的教学内容、测试内容维护界面,无需改变软件的结构即可调整教学策略。

(5)通过对学生认知模型、教学内容、测试结果的智能分析,向教学督导人员提供对任课教师教学业绩评价的参考意见。可以说,一个理想、完美的ICAI系统就是一个自主、优秀的“教师”。

3.4 ICAI的标准

以现有的科学技术水平而言,短时期内显然无法实现具备上述全部功能的ICAI系统。一般认为,只要具有下列一个或几个特征的CAI系统就可以称之为ICAI系统。

(1)能自动生成各种问题与练习。

(2)根据学生的学习水平与学习情况选择与调整学习内容和进度。

(3)在了解教学内容的基础上自动解决问题,生成解答。

(4)具有自然语言生成与理解能力,以便实现比较自由的教学问答系统,提高人机交互的主动性。

(5)对教学内容有解释咨询能力。

(6)能诊断学生错误,分析原因并采取纠正措施。

(7)能评价学生的学习行为。

(8)能评价教师的教学行为。

不难看出,ICAI与传统的CAI相比,更加符合教育教学的规律,切合学生的认知习惯,具有明显的优越性。

3.5 ICAI的结构

ICAI主要由三个模块组成:专家系统模块、教师模块和学生模块。

(1)知识库

知识库是实现知识推理与专家系统的基础,而建造知识库的前提则是要解决知识的形式化,人工智能技术在教育中的应用表示以及知识的访问与调用问题。因此,知识的表示与访问是人工智能的核心技术之一,也是将AI引入教育领域必须首先解决的一个难题。

ICAI中的资源库应该包括以下一些内容:

①多媒体素材库:包括所要呈现的知识的一些素材,包括:文本、图像、声音、动画及数字影象等多媒体教学资源。这些用于多媒体数据库管理,便于分类、增删、修改及查询等操作。

②教学内容库:教学内容库用于存放教学内容,包括领域知识库(含辅助知识库、提示帮助库、练习题库,和测试题库)。这些教学内容,包括习题和试题分章、节、课及知识点等有序存贮。供专家决策系统调用。

(2)学生模块

学生模块主要包括以下三个模块:学生登陆模块、学生水平评价模块和学生监督模块。

①学生登陆模块:利用该模块主要用于学生使用ICAI时登录,第一次登录时学生输人姓名、性别、年龄、学历等相关信息,然后对学生进行询问,选择合适的测验题对学生进行初测推荐学习计划。当再次登录时,系统根据保存的信息安排合适的学习内容。

②学生水平评价模块:学生水平测试模块用于评价某一教学单元学习完后测试成绩。通过测试等因素分析,可以比较确切地了解学生的具体情况,从而制定出合理的教学策略和教学过程

③学习监测模块:学习检侧模块用于监测记录学生的日常学习情况,记录学生学习某教学单元时的参数值,并记录在学生档案中。包括:学生目前学习单元号;学习方式;正常学习、练习、提前浏览、学后复习;学习时间;学生提示问题的类型和次数;学生本次练习出错次数。

(3)专家决策模块

CAI中的专家决策系统可以看作专家系统中的推理机。专家系统是目前人工智能中最活跃、最有成效的一个研究领域,它是一种具有特定领域内大量知识与经验的程序系统,它应用人工智能技术,模拟人类专家求解问题的思维过程求解领域内的各种问题,其水平可以达到甚至超过入类专家的水平。计算机中存有人类专家的知识并具有推理能力,从而可解决诊断、规划、调度、预报、决策等要靠人类专家才能完成的任务。

成功的例子如:① DENDRL系统的性能已超过一般专家的水平,可供数百人在化学结构分析方面的使用;②MYCIN系统可以对血液传染病的诊断治疗方案提供咨询意见经正式鉴定结果,对患有细菌血液病、脑膜炎方而的诊断和提供治疗方案已超过了这方面的专家。

ICAI根据学生模块提供的学生学习情况,通过智能系统的搜索与推理,得出智能化的教学方法与教学策略,能够较科学地评估学生的学习水平,还可以通过分析学生以往的学习兴趣和学习习惯,预测学生的知识需求和常犯错误,动态地将不同的学习内容、学习方法与不同的学生匹配,智能地分析学生错误的原因,进而有针对地提出合理的教学建议、学习建议以及改进方法,既提高了学生学习的满意度,激发了学生的学习热情,也对教师教学提供了客观的依据和科学的方法。

4 结束语

由此可见人工智能技术已经逐步应用于计算机辅助教学中,与教学现代化有着密切的关系。人工智能技术的发展也必将会对ICAI 的发展起到巨大推动作用。近几年来,人工智能的研究者们尝试着使学生脱离“辅导学习”的过程来接受新知识,而采用“通过活动进行学习”的方式。在教学的其他方面,人工智能技术还可以建立人类推理模型学习工具等诸多的运用, 展示出越来越好的实用性。随着Internet 的发展,虚拟现实技术的广泛应用, ICAI 也将得到进一步的完善。21 世纪的教育教学手段将是以智能化CAI 为主线,多学科、多方位发展的新技术的体现。这种手段产生了人机交互、人机共生等全新概念,使人类扩展了自己的能力,促进了教育领域方方面面的改革。

参考文献:

[1]王万森.人工智能原理及其应用[M].北京:电子工业出版社,2000.