前言:中文期刊网精心挑选了计算机视觉研究领域范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
计算机视觉研究领域范文1
关键词:动态场景;自适应预测;多特征融合;计算机视觉;运动目标
接受信息的关键手段之一就是视觉系统,随着科学技术水平的不断发展,以及计算机和信号处理理论的诞生,让机器拥有人类视觉功能已经不再是梦。对所采集视频中的运动目标进行跟踪、检测,并对其目标行为进行分析,就是运动目标分析的内容,运动目标分析是计算机视觉领域关键内容之一,其属于图像理解与图像分析的范畴。而在运动目标分析系统中,跟踪与检测运动目标则为中级和低级处理部分,是分析与理解行为的高等层分析模块的基础。检测与跟踪运动目标技术主要包括了:机器人视觉导航、军事领域、运动图像编码、交通管制、视觉监视等。
1目标检测算法
连续图像序列由视频中提取出,由前景区域与背景区域共同组成了整个画面。前景区域包含了如运动的人体、车辆等动态要素,它是指人们较为感兴趣的区域。而背景区域主要包含例如树木、建筑物等静态要素,它的像素值仅发生微弱变化或者不产生变化。在连续图像序列中,采用一系列算法分隔开背景区域和前景区域,将运动目标信息有效提取,则为运动目标检测。以静态场景为基础的运动目标检测算法包括了光流法、背景差分法、帧间查分法等,文章主要针对背景差分法进行介绍。
背景差分法通常适用于静态场景,其是将背景图像与当前帧图像进行差分,运动目标依靠阀值化进行检测,因为该算法仅能够在背景变化缓慢或者不发生变化的情况下应用,因此就有着一定的局限性。假设当前帧图像为fk(x,y),背景图像B(x,y)可通过一定的方法得出,而这时背景差分图像则为:
(1)
而假设二值化阀值为Th,二值化图像B(x,y)则为:
(2)
运动目标检测结果可通过数学形态学处理获得。
2 背景模型的实时更新
要更新背景图像可采用一阶KALMAN滤波来实现,为了克服气候变化、光照变化等外部环境变化对运动检测产生的影响,采用一阶KALMAN滤波更新背景图像公式如下:
Bk+1(p)=Bk(p)+g(Ik(p)-Bk(p)) (3)
而增益因子则为:g=?琢1(1-Mk(p))+?琢2Mk(p) (4)
公式中?琢1和?琢2是权值系数;M是第k时刻二值化后目标图像中p像素的值;B为背景图像;I为当前帧图像。要想将运动目标从背景序列图像中有效分割出来,就必须要达到?琢2足够小的条件,且?琢1应等于或者大于10?琢2,若?琢1值过大,就会将算法自身的去噪特性丧失,在序列背景图像中也会存储越来越多的运动变化。
3 更新车辆目标模型
核与活动轮廓算法具有效率高、技术复杂度低等特点,它以非参数核概率密度估计理论为基础,在视频运动目标跟踪中广泛应用。彩色图像序列通过摄像机获取,人脸目标模型可以采用RGB颜色空间来进行描述。在跟踪车辆的过程中,噪声、遮挡、光照等干扰或多或少存在,因干扰因素的存在,车辆像素特征也会发生相应的微弱变化。若不对目标模型进行更新,会对跟踪精度产生影响,所以,采用的矩形模板会包括一定背景。而在实施跟踪的过程中,要对车辆目标模型进行更换。如果其过程物遮挡,当BHATTACHARYYA系数满足?籽>Tudm条件时,更新车辆目标模型,更新模型为:
(5)
公式中Tudm是模板更新阀值;qk-1是更新之前的车辆目标模型。通过视频跟踪,在近场景和远场景拍摄到的视频中,多尺度图像空间由各个帧图像构成。例如:将将书本作为跟踪对象,由远及近从书本的正上方拍摄六十帧图像,为了能使矩形框正好能够包含书本,对每帧图像张书本手工划定矩形框,并对框内图像的信息量进行统计。最后,随书本尺度的变化,给出图像信息量变化曲线。
4 计算机视觉原理
计算机视觉是一门研究怎样使机器进行观察的科学,更切确地说,就是指利用电脑和摄影机代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,用电脑处理成为传送给仪器检测或更适合人眼观察的图像。计算机视觉研究相关的理论和技术作为一个科学学科,尝试创建能够从图像或者多维数据中获取信息的人工智能系统。这里所指的信息指Shannon定义的,可以用来帮助做一个决定的信息。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中感知的科学。
计算机视觉就是由计算机来代替大脑完成处理和解释,用各种成象系统代替视觉器官作为输入敏感手段。使计算机能象人那样通过视觉观察和理解世界,具有自主适应环境的能力就是计算机视觉的最终研究目标,而需要经过长期的努力才能达到这个目标。所以,在实现最终目标以前,通过努力的中期目标是建立一种视觉系统,这个系统能依靠反馈的某种程度的智能和视觉敏感完成一定的任务。例如:计算机视觉的一个重要应用领域就是自主车辆的视觉导航,但要实现自主导航的系统,却还没有条件实现象人那样能识别和理解任何环境。所以,人们通过不懈的努力,研究在高速公路上具有道路跟踪能力,有效避免与前方车辆碰撞的视觉辅助驾驶系统。人类视觉系统是有史以来,人们所知道的功能最强大和完善的视觉系统。这里要指出的一点是在计算机视觉系统中计算机起代替人脑的作用。计算机视觉可以而且应该根据计算机系统的特点来进行视觉信息的处理,但并不等于计算机必须按人类视觉的方法完成视觉信息的处理。可以说,对人类视觉处理机制的研究将给计算机视觉的研究提供指导和启发,所以,用计算机信息处理的方法研究人类视觉的机理,建立人类视觉的计算理论,与此同时也是一个十分重要和让人感兴趣的研究领域。这方面的研究被称为计算视觉。计算视觉可被认为是计算机视觉中的一个研究领域。计算机视觉领域的不完善性与多样性为其突出特点。
5 结束语
对视频中的运动目标进行跟踪、识别、检测,并对目标行为进行研究、分析,这就是基于视觉运动目标分析。以计算机视觉为基础,分析运动目标,包括了目标行为的理解与分析、目标跟踪、运动目标检测、预处理图像等,它是计算机视觉领域重要内容之一。理解与分析运动目标的行为,既是计算机视觉的根本目的之一,也是检测与跟踪运动目标的最终目标。从理论层考虑,理解与分析运动目标的行为可以分为人工智能理论研究与模式识别。简要阐述基于计算机视觉的运动目标分析,而所面临的是对运动目标行为的理解。
参考文献
[1]杨可,刘明军,毛欣,夏维建,刘伟,周旋,吴炜,周凯.基于计算机视觉的电缆终端表面温升分析系统[J].电视技术,2013(7).
[2]叶闯,沈益青,李豪,曹思汗,王柏祥.基于人类视觉特性(HVS)的离散小波变换(DWT)数字水印算法[J].浙江大学学报:理学版,2013(2).
[3]何青海,马本学,瞿端阳,李宏伟,王宝.基于机器视觉棉叶螨自动监测与分级方法研究[J].农机化研究,2013(4).
[4]贾挺猛,苟一,鲍官军,董茂,杨庆华.基于机器视觉的葡萄树枝骨架提取算法研究[J].机电工程,2013(4).
计算机视觉研究领域范文2
【关键词】课程 计算机视觉 图像检索
1.课程设置、建设与改革自述
1.1 综合基础与应用,精选教研内容
从专业学位教育的高层次应用型人才培养目标出发,我以学生专业应用能力的培养作为教研的重点,同时,考虑到“计算机视觉”是一门数学要求较高、理论性较强的专业基础课程。课程的基础理论教研十分重要,我在规划教案时,综合安排基础理论与应用实践的教研内容。
1.2 强调学生应用能力,优化教研方法
将启发式教研方法融入到整个教研过程中,将课堂讲授的重点放在问题由来、概念形成、研究思路与方法上,并通过介绍人工智能与计算机视觉学科交叉中出现的最新研究与应用。把新理念、新思路、新方法和新问题引入课堂,调动学生学习的积极性和主动性,拓宽他们视野和思路。
通过较为熟悉的分析,“计算机视觉”课程中的教研方法较为新颖,使他们从一开始就建立了所学理论与实际工程控制问题的联系。
按“计算机视觉”的基础理论和知识内容分环节来实施教研,每个环节以实际工程问题开始,以理论学习为基础,各教研环节之间既是工程问题的系统化深入,也是理论知识体系的循序推进。
按“计算机视觉”的基础理论和知识内容分环节来实施教研。每个环节,以理论学习为基础,以提出和解决实际实验案例中的识别问题为结束,各教研环节之间既是三维重建问题的系统化深入,也是理论知识体系的循序推进。
他们都十分赞同我以强调学生自主学习和应用能力为目的的启发式和交互式教研方法。尤其是以论文报告和答辩形式提交作业。强调了理论和应用的结合。每一次的作业贯穿整个教研环节,使他们对问题的发现、理解和解决成为一个逐渐明确、细化和深入的过程,因此。虽然作业要求较高、工作量较大,但做起来并不会感到压力和困难。同时,他们大多之前没有撰写科研论文和报告的经历,通过作业也可以使他们在这方面的能力得到锻炼和提高,最后考试结业。
与此同时。研究生们也畅谈了他们对课程教研中一些问题的看法.研究生们十分重视专业应用能力和实际动手能力的培养与提高。也非常看重扎实理论基础的必要性,都认为理论学习与专业应用能力培养应该没有矛盾,但在有限的2年时间内,如何实现两者的全面提高,他们大多存在疑虑。同时,他们也认为目前大多数的课程教研具有明显的理论或实践的偏向性,缺乏科学合理的平衡。
针对我在教研中所提出的案例和问题,学生们反映,尽管十分熟悉,但对问题的本质和要求仍只是停留在理性认识上。无法建立与实际对象的对应关系。另外,他们提出,案例仅从单一课程角度讲授,在有限课时内难以从多学科的角度介绍滤波,三维重建,运动恢复,图像检索案例,虽然是实际科研项目,但课堂不可能展示整体实物,学生缺乏工业现场的实际感受。使得学生对案例的整体理解难以跳出课堂的思维界域。
针对此,我计划在加强现代化教育手段方面进行一些建设与探索,努力向学生提供信息容量大、表现形式丰富的综合性辅助认识手段。考虑到“计算机视觉”通常需要运用计算机技术解决工程问题,我们将在以后教研中,增加计算机辅助教研的功能。如利用Matlab工具对所学内容及实际视觉问题进行可视化仿真演示。我们也将用虚拟仪器工具搭建案例的虚拟系统,试图通过这样的虚拟系统,向学生提供有利于启发思维的灵活的认识与实践环境。增强学生的感性认识;同时,尽管采用了多媒体教研。计划在以后的教案中增加更多的现场视频材料以及图形和图像资料,使学生更容易理解和记忆,增强抽象理论的可接受性。这些工作都需要我们在教研和科研工作之余投入大量的热情和精力。
2.教研手段(课程建设中积极营造数字化、信息化环境和外语教研环境,网络教研和网上教研资源的开发与建设情况)
2.1本课程的主要特色
体现机器视觉与机器听觉融合。①机器视觉:图像处理、图像与视频压缩、模式识别和机器学习、生物特征识别、三维视觉信息处理。②机器听觉:听觉计算模型、语音信号处理、口语信息处理。此外还在同济大学开设计算机视觉,和图像处理方面课程,该课程构成本课程基础, 及对大量应用实例介绍设计方法,系统性能,并对结果进行祥细分析和点评。学生通过听课可以跟随教师本人了解和掌握计算机视听觉。充分领略数字技术用于语音通信这一广阔的领域神奇魅力。脑、 机接口的研究有广阔的应用前景, 正成为脑科学、康复工程、神经工程及人机交互( puter interface, HCI) 领域的一个研究热点。
2.2本课程的建设总目标和成果
以后开展图像,图形,语音处理,多媒体的内容的检索,三维景物物体的重建,自然语言理解的研究方向:视觉与听觉的生理学和心理学基础,从生理与心理学的角度探索视觉与听觉的感觉和知觉机理,为视觉与听觉信息处理提供基本理论和方法,完成同济大学研究生精品课程建设。以近几年为研究生讲授“计算机视觉”课程讲义的电子教案为基础,结合开发科研项目,并参考相关文献资料和最新动态编写计算机视听觉电子教案,和教材。
机器视觉:图像处理、图像与视频压缩、模式识别和机器学习、生物特征识别、三维视觉信息处理。
机器听觉:听觉计算模型、语音信号处理、口语信息处理、自然语言处理、智能人机交互。
2.3 本课程的建设分年度目标和步骤
教材内容:针孔摄像机,辐射学术语;局部影调模型,点,线和面光源,光度学体视;颜色;线性滤波器,平滑抑制噪音,边缘检测;纹理,用滤波器输出表示统计量,纹理量,纹理合成,由纹理推断形状;基本的多视角几何,立体视觉;用聚类实现分割;拟合直线与曲线,用最大似然率进行拟合,鲁棒性;隐变量与EM;用卡尔曼滤波来跟踪,数据相关;摄象机标定;使用特征对应和摄像机标定的基于模型的视觉;使用分类器的模版匹配;基于关系的匹配;在数字图书馆中检索图像,基于图像的绘制。
准备离散时间语音信号处理的原理,介绍语音信号处理研究及其应用方面的最新动态,其中包括语音处理,语音时频分析以及非线性声学语音产生模型,而这些讲授内容在以往任何一本语音信号处理教科书都不曾提及,深入介绍以下内容:语音编码,语音增强,语音综合,说话人识别,语音信号恢本复,动态范围压缩语音信号处理基础,语音的时域的分析语音信号频域分析,语音信号线性预测分析,矢量量化,语音编码,语音合成,语音增强,说话人识别。
3.构建研究实践型模式,探究研究生指导
通过研究生指导模式的学习,两种指导方式之一是对传统面对面的与基于网络两种指导方式的混合。师生之间定期与不定期面对面的交流对于保证研究生指导质量提高有着重要关系。互联网突破时空限制为高校师生提供一个开放的、共享、个性化、多维交互的教与学的平台。我提供优秀研究资源,学生也可以通过网络共享研究资源。师生都可以Web对于优化研究资源的共享、促进师生之间的社会互有着重要作用使得研究生指导模式充分发挥面对面指导。研究生指导主要注重科研素养培养。研究生培养根本目标发展能力。课程学习对于系统提高研究生对专业关心课程学习状况必要,要为学生提供学习方法指导与建议,要鼓励学生结合课程学习进行相关讨论。
基于自主与协作的探究性学习是研究生学习的主体地位,发挥作用。我在教研中培养研究生发现问题、分析问题、解决问题的能力正是为了支持研究目标在于获得亲身参与研究探究体验:培养“教研模式中”包括个人理解专业研究领域相关问题的内涵与特征。旨在使学生能够切实掌握专业与研究领域所涉及基本原理与能够利用这些原理与方法分析确定方案实施、“know“know 是相互交织相互作用的层面,主要是为了增强指导以便根据不同层包括若干个问题常常需投人较多的精力与时间。应该安排较长时间且要充分利用网络技术平台支持。提升研究质量有效地避免传统指导误区。在指导时过于强调研究生所获取学术成果而忽视指导过程体现在两方面:一目标评价标准单一往往给研究生层面:①面向研究生个体的“个别指导”;②面向小组集中:③自主调控评价,必须与教师、同伴、专家进行交流、协作才有可能真正地提高效率,实现学习目标,培养学团队意识,其次要帮助研略,在各层面都有明确的目标相应指导内容,并要注意这三个层面整合。使之过程得到全面发展。养成科学态度和科学道德。“科研能力发展、轻综合素质培养”,研究生导师不但应该是研究生的指导者。指导教师可以按“科研项目一要问题一具体任务”的层次。以教师的、助学促学”尽可使每个研究生都能达到预期培养目标。评价要更关注总结性评价”与“过程性评价”工具以丰富研究生指导过程中教研交互的教育学中社会互。传统环境下的社会互往往是面对面的交互。网络平台可以利用构建社会网络支持社会交互。强调的研究科研成果而深层次交流方式不同指导目标、不同指导层次整合,指导教师角色转变,变革评价方式,丰富指导教师来促进“自主一协作”探究学习,对研究生“混、他评”与“自混评关注教研评价的。”教研模式下网络技术与内涵表现在:①利用技术促进教研资源的整合,优化教研资源管理,教研资源共享,促进师生与教研内容的交互;②利用Web工具,有效地整合现实交互空间虚拟交互空间另外还地加速或加强人际联系,帮助师生了解探究式应用实践探索。
研究生是否发表了高水平的科研成果,研究生入学初期,以Web的应用为核心的互联网络不但为高校师生的交流提供了新的沟通与互动方式。以独特高校师生的思维方式生存方式发生了系列改变。也成为高校师生教研与生活中的重要信息工具为研究生指导提供了丰富的资源与多维立体环源。网络平台也用于共享、深化面对面交流中所总结形成相关观点与资料。要求其他每位学生都至少要提一个问题所提出问题进行进一步的讨论。了解专业研究领域的基本问题、核心问题与前沿问题研究生自己在调研基础上提出研究进行独立自主的探究。所以除了关注在专业领域内研究能力的发展之外还要注意教育科研能力的培养引导学关注“专业发展”。 用于规划了解学生的已有基础,以帮助后期制定更为合理个别指导计划:第二,通过召开定期的讨论会、师生个别交流,包括两种类型:①旨在提高新生适应研究生学习与生活的适应性:②面向科研任务的研究小组。面向任务方式冲击着高校师思维方式与文化理念,非常重视网络平台研究指导中的应用,建立了向团队公用资源平台教研主要采用研究式教研方法, 要求研究生自学其基本原理, 然后利用实际数据,由导师提供或从期刊文献中获取,完成数据预处理、计算、结果表达、解释的全过程, 并以论文形式提交给教师, 同时在课堂上向大家介绍自己的研究成果。这样做一方面提高了学生应用知识的能力以及研究成果的文字组织和语言表述能力。 另一方面, 研究生的每篇习作就是一个很好的实例, 教师可以从中发现学生对知识理解的偏差, 及时予以纠正, 使学生对方法的掌握更加准确和牢固。将网络共享平台中上传所有研讨记录训练,将研究分个层面:①选择专业研究内的基本问题或重要问题或热点问题对之进行深入探究。掌握本专业领域基本研究方法;②以自己课体依托,在课题下设置子课根据研究与研究兴趣跨年级构建小组,每个小组负责不同的子课题与任务③鼓励研究途径。一年级开始参与课题研究,二年级学期要求开始提出自己一些问题或鼓励结合确定毕业论文选题使他们在更大程度职业能力发展;推荐专业相关资料;对(共8人)进行指导,效果较明显。在学习方面,24名本科生通过毕业答辩。研究生八人以学生身份公开发表学术科研论文。 他们在这方面的能力得到锻炼和提高。
通过"混合型-探究式"研究生指导模式的学习实践三个维度的"混合":对传统面对面的与基于网络的两种指导方式的整合,对提升研究生课程学习绩效、促进研究生科研能力发展、促进研究生职业能力发展三个指导目标的整合,对个别指导、小组集中指导、团队集中指导三个指导层面的整合;说明了该模式中三个层面的"探究":对专业问题的探究,对专业与研究领域内基本原理的探究,对综合科研任务的探究;同时介绍了在实践层面应用"混合型-探究式"研究生指导模式的实际效果。以重点学科为依托,吸取国内外大学研究生培养经验,对创新型研究生培养模式方法进行探索,在研究生培养模式改革中,提出“四个转变”的指导思想,即变“单人指导”为“团队指导”,变“单一培养模式”为“多元培养模式”,变“以教师为中心”为“以学生为中心”,变“面向培养结果”为“面向培养过程”。形成以研究生为中心的培养模式,突出研究生探索精神、科学思维、创新意识的培养。切实 行的措施 引导 究生遵守科学 道德,保持科学冲动,增强创新意识,提高科学能力。
考虑到“计算机视觉教研探究研究生指导”通常需要运用计算机技术解决工程问题,我将在以后教研中,增加计算机辅助教研的功能。如利用Matlab工具对所学内容及实际视觉问题进行可视化仿真演示。我也将用虚拟仪器工具搭建案例的虚拟系统,试图通过这样的虚拟系统,向学生提供有利于启发思维的灵活的认识与实践环境。增强学生的感性认识;同时,尽管我采用了多媒体教研。我计划在教案中增加更多的现场视频材料以及图形和图像资料,使学生更容易理解和记忆,增强抽象理论的可接受性。
参考文献:
[1]David A.Forsyth and Jean Ponce , Computer Vision-A modern Approach
[2]贾云得.机器视觉.电子工业出版社,1999
[3]Thomas F.Quatieri离散时间语音信号-原理与应用,电子工业出版社,2004
[4]Shapiro.L.G and stockmen,G.C,计算机视觉.北京-机槛工业部,2001
[5]Haralick,R.,1992/1993 Computer and Robot vision ,volume I and II
[6]张雄伟,陈亮等.现代语音处理技术及应用.机械工业出版社,2003
[7]Thomas F.Quatieri离散时间语音信号-原理与应用,电子工业出版社,2004
[8]郑燕林等“混合型-探究式”研究生指导模式的构建与实践,学位与研究生教育,2010
计算机视觉研究领域范文3
国内人工智能产业链解构
基础技术、人工智能技术和人工智能应用构成了人工智能产业链的三个核心环节,我们将主要从这三个方面对国内人工智能产业进行梳理,并对其中的人工智能应用进行重点解构。
人工智能的基础技术主要依赖于大数据管理和云计算技术,经过近几年的发展,国内大数据管理和云计算技术已从一个崭新的领域逐步转变为大众化服务的基础平台。而依据服务性质的不同,这些平台主要集中于三个服务层面,即基础设施即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS)。基础技术提供平台为人工智能技术的实现和人工智能应用的落地提供基础的后台保障,也是一切人工智能技术和应用实现的前提。
对于许多中小型企业来说,SaaS 是采用先进技术的最好途径,它消除了企业购买、构建和维护基础设施和应用程序的需要;而 IaaS通过三种不同形态服务的提供(公有云、私有云和混合云)可以更快地开发应用程序和服务,缩短开发和测试周期;作为 SaaS 和 IaaS 中间服务的 PaaS 则为二者的实现提供了云环境中的应用基础设施服务。
人工智能技术平台
与基础技术提供平台不同,人工智能技术平台主要专注于机器学习、模式识别和人机交互三项与人工智能应用密切相关的技术,所涉及的领域包括机器视觉、指纹识别、人脸识别、视网膜识别、虹膜识别、掌纹识别、专家系统、自动规划、智能搜索、定理证明、博弈、自动程序设计、智能控制、机器人学习、语言和图像理解和遗传编程等。
机器学习:通俗的说就是让机器自己去学习,然后通过学习到的知识来指导进一步的判断。我们用大量的标签样本数据来让计算机进行运算并设计惩罚函数,通过不断的迭代,机器就学会了怎样进行分类,使得惩罚最小。这些学到的分类规则可以进行预测等活动,具体应用覆盖了从通用人工智能应用到专用人工智能应用的大多数领域,如:计算机视觉、自然语言处理、生物特征识别、证券市场分析和DNA 测序等。
模式识别:模式识别就是通过计算机用数学技术方法来研究模式的自动处理和判读,它偏重于对信号、图像、语音、文字、指纹等非直观数据方面的处理,如语音识别,人脸识别等,通过提取出相关的特征来实现一定的目标。文字识别、语音识别、指纹识别和图像识别等都属于模式识别的场景应用。
人机交互:人机交互是一门研究系统与用户之间交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。在应用层面,它既包括人与系统的语音交互,也包含了人与机器人实体的物理交互。
而在国内,人工智能技术平台在应用层面主要聚焦于计算机视觉、语音识别和语言技术处理领域,其中的代表企业包括科大讯飞、格灵深瞳、捷通华声(灵云)、地平线、SenseTime、永洪科技、旷视科技、云知声等。
人工智能应用
人工智能应用涉及到专用应用和通用应用两个方面,这也是机器学习、模式识别和人机交互这三项人工智能技术的落地实现形式。其中,专用领域的应用涵盖了目前国内人工智能应用的大多数应用,包括各领域的人脸和语音识别以及服务型机器人等方面;而通用型则侧重于金融、医疗、智能家居等领域的通用解决方案,目前国内人工智能应用正处于由专业应用向通用应用过度的发展阶段。
(1)计算机视觉在国内计算机视觉领域,动静态图像识别和人脸识别是主要研究方向
图像识别:是计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。识别过程包括图像预处理、图像分割、特征提取和判断匹配。
人脸识别:是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部的一系列相关技术,通常也叫做人像识别、面部识别。
目前,由于动态检测与识别的技术门槛限制,静态图像识别与人脸识别的研究暂时处于领先位置,其中既有腾讯、蚂蚁金服、百度和搜狗这样基于社交、搜索大数据整合的互联网公司,也有三星中国技术研究院、微软亚洲研究院、Intel中国研究院这类的传统硬件与技术服务商;同时,类似于 Face++ 和FaceID 这类的新兴技术公司也在各自专业技术和识别准确率上取得了不错的突破。
而在难度最大的动态视觉检测领域,格灵深瞳、东方网力和 Video++ 等企业的着力点主要在企业和家庭安防,在一些常见的应用场景也与人脸识别技术联动使用。
(2)语音/语义识别
语音识别的关键基于大量样本数据的识别处理,因此,国内大多数语音识别技术商都在平台化的方向上发力,希望通过不同平台以及软硬件方面的数据和技术积累不断提高识别准确率。
在通用识别率上,各企业的成绩基本维持在 95% 左右,真正的差异化在于对垂直领域的定制化开发。类似百度、科大讯飞这样的上市公司凭借着深厚的技术、数据积累占据在市场前列的位置,并且通过软硬件服务的开发不断进化着自身的服务能力;此外,在科大讯飞之后国内第二家语音识别公有云的云知声在各项通用语音服务技术的提供上也占据着不小的市场空间。值得注意的是,不少机器人和通用硬件制造商在语音、语义的识别上也取得了不错的进展,例如智臻智能推出的小 i 机器人的语义识别、图灵机器人的个性化语音助手机器人和服务、被 Google 投资的出门问问的软硬件服务。
(3)智能机器人
由于工业发展和智能化生活的需要,目前国内智能机器人行业的研发主要集中于家庭机器人、工业企业服务和智能助手三个方面其中,工业及企业服务类的机器人研发企业依托政策背景和市场需要处于较为发达的发展阶段,代表性企业包括依托中科院沈阳自动化研究所的新松机器人、聚焦智能医疗领域的博实股份,以及大疆、优爱宝机器人、Slamtec 这类专注工业生产和企业服务的智能机器人公司。在以上三个分类中,从事家庭机器人和智能助手的企业占据着绝大多数比例,涉及到的国内企业近 300 家。
(4)智能家居
与家庭机器人不同,智能家居和物联企业的主要着力点在于智能设备和智能中控两个方面。在这其中,以海尔和美的为代表的传统家电企业依托自身渠道、技术和配套产品优势建立起了实体化智能家居产品生态. 而以阿里、腾讯、京东、小米和乐视等互联网企业为代表的公司则通过各自平台内的数据和终端资源提供不同的软硬件服务。
值得关注的是,科沃斯、broadlink、感居物联、风向标科技、欧瑞博、物联传感和华为等技术解决方案商在通用硬件和技术、系统级解决方案上已成为诸多智能家居和物联企业的合作伙伴。综合来看,智能家居和物联企业由于市场分类、技术种类和数据积累的不同各自提供着差异化的解决方案。在既定市场中,没有绝对意义上的排斥竞争,各企业之间的合作融合度较强。
(5)智能医疗
目前国内智能医疗领域的研究主要集中于医疗机器人、医疗解决方案和生命科学领域。由于起步较晚和技术门槛的限制,目前国内医用机器人的研发水平和普及率相较于国际一线水平仍存在一定的差距,从事企业主要集中与手术机器人和康复机器人两大领域,以新松机器人、博实股份、妙手机器人、和技创等企业为代表。
在医疗解决方案方面,以腾讯、阿里巴巴、百度和科大讯飞为代表的公司通过和政府、医疗机构的合作,为脑科学、疾病防治与医疗信息数据等领域提供智能解决方案。而在生命科学领域,研究的着眼点在以基因和细胞检测为代表的前沿研究领域。
综合来看,国内人工智能产业链的基础技术链条已经构建成熟,人工智能技术和应用则集中在人脸和图像识别、语音助手、智能生活等专用领域的场景化解决方案上。就趋势来看,未来国内人工智能领域的差异化竞争和突破将主要集中在人工智能相关技术的突破和应用场景升级两个层面。
未来国内人工智能行业发展的五大趋势
(1)机器学习与场景应用将迎来下一轮爆发
根据 Venture Scanner 的统计,截至 2015 年 9 月,全球人工智能领域获得投资的公司中,按照平均融资额度排名的五大业务依次是:机器学习(应用类)、智能机器人、计算机视觉(研发类)、机器学习(研发类)和视频内容识别等。
自 2009 年以来,人工智能已经吸引了超过 170 亿美元的投资。过去四年间,人工智能领域的民间投资以平均每年 62% 的增长速率增加,这一速率预计还会持续下去。而在 2015 年,全球人工智能领域的投资占到了年度总投资的 5%,尽管高于 2013 年的2% ,但相比其他竞争领域仍处于落后位置。
目前中国地区人工智能领域获得投资最多的五大细分领域是计算机视觉(研发类)、自然语言处理、私人虚拟助理、智能机器人和语音识别。从投资领域和趋势来看,未来国内人工智能行业的资本将主要涌向机器学习与场景应用两大方向。
(2)专用领域的智能化仍是发展核心
基于 GPU(图形处理器)计算速度(每半年性能增加一倍)和基础技术平台的飞速发展,企业对于人工智能神经网络的构建取得了前所未有的突破。但是,由于人工智能各领域技术和算法的复杂性,未来 20 年内人工智能的应用仍将集中于人脸和图像识别、语音助手和智能家居等专用领域。
通过上述产业链环节构成和投资分类可以看出,优势企业的核心竞争力主要集中于特定领域的专用技术研发;其中,计算机视觉和语音识别领域的研发和应用已处于国际一流水平,专业应用机器人的研发也有望近 10 年内迎来突破性发展。可以预见的是,在由专业领域向通用领域过渡的过程中,自然语言处理与计算机视觉两个方向将会成为人工智能通用应用最大的两个突破口。
(3)产业分工日渐明晰,企业合作大于竞争
随着专用领域应用开发的成熟和差异化技术门槛的存在,国内人工智能产业将逐渐分化为底层基础构建、通用场景应用和专用应用研发三个方向。
在底层基础构建方面,腾讯、阿里巴巴、百度、华为等企业依托自身数据、算法、技术和服务器优势为行业链条的各公司提供基础资源支持的同时,也会将自身优势转化为通用和专业应用领域的研究,从而形成自身生态内的人工智能产业链闭环。
在通用场景应用方面,以科大讯飞、格灵深瞳和旷视科技为代表的企业将主要以计算机视觉和语音识别为方向,为安防、教育和金融等领域提供通用解决方案。而在专用应用研发方面则集中了大部分硬件和创业企业,这其中既包括以小米和 broadlink 为代表的智能家居解决方案商,也包含了出门问问、linkface 和优必选这类的差异化应用提供商。
总的来说,由通用领域向专业领域的进化离不开产业链条各核心环节企业的相互配合,专用领域的竞争尽管存在,但各分工层级间的协作互通已成为多数企业的共识。
(4)系统级开源将成为常态
任何一个人工智能研究分支都涉及到异常庞大的代码计算,加上漏洞排查与跨领域交叉,任何一家企业都无法做到在封闭环境内取得阶段性突破的可能。可以看到的趋势是,Google、微软、Facebook 和雅虎等视人工智能为未来核心竞争力的顶级企业都先后开放了自身的人工智能系统。
需要明确的一点是,开源并不代表核心技术和算法的完全出让,底层系统的开源将会让更多企业从不同维度参与到人工智能相关领域的研发,这为行业层面新产品的快速迭代和共同试错提供了一个良性且规范化的共生平台。于开放企业而言,这也确保了它们与行业最新前沿技术的同步。
(5)算法突破将拉开竞争差距
作为人工智能实现的核心,算法将成为未来国内人工智能行业最大的竞争门槛。以 Google 为例,Google 旗下的搜索算法实验室每天都要进行超过 200 次的改进,以完成由关键字匹配到知识图谱、语义搜索的算法创新。
在未来竞争的重点机器学习领域,监督学习、非监督学习和增强学习三个方面算法的竞争将进入白热化阶段。而正是算法层面的突破造就了腾讯优图、科大讯飞和格灵深瞳等企业在图像识别和计算机视觉领域取得了突破性进展和国际一线的技术水平。
但就目前国内人工智能算法的总体发展而言,工程学算法虽已取得阶段性突破,但基于认知层面的算法水平还亟待提高,这也是未来竞争的核心领域。
总的来看,虽然基础技术的成熟带来了存储容量和机器学习等人工智能技术的提升,但由于现阶段运算能力以及大规模 CPU 和GPU 并行解决方案的局限,目前国内人工智能的发展主要集中于计算机视觉、语音识别、智能生活等方向上。
虽然专用化领域的场景应用仍是目前研发和投资的核心,但随着技术、数据的积累演化以及超算平台的应用,由专用化领域的场景应用向语音、视觉等领域的通用化解决方案应该在未来 20 年内成为发展的主流。
计算机视觉研究领域范文4
清洁工、中餐馆收银员帮人遛狗,开干洗店……这些职业能和斯坦福人工智能实验室和计算机视觉实验室负责人联系到一起吗?
“人工智能”这个概念因为 AlphaGo的横空出世而快速走进了大众的视野。李飞飞最大的贡献便是她主导的图像识别项目,每年吸引着包括Google、Facebook、Amazon等科技巨头在内的上百家顶尖机构,共同向前推进机器智能的边界。
1976年出生的李飞飞,年仅33岁时便获得了斯坦福的终身教授职位,不仅是斯坦福AI实验室唯一的女性,也是计算机系最年轻的教授。在巨大的科研成就背后,这样一位美女学霸还隐藏着一段颇为传奇励志的人生。
“我们不富有,但我的学习成绩还不错――特别是数学和科学。”
生于北京的李飞飞在四川长大。父母都是当时的高级知识分子,上世纪90年代他们怀抱着一颗追求学术梦想的心,带着16岁的李飞飞来到新泽西洲 Parsippany 小镇。
虽然父母都是知识分子,但是都不会说英文。有着工程师和科学家情结的父亲到了美国,无奈只能做相机修理工作,母亲则做一名收银员。微薄的收入远不足以支撑全家的生活和学费。李飞飞不得不分出大量精力,在唐人街中国餐馆打零工。
李飞飞刚到美国时英语几乎也是零基础,如果想要进入一所好大学,李飞飞不仅要迅速掌握英语,还要拿出一份极其优秀的成绩单,只有这样,才能拿到顶尖大学的奖学金。否则,以他们的家境,是付不起美国私立名校高昂的学费。最辛苦的时候,她一天只睡4小时。聪明和韧性并存的中国性格让她在高中毕业时,收到了普林斯顿大学计算机系的全奖 offer。她的成功在小镇上名噪一时,有报纸专门刊载了她的故事,标题是《“美国梦”成真了!》
普林斯顿的学术生活对李飞飞而言是幸福的。在这里,她接触到了大量的优秀人才,完全不同于打工所经历的。但是,她的父母却仍在过着窘迫的生活。为了改善他们的生活状况,李飞飞敏锐地注意到了市场上的机会,借钱买下一家洗衣店,交给父母经营。她从此过上了双重生活,周一到周五,她是普林斯顿的高材生,拼命努力吸收知识;周六到周日,她则走出实验室,穿上白围裙,给洗衣店帮忙。
“真正的挑战是需要充分发挥自己的潜力,同时兼顾自己所身负的责任,然后又必须忠于自己的内心。”
1999年,李飞飞以最高荣誉从普林斯顿本科毕业。众多投行和咨询公司都向她发来了邀请,数十万的年薪唾手可得。但这个自从来到美国以后,就饱受经济压力的乖乖女,却少见地叛逆了一回。“作为中国人的女儿,我心中有强烈地要照顾好我的父母的责任感。如果高盛给我一个报酬丰厚的工作,我就会分心。虽然只要我接受了这个工作,就能缓解我父母经济上的困难。”
那个时候,她希望能去,在那儿做一年的藏药研究。在科学界,藏医与中医一样存在很多争议,但这并不妨碍李飞飞对它的兴趣。于她而言,藏医可以在哲学和方法论层面上给她更多的理解。她非常看重具体科研项目在更大领域范围内的意义,每一项研究开始之前都要经过深思熟虑。
归来之后,李飞飞去了加州理工学院,攻读人工智能和计算神经科学方向的博士学位。博士期间经历了一段痛苦的日子,母亲接连患上了癌症与中风,他们全家仿佛天塌了一般。“最现实的生存挑战是如何全力以赴、如何身兼重任并诚实地面对心中的梦想。我们经历了很多困难,然后一起挺过来了。”
“探寻知识和真理是流淌在我的血液里的基因,我希望可以了解全宇宙,可以成为一个富有理性思维的人。”
博士毕业后,她又选择了当时比较冷门的图像识别作为研究方向。图像识别技术,是人工智能发展道路上的一座高峰。简单来说,它就是要教会计算机看图说话。要知道,“看到”和“懂得”是不一样的。3岁儿童能从图片中识别出“猫”,可是计算机却做不到。李飞飞研究了很长时间,始终没有突破。同行的教授都劝她换个方向,以便趁早取得tenured professor(终身教授),她当然没有同意。
有一天,李飞飞突然意识到,由于人眼每200毫秒就能获取一幅图像,一个孩子可能已经获得了上亿次的图像识别训练,是计算机的几何级倍数。也就是,关键在于自主训练量。
李飞飞马上开始着手,从 twitter 上抓取海量照片,将它们统统打上标签后,训练计算机进行机器学习。机器学习就是给出一定算法,让计算机自己学习。这个过程是艰苦的。如今,机器学习已经是热门概念,可在2007年,李飞飞的实验室缺少人手,又申请不到经费,最困难的时候,她一度想重开洗衣店,筹集实验资金。
她从亚马逊的众包平台中找到了解决办法,让来自 167 个国家的 5 万人帮助为其中的数百万张图像打标签。最终,他们建立了 ImageNet 数据集。今天,这个数据集包含了使用日常英语标记的超过 1400 万张图像,跨越 21,800 个类别。
李飞飞觉得自己十分幸运。“我从 2000 年开始从事计算机视觉博士研究的时候,很幸运的成为第一批赶上这股新思想的人,刚好开始用机器学习的思路来重新思考计算机视觉里重要的感知和认知的问题。”
李飞飞还组织了一年一度的 ImageNet 挑战赛,邀请谷歌等科技巨头参赛,促进图像识别和人工智能领域的交流。李飞飞说,目前的图像识别与人工智能,还只相当于一个牙牙学语的3岁儿童。而从3岁到10岁的过程,才是AI技术的难点和关键。
现在的她,在人工智能界无人不晓。她的智慧笃定和不忘初心成就了她,各种荣誉也如雪花般纷沓而至:2006 年,微软学者新星奖以及谷歌研究奖;2009 年, NSF 杰出青年奖;2011年3月,荣获斯隆研究奖计算机科学奖;2012 年,雅虎实验室学者奖;2014年,IBM 学者奖;入选2015年“全球百大思想者”……
李飞飞在图像识别领域可谓是一个家喻户晓的人物。可以毫不夸张地说,她已经是一个站在了人类智能巅峰的华裔女性,她的研究可能改变未来的人类世界!
而这个改变了CV领域的女性,最让她开心的竟然是:“和我的孩子们在一起。我的研究领域是智能。我从他们身上学到了太多什么叫做智能,什么叫做‘做人’。没有什么比看着孩子长大成人更幸福的了。”
计算机视觉研究领域范文5
Abstract: Due to the application of visual navigation technology is becoming more and more popular, and therefore, it is necessary to study visual navigation key technologies and applications. In this paper, digital image processing techniques and location and tracking technologies are studied in details, and correspondingly, the relevant application is introduced.
关键词: 视觉导航;图像分割;定位跟踪
Key words: visual navigation;image segmentation;position tracking
中图分类号:TP39 文献标识码:A文章编号:1006-4311(2010)25-0171-01
0引言
伴随着电子技术、计算机技术工业控制技术等的发展,机器智能移动技术也得到了很大的发展。机器智能移动技术的关键部分就是视觉导航技术。视觉导航技术是在机器视觉的基础上 发展起来的。但是与机器视觉又有区别,主要表现为在机器视觉的基础上增加了定位跟踪技术,于是就产生了视觉导航技术。通常一个视觉导航系统由视觉信息采集部分、视觉信息处理部分及导航跟踪部分三大部分构成[1-2]。三部分有机结合,完成视觉导航,具体的工作原理如图1所示。其中视觉信息采集部分主要是完成对机器将要经过路线上的图像的采集,这个过程主要由摄像机(CCD)完成;视觉信息处理主要是对采集到的图像进行增强、边缘提取和分割等;利用一定的跟踪算法,实现机器的智能跟踪,即完成机器的导航。
1视觉导航的主要关键技术
构成视觉导航系统的四个部分中,其中的视觉信息处理部分和智能定位与跟踪部分是系统的核心,这两个部分用到的技术是视觉导航系统的关键技术。这些关键技术主要包括两大方面,即图像处理技术和智能定位与跟踪技术。
1.1 像处理技术在图像采集时,图像噪声的大小,摄像角度上的光线,非理想话图像处理等都会使图像质量变差[3]。再加上道路两旁及道路本省背景的复杂性,要把有用的图像信息提取出来难度很大。因此,为了更好的提取出对导航有用的图像信息,需要对图像进行处理。图像处理主要是对图像进行分割,把机器能经过的道路与路障分开来。图像分割主要包括边缘提取和阈值分割。
边缘提取。边缘主要是指图像局部变化最明显的部分,边缘是划分目标与目标、目标与背景、区域与区域的标志。图像边缘的检测主要就是利用图像像素点灰度值的不连续性,将目标和背景等不同的区域分开来。常用的边缘提取方法是模板法。模板也称为边缘检测算子,模板的数学基础的图像像素点的梯度变化。
阈值分割。阈值分割的基本原理图像中不同像素点的值不同,通过选取合适的阈值,就可以将图像划分为不同的部分。阈值分割中最典型的就是图像的二值化。图像二值化的方法很多,主要有整体阈值法、局部阈值法和动态阈值法。
不论是图像边缘的提取,还是图像的二值化。其对图像处理的效果,关系到后续的机器智能定位与跟踪。视觉导航能否实现,图像处理是关键因素之一。因此,在图像处理时一定要选择合适的图像处理算法,为后续视觉导航的实现服务。
1.2 智能定位与跟踪视觉导航技术中的另一关键技术――智能定位与跟踪。智能定位与跟踪主要是完成对安装了视觉导航系统的机器移动路径及路径上的障碍物的识别,使机器能够实现智能移动。常用的路径与障碍物识别方法有基于道路模型的路径识别方法、基于Hough变换的路径识别、基于LVQ神经网络的路径识别方法。
2视觉导航技术的应用
由于视觉导航技术的发展越来越成熟,其使用也越来越广泛。在工农业生产等各个不同的领域都有所应用。视觉导航技术的应用,给这些领域的生产工作带来了极大的便利,大大提高了机器的工作效率。
2.1 视觉导航技术在农业生产中的应用。视觉导航技术在农业生产中的应用,主要表现为农业机械的导航。视觉导航技术用于农业机械的导航,主要是帮助农业机械把目标物与周围的背景区分开来。07年,伦冠德[11]利用图像增强技术与Hough变换相结合,对传统的导航模型存在的不足进行了改进研究,研究结果表明,新方法对导航路径的识别由于传统的模型导航;09年,杨为民等将动态窗口处理技术与Hough变换相结合,对农业机械中的视觉导航系统进行了改进,并取得了较好的导航效果等。
2.2 视觉导航技术在机器人领域的应用目前世界上许多危险环境下的作业,都是由机器人完成的。比如机器人用于深海探测。机器人要自动到达既定的探测,而不因为碰到障碍物损坏,这就要求机器人必须要有视觉导航功能。05年,周庆瑞等对视觉导航技术在机器人中的应用进行的研究。利用图像的深度信心,再结合相应的校正算法与跟踪技术,实现了机器人的智能移动。
2.3 视觉导航在移动车辆中的应用。具有智能导航功能的移动车辆是当今车辆研究领域的前沿。智能车辆的导航主要是完成环境感知、规划决策和辅助驾驶等功能,这些功能的实现需要计算机视觉技术、控制技术和电子技术等的支撑。其中最重要的还是视觉导航技术。如09年,钱云等研制的基于视觉导航的智能车货物搬运系统,充分利用的图像的边缘提取技术,对智能车要经过的路径进行识别,并且取得了较好的效果。
从上面三个方面的分析研究表明,视觉导航技术在各个领域中的具体应用不同,但所使用的关键技术基本是相同的。主要都是对图像信息的处理和对运动路径的定位于跟踪。
3小结
随着机器视觉产品与我们的生产和生活越来越近,很有必要对视觉导航技术进行必要的研究及应用分析,以便人们能够更好的理解视觉导航产片的工作原理与功能。
参考文献:
[1]吴琳.计算机视觉导航综述[J].人工智能及识别技术.
计算机视觉研究领域范文6
关键词:机器视觉;自动化;图像处理
中图分类号:TP391.4 文献标识码:A 文章编号:1006-8937(2013)23-0012-021 机器视觉的定义
机器视觉是用机器来代替人的眼精来做测量和判断的一门技术。机器视觉系统是通过图像摄取装置将被摄取目标转换成图像信号,并且传送给专用的图像处理系统,把图像信息转变成数字化信号;图像系统对处理好的信号进行运算抽取目标特征,从而根据目标特征来控制现场设备的动作。
2 机器视觉技术的发展
机器视觉这门技术从80年代开始全球获得了蓬勃发展,不断涌现出新的理念。在中国该项技术自起步发展至今,机器视觉已经有20多年的历史,其功能以及应用范围随着工业自动化的发展逐渐完善和推广。研究领域发展十分迅速。机器视觉的发展已有20多年。1990年以前,仅仅在大学和研究所中有一些研究图像处理和模式识别的实验室。1990~1998年为初级阶段。主要的国际机器视觉厂商还没有进入中国市场。越来越多的电子和半导体工厂带有机器视觉的整套的生产线和高级设备被引入中国。1998~2002年定义为机器视觉概念引入期。在此阶段,许多著名视觉设备供应商,开始接触中国市场寻求本地合作伙伴。从2002年至今,我们称之为机器视觉发展期,中国机器视觉呈快速增长趋势并且应用范围广泛。
现在,机器视觉仍然是一个非常活跃的研究领域,目前国际上从事机器视觉技术研究较为成功的企业主要有:美国邦纳工程公司、捷达科技有限公司、东芝泰力株式会社等。国内深圳、广州、西安等地此项技术发展较为迅速。比如深圳市视觉龙科技、广州三拓识别技术有限公司等。
3 机器视觉技术的工作原理
机器视觉是一项包括了光学成像、传感器、图像处理、机械工程等光、机、电及计算机图像处理的综合技术。
它一般包括照明、镜头、CCD相机、图像处理软件、图像处理单元、监视器和动作执行机构等。其工作流程如图1所示。首先光源投射到被测物体,通过CCD相机捕捉获取被测目标的相关图像信息,然后通过PC机等设备A/D变换转换成数字信号传给图像处理单元,图像处理单元对捕捉到的像素进行分析运算来提取目标特征,输出判别结果,最后把处理过的相关信息传输给执行机构。
4 机器视觉技术的特点
机器视觉系统最大特点是可以提高生产的柔性和自动化程度。通常机器视觉可以代替一些人的视觉难以满足要求的场合或者不适合人工作业的工作环境。另外机器视觉系统在检查大批量生产过程中体现了速度快、精度高等特点。比如产品包装生产线的自动化程度很高,用视觉识别系统代替人工进行在线检测,可以大大提高生产效率。虽然机器视觉系统的优点很突出但是也有它的局限性,所以要根据检测对象的不同特点采取适合的方案。
5 机器视觉技术的应用
当前机器视觉的应用主要体现在以下三个方面:
第一是检测功能,它是机器视觉系统在实际中应用最多的一项功能。能够检测出包装、印刷有无错误、划痕等表面的相关信息。
第二是定位功能,能够自动判断被检测物体的位置,并将位置信息输出。它主要在全自动装配和生产过程中使用。比如自动包装、机械手等执行机构。
第三是测量功能,主要是自动测量被检测物体的外轮廓尺寸等,提高了人工作业的测量精度。
6 机器视觉技术的发展趋势
构建一个合格的机器视觉系统离不开合理的硬件搭配和可靠的控制程序。对于视觉系统的未来研究过程中,图像处理技术和运动控制技术将是整个视觉控制系统开发工作的重点。机器视觉的发展趋势主要有四点。
趋势一:产品标准化。目前从事机器视觉软硬件开发研究的公司中都开发自己独立的产品,导致各个公司生产的硬件产品不能通用,软件兼容性也存在一定的问题,造成了资源的浪费。因此,有必要设立产品软硬件的行业标准,规范各种接口定义和技术指标,降低用户使用成本。
趋势二:产品集成化。越来越多的公司正在开发集成有图像处理芯片的摄像机,这类摄像机在完成图像采集任务的同时,可以对图像进行预定的处理,输出用户指定的信息或者一定标准的图像,由于采用硬件处理图像,一般可以达到很高的处理速度,减少系统等待时间。
趋势三:图像处理软件的人性化。虽然现在的图像处理软件还需要具有图形处理知识背景的工程人员去使用,但是这些软件都在向着一个共同的趋势改变,那就是软件使用变得越来越简单,功能划分越来越细致具体。很多开发软件还提供了开发助手等工具,使即使没有专业知识的工程人员也可以很快的编写出满足要求的处理流程并自动生成程序代码。
趋势四:机器视觉与运动控制、网络化等技术的结合。视觉系统涉及到多种领域,是一种高度专业化的产品,在实际产品生产线上对多工序同步连续检测时,必须使视觉系统具备分布式联网能力。
7 机器视觉技术存在的问题
机器视觉系统在应用中也同时存在着一定的问题,比如:如何准确高速地识别出目标、解决实时性问题的能力、多传感器融合问题、视觉系统与执行机构的协调问题、系统的稳定性问题等问题。机器视觉技术比较复杂,机器视觉不能通过省法来来描述整个视觉过程。所以机器视觉系统的建立十分复杂。但随着机器视觉技术逐渐的成熟和发展,它一定将在制造企业中得到越来越广泛的应用。
参考文献:
[1] 梅江平.高速包装机器人技术与应用[J].机器人技术与应用,2007,(5):18-20.
[2] 谢勇,彭涛.机器视觉及其在现代包装中的应用[J].株洲工程院学报,2002,(4):1-4.