基于视觉导航基准线的农业机械论文

基于视觉导航基准线的农业机械论文

1国内研究近况

目前基于视觉的导航路径检测算法较多,大多基于直线模型采用直线拟合方法,通常包括图像预处理、获取导航特征点及拟合基准线3个主要环节。采用曲线模型的检测算法存在计算量大、模型复杂且适应性差等问题,且研究报道较少。

1.1图像预处理技术

通常农作物图像的预处理步骤包括灰度化、二值化、滤波及形态学运算等。具体如下:①灰度化。通常农作物与背景相比具有较高的G值,因此采用提高绿色权重的方法(如2G-R-B)进行图像的灰度化,减少后续图像处理的数据量。②二值化。目前较多采用最大类间方差法(Ostu算法)实现阈值的自适应选取。Ostu算法通用性好,不需要对像素进行训练学习,适用于不同特点、不同质量的图像。③滤波及形态学运算。应用函数窗进行中值滤波去除点状噪声,用面积属性法将余下的小面积噪声设置成背景,或用相应的结构元素进行腐蚀、膨胀运算加以修正。此外,预处理环节中还包括如下一些常用的方法。于国英等采用固定阈值分割法,用归一化的超绿特征2g-r-b并选取0.11做固定阈值分割,取得较好效果。司永胜等采用剖线图法,用G-R作为特征因子,若满足G-R>0即判该像素为作物,否则判为背景,并对小麦、大豆、玉米进行二值化实验对比,分割3幅图像分别用时9、9、10ms;而采用2G-R-B和OSTU法分割分别用时22、23、20ms,图像分割耗时大幅减少。剖线图法在常用分割算法中最为简单快速,但与固定阈值法类似都缺少对环境的适应性。安秋等针对前景与背景差异较小的灰度图,采用增强的Otsu法分割图像,即选择简单的线性拉伸变换进行对比度增强处理,然后再用Otsu算法分割取得较好效果。冯娟等对灰度化图像采用二维Otsu算法获取最优分割阈值,实现树干区域的提取。该算法既利用图像像元点间的灰度分布信息,又考虑了像元点之间的空间相关信息,分割效果优于一维Otsu算法;但算法运算量明显加大,实际应用较少。蔡晋辉等针对复杂环境下图像存在大面积反光时采用固定阈值法、最优迭代法等全局性阈值效果差的缺陷,提出分区自适应阈值分割方法:将灰度图均分为若干子区域,计算全局灰度均值M与各子区域灰度均值MeanIn[m],确定各子区域的分割阈值—BinVal[m]=MeanIn[m]+Mt(t为全局亮度调整因子,体现整体亮度对阈值的影响),对各子区域分别二值化。另一类常用的方法是将图像从RGB空间转换到HIS、HSV、Lab等空间,实现色度与亮度的分离,以弱化光照对图像的的影响。孙元义等针对棉田图像复杂背景,在图像灰度化时对近200幅动态棉田图像用2G-R-B、2H、Lab中a色度分量分别灰度化并比较,结果Lab中的a分量灰度化效果最好。王新忠等在温室垄间视觉导航路径检测中,将图像由RGB空间转换到HSI空间,提取亮度分量I后采用Otsu算法二值化,并依据人工处理效果合理设置阈值修正量δ,较好实现垄间加热管的分割识别。该类方法的不足在于模型转换涉及较多的非线性运算,程序耗时不容忽视。在模式识别方法中,张红霞等在灰度化图像的基础上采用K-means聚类方法实现苗列和背景的分割。高国琴等提取色调分量H,采用K-means算法实现温室移动机器人导航路径的识别。K-Means算法的优势在于能够实现动态聚类,具有自适应性,不受噪声和局部边缘变化的影响,但也存在计算量大及易受聚类个数与初始中心影响的缺点。蒋海波等直接在RGB颜色空间用颜色聚类方法进行图像分割,类别为路径和非路径,通过Euler公式计算图中某点RGB分量到2个颜色聚类中心距离d1和d2;如果满足d1<d2,像素点被判为路径,否则为非路径,但其缺点在于须先离线分析出两个聚类点的全局RGB空间坐标。赵博等针对影响路径识别较大的垄间杂草环境,提出神经网络分类法。网络的输入与输出是像素的灰度值,输入层的9个神经元分别代表3×3窗口内的像素灰度值,输出层的一个神经元代表窗口内像素点的分类号,剔除杂草后用普通环境下的视觉导航方法进一步识别。神经网络分类法的问题在于其泛化能力,即对于非样本输入也要能正确地映射,因此需要足够大的训练样本,但农业环境的复杂性制约了神经网络样本集的完整选取。

1.2导航特征点的提取

为准确拟合导航基准线,需要提取最能代表作物行走向的离散特征点,原则上既可以选择农作物与非农作物间的分界线,也可直接将作物行本身作为导航特征。常用的边缘检测方法是对原始图像按像素的某邻域构造边缘检测算子,如用梯度算子(Roberts、So-bel、Prewitt和Kirsch算子等)和Laplace算子分别对图像进行一阶和二阶的运算,在图像处理应用中比较成熟。近年来还出现如基于小波的边缘检测、基于形态学的边缘检测、基于模糊梯度的边缘检测、基于分形理论的边缘检测等多种新型算法;但缺点是计算复杂,影响实时性。针对农作物行图像而言,一般中间位置线较左、右边缘线更为整齐,因此作为定位基准线更具有代表意义。张卫等提出中间线检测准定位基准线,即依据预处理后的目标像素具有一定宽度的特点,逐行扫描目标区域,找出每行左、右端点并求其中点作为导航路径特征点,用于后续的中心线拟和。该方法在实时性场合获得较多应用,但其准确性依赖于之前的预处理结果。国外H.T.SΦgaard较早阐述垂直投影法,国内袁佐云最先应用垂直投影法进行作物行定位,即将得到过绿特征图像划分为若干水平条,并进行垂直投影,求取投影曲线上突出峰点的位置;用稳健回归法对位置点进行线性拟合得到作物的行中心线,在大豆作物行定位上获得验证。其算法原理简明,应用广泛,并且提取的特征点数可随图像条高度的变化而改变。姜国权等、籍颖等、曹倩等在此基础上进一步采用基于垂直投影的窗口移动法提取更多的导航特征点。

1.3直线拟合

上述导航特征点是围绕某条直线的离散定位点,在使用直线路径模型的情况下,用直线拟合方法得到真正的导航基准线及其参数。常用直线检测方法有最小二乘法、标准Hough变换及改进的Hough变换等。吴佳艺等在林间导航路径生成算法研究中,针对高大作物场景,扫描图像获得视野两边的树干与地面的交界点,计算出交点中心的一系列离散点簇,通过最小二乘法生成导航直线。但最小二乘法的缺点是抵抗噪声能力差,易受所谓“野值”的影响,当图像中噪声点较多或目标点趋于分散时,最小二乘法拟合误差较大。最直接的改进方法是根据数据点与拟合直线之间的误差分布,将误差过大的数据点剔除。例如,在数据点服从正态分布的前提下,可将与拟合直线之间误差超过2倍或3倍分布标准差的数据点去除;但实际的强噪声环境会显著提高整个数据集的分布标准差,易使噪声点被误认为正常点而无法剔除。齐保谦等提取每行植被像素的中点为特征点,用最小二乘法拟合一次,保留距离直线小于20个像素的特征点,然后二次拟合提取最终的导航基准线。1962年,Paul.Hough以专利的形式首先提出检测图像直线的Hough变换法,至今获得广泛应用。对于穴播类作物,导航特征表现为比干扰面积大得多的团块。为此,饶洪辉等对二值化图像采用8连通区域标记后据其面积属性去除噪声,再经一次标记后找出各标记作物的重心点坐标,最后通过标准Hough变换法检测作物行中心线。对于行播类作物及具有垄沟的连续导航特征,先进行预处理并提取导航区域边界,求出左右边界的中值点后直接用Hough变换检测导航特征。孙元义等、赵瑞娇等都采用标准Hough变换获得相应导航路径。对于温室垄间轮廓线的识别,李娟娟等运用Susan算子法对灰度图像二值化,采用标准Hough变换检测出两侧人工导热管线,最终提取其中间线。标准Hough变换作为一种全局检测算法具有很大的盲目性从而降低了算法的效率,因此各种改进算法层出不穷,主要集中在减少其计算的空间、时间开销。赵颖等根据已耕作、未耕作和非农田区域的不同颜色特征,判断出田端和犁沟线的位置以及方向候补点群,使用基于一点的改进Hough变换计算出犁沟线的斜率。该算法将逐点向参数空间投票的穷举式运算转化为所有点向一个已知点的投票,仅对已知点进行累加分析,大幅提高处理速度;但该方法的关键在于已知点的选取,若选取不当,会直接造成导航线提取失败。Xu等提出了随机Hough变换(RHT),其基本思想是随机选取两点可唯一确定参数空间的一点,只对多到一映射所得参数分配单元并累积。吴刚等在收获机器人行走目标直线检测中,应用随机Hough变换完成直线检测。陈娇等针对在像素空间多垄线识别出现的漏检、跨垄检与重复检的问题,首先计算出各导航定位点世界坐标,然后结合垄线平行特征,应用随机Hough变换实现多垄线的识别与定位。与传统Hough变换相比,RHT虽然具有存储空间小、速度快等优点,但其全局采样仍会引入一定的盲目性,并且算法自身存在收敛性问题,往往需要附加其它条件加以约束。周俊等针对常规方法因忽视成像透视效应造成图像平面中各像素点权重不同使得直线拟合精度受限的不足,提出一种新的Hough变换方法:把图像平面中的直线路径识别过程转化为机器人位姿空间的累加,将识别过程和位姿求取自然融合在一起,后续结合卡尔曼滤波预测提取作物边界的导航参数,解决视觉计算导致的测量状态值滞后问题。

1.4实时性措施

1)感兴趣区域(ROI)的构建。

为了提高图像处理速度,减少计算量,提取最能表现导航特征的关键区域作为兴趣区域,并以一定尺寸的窗口限定其搜索范围。冯娟等在果园视觉导航研究中,采用水平投影法提取主干区域,逐行扫描预处理后的图像求得投影曲线S(i),根据投影曲线的变化特点确定出ROI窗口的上、下界线,窗口宽度取原图像宽度,然后在ROI区域内提取树干与地面的交点作为特征点。

2)动态窗口与图像抽点简化技术。

由于Hough变换算法受直线间断的影响小,并不要求像素之间的连通性,因此可只对一定间隔的像素进行Hough变换。杨为民等采用基于Hough变换和动态窗口技术提取自然环境下的导航特征,为了进一步提高实时性,在采用动态窗口跟踪减少图像处理工作量的同时还采取了图像抽点简化技术,使每帧图像的处理时间控制在80~100ms以内,以满足导航的实时性要求。

3)带角度限制的Hough变换。

由于实际导航过程中图像具有连续性,导航特征在短时间内不发生突变。杨庆华等针对在同一片作业场景实时跟踪过程中的导航线偏角变化小,提出限定区域的Hough峰值检测,实现图像的批量处理。同样,蔡晋辉在自动导引车路径识别算法研究中,根据相邻帧中的引导线倾斜角接近,指出可由前帧中引导线的倾斜角度α确定当前帧中引导线倾斜角的可能范围,Hough变换时只对[αmin,αmax]间的角度范围加以搜索,以提高实时性。

1.5其它检测方法

于国英等在农业车辆视觉导航参数提取的研究中,在二值图像边界提取的基础上,利用Radon变换直接获得直线参数ρ和θ作为车辆的导航参数。与Hough变换相比,Radon变换计算量大,实时性差,且对检测目标的形状要求比较高,因此应用较少。姜国权等针对Hough变换计算量大、参数空间难以量化的不足,提出基于随机方法的作物行提取算法,即从定位点中随机选取2点决定一条候选直线,再根据阈值规则进一步判断候选直线的真实性,并验证其速度优于Hough变换和随机Hough变换,但算法存在判断过程复杂且人为阈值设置过多的问题。丁幼春等提出基于旋转投影法的路径识别算法,即通过角度枚举对图像ROI实施旋转投影变换,由旋转后的图像的列均值与枚举角度构成旋转矩阵R,对其行向量实施差分运算,得到差分旋转投影矩阵Rd,由Rd的极值可确定出导航路径。张志斌等针对Hough变换原理提取田间垄线存在的问题,根据垄线点空间关系,运用Fisher准则函数进行反压缩处理,得出了多垄识别统一模型;但算法复杂度过高,难以满足实时应用。李克俭等提出一种基于多次腐蚀的算法,即通过对分割后的图像进行多次腐蚀,每次相应提取一段,然后将各段导航线连接起来作为农用AGV的曲线导航线。蒋海波等在导航目标曲线检测算法研究中,应用最小二乘曲线拟合算法,采用5阶多项式对路径中心点拟合,提取出导航参数并投影至世界坐标系。但采用曲线模型的检测算法存在模型复杂和计算量的问题,而且对于复杂路径很难找到满足多种情况的曲线模型。

2国外研究近况

2003年,Francisco等尝试将立体视觉应用于自动导航的研究,在3D重构图中使用正弦模板与作物行的高度数据匹配,检测作物行位置。2005年、2008年Kise等持续研究了双目立体视觉的方法,在农田拖拉机视觉导航上尝试建立3D作物行模型,对于农田环境较理想情况下取得较好效果。但是,立体视觉算法普遍计算较为复杂,实时性成问题,且要求两个摄像头的同步性,国内相关研究不多。2003年,SΦgaard等提出了一种不用图像分割的作物行识别算法。首先为减少计算量,该算法先将图像缩小至1/9大小基础上用2G-R-B灰度化,然后将灰度图分割成15个水平条,估计出的灰度重心作为特征点,最后用加权最小二乘法提取作物行。实验中用图像中预先设置的白绳索图像作对照,与检测出来的垄基准线线进行对比,但灰度重心点计算复杂度较高,并且实验中未给出实时性指标。2004年,SHan等对玉米和大豆图像,用单色相机拍摄,在图片上、下半区中规划兴趣区域,并建立4个跟踪窗口并用K-means聚类算法来进行分割,采用矩算法来提取导航基准线,最后用先验行间距信息通过价值函数判断其结果是否接受或重新计算,将图像上半兴趣区的结果用于导航、下半兴趣区的结果用于验证算法的可靠性。但文献中并未提及如何获取兴趣区域、跟踪窗口的具体措施。2005年,Strand等提出了一种鲁棒的基于Hough变换的作物行识别方法:首先,在车身侧面的灰度相机上安装近红外滤片获取高对比度图像,运用形态学运算并固定阈值分割获取二值图像;然后,根据透视变换几何模型,根据像素坐标满足的线性方程关系,对参数航向角α和横向偏差s进行Hough变换确定导航基准线。Hough变换检测中,用近邻的多直线矩形框取代一条直线,以适应不同宽度的作物行。2006年,Leemans等对比了条播机的视觉导航的两种方法。在对图像进行预处理获得二值图像后,针对条播机留下的犁沟线的跟踪检测,采用结合递归滤波的改进Hough变换,并采用meanshift算法获取Hough空间参数;针对多作物行的检测中,提出了基于先验行间距知识与消隐点的算法,但都计算复杂且需先验知识。2008年,TijmenBakker等在温室甜菜作物行的视觉导航研究中,先通过像机标定把图像矫正到世界坐标系,并将彩色图像灰度化,然后根据先验作物行宽度知识将含3条作物行的灰度图从左到右分成3块并叠加而后二值化,最后采用Hough变换得到作物行的直线作为导航线。2012年,Romeo等也提出了一种玉米作物行识别算法。包括两部分:首先是基于模糊聚类的绿色像素分割方法,出于实时性考虑采用基于离线训练的方式事先获取的颜色阈值;然后基于先验知识与成像几何约束检测出作物行,在试验阶段针对多次减半采样图像。结果表明该方法的有效性与实时性均优于Hough变换;但算法先验知识中的假设条件过强,且与其他文献对比实时性一般。2011年,Xavier等为区分作物行与杂草,设计了一种包括并行执行的鲁棒作物行检测算法(RCRD)与快速图像处理算法(FIP)两部分的新算法。预处理阶段采用经遗传算法优化出的RGB颜色系数进行灰度化,再取其灰度均值进行阈值分割;在RCRD中,每次将连续存储的8帧二值化图片进行“与”操作,保留出最有可能代表作物行的像素,然后进行形态学去噪并生成的作物行图像;在FIP中,将图像分割成25个水平条,并采用投影法计算出可能的作物行位置,然后应用当前RCRD生成的作物行图像作匹配,并将其余部位的像素作为杂草丢弃。实验阶段对比自动识别与人工识别的效果,并在通常环境、错误播种、大块杂草及相机抖动4种环境下进行验证。2012年,Montalvo等针对高杂草环境及相机振动,设计了一种的鲁棒的作物行检测方法:首次,OSTU分割获取绿色像素,接着二次OSTU分割将作物与杂草像素区分开;然后,将二次分割后的图像与事先构建的已知作物行结构模板进行“与”操作,提取出参与作物行检测的像素并剔除野值点;最后,利用最小二乘法提取出代表作物行走向的直线。2013年,Guerrero等在此基础上,设计了作物行检测的专家系统。第1步是进行绿色像素分割,将RGB空间图像转换成GA灰度图像并采用OSTU方法分割获取植被像素;第2步是基于已知的作物行结构,将期望直线与真实作物行匹配,与并采用Theil–Sen估计器来修正结果。但方法需要事先构建已知作物行结构的模板,先验条件强。

3研究方向探讨

3.1建立合理的算法评价系统

已有研究结果表明,该领域研究主要存在的问题是算法的实时性与鲁棒性、准确性之间的矛盾,这需要根据具体作业情况进行合理的折衷。虽然目前图像处理技术发展迅速,各步骤中的精确算法较多,但大多时间及空间复杂度较高,有些只适用于实验室分析的非实时环境。由于农业机械的实时性要求,限制其在视觉导航中的实际应用。仅以直线拟合方法中的改进Hough变换为例,已有若干精确的鲁棒回归方法,如结合Hough变换与最小二乘法的直线检测、基于多分辨率的Hough变换、基于PCA参数约束的Hough变换、基于梯度方向信息的随机Hough变换、基于距离约束的随机Hough变换等,这些方法大多针对高维与大数据集的复杂图像,有些还需要引入重采样技术,因此其计算复杂度上的优势在导航直线类的低维数据集上不能够得到体现。视觉导航不仅要能准确地提取导航信息,而且要满足实时性要求。杨为民在其研究中得出若图像处理的时间过长,则导航精度和稳定性都会变差。另一方面,由于农田非结构化场景复杂多样、成像条件不可控等原因,不可避免地带来的算法鲁棒性问题。有些研究利用先验知识事先进行算法阈值设置或构建作物行模版形成特定条件下的有效算法,这些手段虽然有助于算法实现及实时性提高,但当对象或环境发生变化时,将导致算法的鲁棒性变差。相比较而言,国内研究比较重视算法的实时性比较,而国外研究则侧重于算法的可靠性与稳定性考虑,各种算法之间有时难有优劣之分。因此,建立一套科学合理的评价模型与评价系统,针对具体应用寻求最优方法的是今后的研究方向之一。

3.2基于动态过程的导航特征识别

已有相关研究成果较多集中在单一图像的静态处理方面。在动态连续的导航过程中,可根据导航特征的短时间内连续性特点进一步深入开展研究,关键是提取出稳定可靠的农田导航特征,并结合预测控制等手段提升整体导航性能。此外,高速或地面不平整等因素不可避免会引起图像采集时的运动模糊,导航特征的实时识别难度将加大。图像的运动模糊是由于成像时采集设备与目标发生相对运动而产生,可靠的动态导航也需要考虑到运动模糊图像的恶劣状况。针对运动模糊图像的导航特征实时提取,也是今后需要考虑的研究方向。

3.3复杂环境下的多作物行检测

目前,视觉导航研究中的单一行走直线检测的研究成果较多,研究目标无论是提取单一作物行还是两作物行间的中心线,研究对象无论是低矮作物还是高大树木,均有多种算法积累。相比之下,多作物行检测的研究成果较少。由于存在作物行数未知及像素间的互相干扰等问题,加之高密度杂草、变光照、复杂背景等干扰因素的影响,会加大检测识别难度,因此研究更具挑战性。已有相关研究或仅考虑近景成像,或忽略杂草影响,或复杂度过高,都存在改进与提高的余地。此外,复杂状况下仍依靠单一颜色特征识别会存在一定局限,可探索融合颜色、形状、模版或多光谱等多种手段,应用多分辨率及数据融合理论等现代数学工具,挖掘寻找简明适用的图像特征表达。

4结束语

视觉导航技术的应用是农业机械现代化的重要发展方向,应用前景非常广阔。近年来,虽然国内外学者在此相关领域取得不少研究成果,受限于环境条件的复杂性,尚不存在一种通用的解决算法。成熟可靠的视觉导航算法必须同时兼具实时性、鲁棒性、准确性。借鉴多学科交叉融合的思想,充分消化吸收相关领域的现有研究成果,追踪国内外最新研究动态,积极探索出更为先进理论和方法是当前与今后的任务。

作者:刘阳 高国琴 单位:江苏大学电气信息工程学院 南通职业大学电子信息学院