三维图像范例6篇

三维图像

三维图像范文1

关键词关键词:三维人体;图像分割;虚拟现实

DOIDOI:10.11907/rjdk.162820

中图分类号:TP317.4

文献标识码:A文章编号文章编号:16727800(2017)005019203

0引言

三维人体模型在现阶段被广泛应用于医疗、电子游戏、虚拟现实等领域。目前,获得三维人体模型的方法主要有两种:①利用专业建模软件如3DMAX等绘制人体的三维模型。这些模型精度高、专业性强,一般用户很难做到精准操作;②利用三维扫描仪自动获得真实人体表面的几何数据,但是需要硬件设备和比较高的建模成本。因此,这两种方法均不适用于快速生成大量的、低成本的人体模型。为解决这一问题,文献[1]提出了基于物w的图像变形概念,使用分水岭算法进行图像分割,将目标物体置于三角网格中,使用户可以用语义化的操作实时调整目标物体的形状造型,但是在人体形变方面并没有很好的应用效果。文献[2]将三维的人体扫描结果作为基础,对多个人体皮肤表面模型进行插值,生成个性化的人体皮肤表面模型,这种方法虽然快捷、简便,但仍需要硬件设备并且不具备全局形变能力。文献[3]构建了一套基于多幅图像的三维人体建模系统,此系统以图像上和原始模型上标记的特征点数据作为输入,采用对原始模型变形的方法,获得较精确的目标模型。但该方法需要输入原始的三维模型以及在不同方向进行定标并用摄像机拍摄,流程较为复杂,耗时较长。

本文从普通的二维人物图片出发,提出了通过人体轮廓线生成三维环形点列从而生成人体模型的方法。就目前的实际应用而言,使用图像来展示人物对象是十分真实的,图形数据量大,且真实人物并没有统一的建模方法,而图像则可以避免这些问题,方便于网络传输。例如在网络虚拟试衣过程中,顾客可以通过调整模特的照片来使之更符合自己的身高体重三围,也可以通过简单的可视化操作,来改变自己照片上的人物胖瘦高矮,并在整体上保持协调性和一致性。

1二维人体轮廓提取

对于图片的轮廓提取,现阶段已经有很多成熟的方法。本文利用grab cut方法提取图片中的人物轮廓,该算法利用了图像中的颜色信息和边界信息,只要少量的用户交互操作即可得到比较好的分割结果,用户在原始图片上将人物框入矩形框,便能自动提取出人物前景和轮廓线。如图1(右)所示即为分割提取后的前景人物,背景为黑色。

通过简单的交互标记,可以确定轮廓线上四肢与身体的连接点以及各身体部位各自的轮廓线,如图2所示。

2从轮廓线生成三维人体网格

通过计算出每条轮廓线上每两个轮廓点间的长度并求和来获得每个身体部位的轮廓线总长度如下:

Stotal=∑n-1i=1SPi+1Pi

式中,Pi为第i个组成轮廓线的轮廓点,从上述过程获得各对应部位轮廓线长度后,在同一部位的内外轮廓线上各平均取K个点两两连线成段对轮廓线进行分割,这样的点称为定位点,图3是右臂轮廓线分割示意图。

因为定位点位于人体轮廓线上,这样的线段在一定程度上表示人体肢体的胖瘦程度,以屏幕为xy轴平面,以垂直于屏幕方向的法线为z轴,在起始状态时,各分割线段两端定位点的z值为0,经过该线段中点M且垂直于该线段的向量为Pm,使用如下三维空间中的旋转矩阵将两端的定位点沿Pm进行旋转。

cosα+(1-cosα)x2(1-cosα)xy-(sinα)z(1-cosα)xz+(sinα)y(1-cosα)yx+(sinα)zcosα+(1-cosα)y2(1-cosα)yz-(sinα)x(1-cosα)zx+(sinα)y(1-cosα)zy+(sinα)xcosα+(1-cosα)z2

式中,α为旋转的角度,x、y、z是向量Pm的坐标值,每旋转α度进行定位,共进行180/α次旋转,经过旋转后生成的点如图4所示。这样就从原始的二维轮廓线得到了三维坐标系中新的立体环形点列。

每个身体部位都有K个这样的环形点列,如图5所示。

计算完所有部位的三维环状点之后,就有了初步的人体三维化模型,接下来需要通过互相连接三维圈中的点生成面片。由于在形成三维圈时,圈上点的标号是固定并且已知的,选取下式中上下相邻点列中的点生成三角面片。

(Fi,j,Fi,j+1,Fi+1,j)(Fi,j,Fi+1,j,Fi+1,j+1)

式中F表示相邻点列的编号。这样就得到了从普通二维图片生成的三维人体网格模型,如图6所示。

由于在计算手肘,膝盖等部位时可能会有较大的方向变化,因此要将手臂分为大臂与小臂,腿部分为大腿与小腿,分别进行环形三维点列的生成,并且在手肘处和膝盖处对应的定位点生成点列,这样获得的点列在之后生成面片连接时就可以避免上述问题。

身体各部位的三维横截面是可以进行放缩形变的,由如下三维缩放矩阵所示。

Sx0000Sy0000Sz0(1-Sx)・Xf(1-Sy)・Yf(1-Sz)・Zf1

其中,点(Xf,Yf,Zf)是环形点列的圆心坐标,即定位点对的中点坐标。

通过将每个环形点列沿其径向方向进行缩放,可以改变三维人体模型的身材比例和样式,如图7所示。

3实验及应用

模型中每一个三维环形点列的点的个数可以调节,每次旋转的α角度越小,得到的点数越多,模型越精细,但同时会降低效率。表1为不同点数的点列形变效果和耗时,对应的三维人体模型如图8所示。

采用纹理映射的方式可以使三维人体网格上填充相应的纹理图案。纹理映射是真实感图像制作的一个重要部分,通过在(0,1)插值计算的方式获得每一个网格点在原先二维图片中的纹理坐标。

图9是将原先人物照片纹理映射到三维人体网格上并进行胖瘦变化的效果。

4结语

本文从二维人体轮廓线出发,通过轮廓点找到每个身体部位内外轮廓线的定位点,通过一对二维定位点,生成三维圈,通过连接前后三维圈上的点形成三角网格,计算纹理坐标并对三维圈进行缩放变换,便可以实现二维图片中的人体胖瘦变化,且可以选择各部位进行自由放大缩小,并能保证任意形变不失真。实验证明本文方法是可靠可行的,在当前庞大的互联网服装销售背景下,该方法在虚拟试衣、休闲娱乐方面具有很大应用价值。

参考文献参考文献:

[1]WA BARRETT,AS CHENEY.Objectbased image editing[J].Acm Transactions on Graphics,2002,21(3):777784.

[2]SEO H,CORDIER F,PHILIPPON L,et al.Interactive modelling of MPEG-4 deformable human body models[EB/OL].http:∥miralab.unige.ch papers 115.pdf,2004.

[3]王征,O济洲,孙美君.基于多幅图像的低成本三维人体重建[J].计算机应用,2009,29(7):19101913.

[4]刘松涛,殷福亮.基于图割的图像分割方法及其新进展[J].自动化学报,2012,38(6):911922.

[5]S ZHOU,H FU,L LIU,et al.Parametric reshaping of human bodies in images[J].Acm Transactions on Graphics,2010,29(4):157166.

[6]MJ BLACK,AO BALAN.Detailed human shape and pose from images[C].In CVPR,2007.

[7]TJ CASHMAN,AW FITZGIBBON.What shape are dolphins? building 3D morphable models from 2D images[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2013,35(1):23244.

[8]B ALLEN,B CURLESS,POPOVIC',ZORAN.The space of human body shapes:reconstruction and parameterization from range scans[J].ACM Trans.Graph,2003,22(3):587594.

[9]Y YANG,Y YU,Y ZHOU.Semantic parametric reshaping of human body models[C].International Conference on 3d Vision,2014:4148.

[10]H SEO,N MAGNENATTHALMANN.An example based approach to human body manipulation[J].Graphical Models,2004,66(1):123.

[11]N HASLER,C STOLL,M SUNKEL,et al.A statistical model of human pose and body shape[C].Computer Graphics Forum,2009:337346.

[12]AO BLAN,MJ BLACK.The naked truth:estimating body shape under clothing[C].In ECCV ’,2008.

[13]X CHEN,Y GUO,B ZHOU.Deformable model for estimating clothed and naked human shapes from a single image[J].Visual Computer,2013,29(11):11871196.

[14]L PISHCHULIN.Articulated people detection and pose estimation:reshaping the future[C].IEEE Conference on Computer Vision & Pattern Recognition,2012:31783185.

[15]D VLASIC,I BARAN,W MATUSIK,et al.Articulated mesh animation from multiview silhouettes[J].ACM Trans.Graph,2008,27(3):97.

[16]L BOURDEV,J MALIK.Poselets:body part detectors trained using 3D human pose annotations[C].In ICCV,2009.

三维图像范文2

关键词:三维图像;节奏;韵律

中图分类号:J04 文献标识码:A 文章编号:1005-5312(2010)06-0056-02

三维图像艺术是在现代数字技术与传媒迅速发展的浪潮中伴随着媒体艺术发展的兴起应运而生的,是数码设计艺术的一个组成部分。三维图像艺术的美,一方面体现在对客观社会的反映,一方面又体现在主观的审美理想和情感愿望,是客观和主观的统一,又是内容与形式的统一、个性与共性的统一,而这些正是艺术的本质和特征。

与二维图像相比三维图像携载更多信息,而由于一切复杂的视觉形态都是由最基本的造型元素所构成,从三维设计软件输出原理可以看出三维图像最终是二维的(三维软件设计的原理是根据人类眼睛的视觉原理是通过大脑将二维图像映射到视网膜上,三维软件就是同时向每只眼睛呈现一幅二维图像让产生的视觉印象使大脑误以为这是三维图像),其本质是平面的。

正是因为其平面的特性,我们如果将三维图像艺术中一切元素看成点、线、面,按一定规律进行组合,经过仔细观察我们可以发现三维图像艺术中蕴藏着的点、线、面组合的有规律的美。

以点为例,在三维图像中点是最基本和最重要的元素,点可以有各种各样的形状,有不同的面积,两个以上的点,可以有不同的对应关系,如并列、上下重叠、大小不同对比等,各有各的视觉感受。点可以是画面中的一部分,也可以是图片1中一样营造一种视觉中心,用以吸引观者视线集中。在这里我们可以看出点主要进行的是通过对位置的摆放来达到对观者视觉牵引的实现。由于点本身就具有集中、吸引视线的功能,而与二维图形不同,在三维图像中,点即可以是位置变化的组合,也可以是集合产生面,还可以是自身就呈现一种深度感,这原本就是三维图像本身的特性,但正是这种特性本身赋予了构成以新的内容,使点在三维图像中加强了其本身具有的内在的张力和扩张感,更加强了其视觉引导作用。点的性质是不同的,典型的点是小而圆的,如图1中给人以饱满、充实、运动的感觉,而图片2中方形点给人稳定、静止、坚实的感觉,而由于其位置的摆放还是人产生自由、轻松、随意的感觉。

三维图像中点主要还是强调位置与摆放,可与之相比线更强调方向与外形,不同的线的排列与外形产生的审美感觉完全不同。而且在三维图像中,线不仅有了长度、方向和位置,还有了宽度和厚度,这些都加强了线在三维图像中的视觉表现力,使一些平行的线条不仅体现一种平面效果同时具备了更深层次的视觉延展感;而一些交叉线条不仅会有前与后的层次变化还会有更深的空间重量感和存在感;而深浅对比使线条产生前驱或后缩更加强了三维视觉错觉的深度。而且在视觉心理上,图片3这种由点的连接形成的左下角至右上角的对角线,再画面布局中它的生成方向指向上方。使之产生了向上、起飞等积极的含义。而线的排列离了水平或垂直两种稳定的状态,使画面更富于深度与动感,并在空间中加强了透视的空间感与深度的延展。

与图片3不同,图片4中是对于具有女性化特点的具有柔软优雅感觉的线的运用,它不仅具备了上述三维图像中线的特点,还通过对具有力度的相对稳定的水平的线的对比,形成了空间中优美的旋转交错的线的姿态,在这里,线的特性在借助三维图像赋予了更多的细节与写实性的特点得到了更好的表现与视觉体现。

在几何学中,面是线移动的轨迹,而面与点相比,在平面中它是一个平面中相对较大的元素,点强调位置关系,面强调形状和面积,包括画面中不同色彩间的比例关系,点、线和面之间没有绝对的区分。但是在三维图像中,点、线的内容由于计算机技术的特点发生变化,相应的面的特点也得到了充实与提升。在三维图像中一大堆的,数量较多的面再通过其中的点、线进行组织可以排列出具象而有丰富内容的有美感的画面。同时在一个定格的二维画面中点、线、面的组合的过度的因素较多,点、线、面之间不会孤立地存在,彼此之间以不同形式的过渡相互连接着,并形成不可分割的整体。以图5所示,面在其中的量感大大加强,点与点之间通过线相互串联并形成面,点、线、面在图中的审美构成和谐,画面中以点排成的面与留白一起产生平面上的空间感,既让人产生具象的直观感受,又通过这种视觉上的整体感与块面感,充分体现了线的面化带来的视觉美感。

点、线、面在画面空间的交织或通过连续的重复运动中的分节才产生了韵律与节奏。三维图像正是因为其工具与载体是原本为平面上的内容―点、线、面拥有了更多的细节与视觉特点,点、线与面的组合或长与短或多与少或大与小或直与曲或明与暗等。由此,视觉产生了强与弱、轻与重等心理感受。这与音乐、诗歌中节奏产生的感受是相通的。而这种节奏与韵律使观者产生了平缓、激烈、轻快、沉稳等心理感受。不同的组合规律,不同的运动节奏,各自表现出不同的个性。视觉从中体验到多姿多彩的审美情趣。而这些正如我们在日常生活中的波浪的运动、四季的变化、植物的生长、星辰的运行等等形成了生命中美的韵律与艺术的根源。图6中正是利用对车上的叶子的投影这个点的大量重复与有规律的组合来表达作者对于光与影的交错表现阳光的明朗这个创作主题。光影在画面中错落有致的布局,点与面的交错,不仅使画面显得轻快沉稳,也使画面视觉感受有节奏与韵律自由随意。

三维艺术的创作者们利用点、线、面的巧妙组合在三维图像中创造出具有幻觉性的,并不是实际意义上视觉的的立体和空间。他们通过点、线、面的组合塑造形象的大小、方向、位置、投影、透视关系等关系使观者在实际是平面的载体(例如电视、电脑屏幕、投影屏幕)中使人产生立体的幻觉,从而导致幻觉的空间感,让人的视觉跟随点、线、面的组合流动凸凹起伏,在平面上巧妙创造出的三维的体积感。

参考文献:

[1]尹定邦.论形与它的要素[M].长沙:湖南科学技术出版社,2000年版.

[2]尹定邦.图形与意义[M].长沙:湖南科学技术出版社,2001年版.

三维图像范文3

【关键词】 血管

摘要:序列图像的计算机三维重建是应用数学和计算机技术在医学与生物学领域的重要应用之一。依据一根血管的一组平行切片图,运用有效的数学方法,在计算机上成功再现了其三维图像。

关键词:位图;三维重建;中轴线;曲线拟合

血管三维重建问题来源于序列图像的计算机三维重建[1,2]。序列图像的计算机三维重建是应用数学和计算机技术在医学与生物学领域的重要应用之一。

为研究生物体的复杂结构,常将其本身或局部做成切片。切片图像序列把生物体内部的各种复杂结构和变化一层层地暴露出来了,人们通过依次对每张切片图像的观察、分析和比较,综合起来可以形成对生物体内部结构的立体认识。从几何角度看,这种综合就是由切片图像序列恢复生物体内部结构的几何形状,称此为序列图像的三维重建。这项工作,过去是在人脑中进行的,专业人员通过观察,凭经验在自己头脑里想象出生物体的内部结构和几何形状。在今天当然把这项繁杂的工作交由计算机完成,实行序列图像的三维重建的计算机化、自动化。序列图像的计算机三维重建是切片制作的逆过程,很复杂,需要综合运用图像处理、图形学、计算机辅助几何设计等多学科的方法,是当前研究的前沿和热点课题之一。

血管是血液流通的通路,其在生命活动中的重要性众所周知,诊断师在临床中经常需要了解血管的分布、走向等重要信息。理想的血管可以看成是粗细均匀的管道,如何建立其数学模型是图像三维重建的重要一环。

2001年全国大学生数学建模竞赛题目为“血管三维重建问题”,要较好解决该问题,远非建模竞赛要求的三天所能完成。因此,竞赛结束后产生的优秀论文中都存在不完善之处,本研究的目的正是基于此而产生的。

1 问题的提出

假设某些血管可视为一类特殊的管道,该管道的表面是由球心沿着某一曲线(称为中轴线)的球滚动包络而成。例如圆柱就是这样一种管道,其中轴线为直线,由半径固定的球滚动包络形成。

现有某管道的相继100张平行切片图像,记录了管道与切片的交。图像文件名依次为0.bmp、1.bmp、…、 99.bmp,格式均为BMP,宽、高均为512个象素(pixel)。为简化起见,假设:管道中轴线与每张切片有且只有一个交点;球半径固定;切片间距以及图像象素的尺寸均为1。

取坐标系的Z轴垂直于切片,第1张切片为平面Z=0,第100张切片为平面Z=99。Z=z切片图像中象素的坐标依它们在文件中出现的前后次序为

(-256,-256,z),(-256,-255,z),…,(-256,255,z);

(-255,-256,z),(-255,-255,z),…,(-255,255,z);

……

( 255,-256,z),( 255,-255,z),…,(255,255,z)。

为了在计算机上再现血管的三维形态,需要计算管道的中轴线与半径。

2 管道半径的求解

求解管道半径有多种方法。但建模竞赛的优秀论文中以“平均法”和“抽样法”居多[1]。所谓平均法就是求出每张横断面图像内的最大内切圆半径,再取管道半径为它们的算术平均值。此方法的缺点是要以每张图像内的每个象素点作为圆心,令每张横断面图像内的内切圆半径值由小到大,动态地逼近最大内切圆半径的求解过程,其计算量相当庞大,计算机程序运行困难,优秀论文的作者中许多人提到这一点。

所谓抽样法就是利用滚动球半径是常数,取前几片横断面图像内的最大内切圆半径的平均值为管道半径的值。此方法正是意识到平均法计算量的庞大而提出的。其缺点是抽样样本数目选取的合理性较难确定,因样本数目少而存在计算误差。

本研究求解管道半径的方法是:首先将100张图片叠合,形成如图2(a)所示的一张图片。由于切片垂直Z轴的,此图片是血管在XOY面上的投影图像。因此,它也是滚动球在XOY面上的投影――滚动圆,沿中轴线的投影线滚动形成的二维包络图, 且滚动球的半径与滚动圆的半径相同,因此只需求出滚动圆半径。具体图像叠合的方法是首先运用Photoshop软件打开0.bmp 图片,再将1.bmp~99.bmp图片(共99张图片)通过叠加控件叠合。

为简化求半径的复杂程度,取图2(a)区域的一部分(图2(b))。利用计算机编程搜索图像边缘点得到边缘曲线AB和AB,记录其坐标,即两条曲线上象素点的坐标(个数有限)。在凸弧AB上任取一点M,扫描计算凹弧AB上所有点到M点的距离,确定其最小值,此即所求滚动圆直径,本研究计算的半径结果是29.5个单位。

此方法的主要优点是选点M是任意的,即无限制,而且只需扫描AB一侧所有点,大大简化计算量。事实上在编程计算时,还可使弧AB更短,这样做显然并不改变计算的精确性。

查阅到的获奖论文中,大多是对一张图片(而非叠合图片)进行扫描,计算涉及两侧间所有点间距离,还要涉及最小和最大值的比较问题,然后对几张图片做上述类似工作,再取均值。相对而言,本研究方法无论是在计算量还是在精确度上都较为优化。

3 中轴线方程的求解

31 切片图像最大内切圆的存在性证明

依据基本假设:视血管表面为一类由球心沿着某一曲线的球滚动包络而成的特殊的管道,且管道中轴线与每一张切片有且只有一个交点,可知滚动球是沿中轴线严格单调上升的。

切片图像的产生是滚动球上升过程中与该切片所在平面相交而产生的一系列二维区域(圆域)的并集,从球与该平面接触到球离开该平面过程中,由滚动球严格单调上升性,球心与该平面相交且仅相交一次,此时形成最大的圆域,亦即该切片图像内存在唯一最大内切圆。

上述证明过程表明最大内切圆的圆心为中轴线与该切片的交点,最大内切圆的半径为滚动球的半径。

32 切片图像最大内切圆圆心的求解

求解每张切片图像最大内切圆圆心的方法有多种。但建模竞赛的优秀论文中以“枚举法”和“平行切线法”居多[1]。

所谓枚举法就是求每张横断面的图像内的最大内切圆的圆心时,以位于图像内每一个象素为圆心作圆.遍历所有象素点后再作确定。此种方法,由于每次做圆的过程半径是由小到大动态的,最大圆是经过两次循环获得的,计算量巨大。

所谓平行切线法就是横断面的图像边界上的两点的连线如果同时垂直边界在这两点处的切线,则这两点连线有可能是最大内切圆的直径。发现所有具有这样性质的点对,并检验之,以确定最大内切圆的圆心。此方法的缺点是缺乏合理性的理论证明,事实上未见有论文对此证明。另外在象素表示边界线这种离散状态下,判断“垂直”性方法并不明确。

本研究求每张切片最大内切圆的具体方法:首先扫描确定区域,如图3阴影部分所示。再以区域内每一象素点为圆心,29.5为半径按照计算机图形学中圆的Bresenham算法[3]做圆,尽管圆心变化,但因半径固定,此算法得到的圆周象素点个数及圆周的象素表示形状固定。程序中做一计数器,将区域内所有象素点的初始值赋值为0,每次做圆过程中,将在圆周上的区域内的点的计数器值加1,扫描区域内所有点后,区域内计数器值最大的点即为最大内切圆圆心。

上述做法的合理性是:如图3所示,圆O是最大内切圆,而圆O为某一个非最大圆。由于半径是固定的,圆心象素点的计数器值增加当且仅当它位于以它的圆周上区域点为圆心的圆周上。由此可知圆心点的计数器值等于其圆周上点位于区域内象素点的个数。从图3可看出,圆O的圆心计数器值明显大于圆O的圆心计数器的值。

该方法的优点是最大内切圆的圆周不必全部在区域内部,即最大内切圆的圆心象素点的计数器的值可能小于其圆周点象素的个数,而只需计数器的值最大即可。这样可忽略真实切片边缘进行数码转换(象素显示)时的误差。在bmp格式下,二维切片边缘并不是平滑的曲线,而是齿状形式,在对血管切片获取的过程中就有误差产生,不应该通过判断其是否全在黑色区域内来找到最大内切圆,如果某一圆只有一象素点不在黑色区域,可能该圆是实际血管切片(未转化为bmp格式之前血管切片)的最大内切圆,且实际只能存在一个这样的圆。

33 中轴线方程的拟合求解

利用所求得的最大内切圆圆心坐标,通过Matlab软件中的曲线拟合函数ployfit得到中轴线方程。由于方程的特殊性,本研究采取分段拟合的方式。

计算结果为:t=0~29X(t)=0.00090547846488*t.^3+0.0067784235874*t.^2+0.0784535895423*t.-0.295780088597090

Y(t)=-0.006008085052*t.^2+0.147566585759*t+149.264564456547Z(t)=t

t=30~99X(t)=0.000036785469*t^4-0.010418543628*t.^3+1.057784235874*t.^2-35.057946695578*t.+469.5578462318

Y(t)=0.0000458326*t^4+0.00098784455346*t^3-0.345864521232*t.^2+22.175546489658987*t-202.11102121284

Z(t)=t

依据上述方程,利用Matlab软件或Pro/engineer软件都可在计算机上再现该血管的中轴曲线及血管本身的三维图像。

参考文献

1 汪国昭,陈凌均.血管三维重建的问题.工程数学学报,2002,19 supp(2): 55~58

2 应荣超.人下颌下腺淋巴管、血管和腺导管的计算机三维重建技术.解剖学报,1991,22 (4):342~346

3 潘云鹤. 计算机图形学―原理、方法及应用.第一版.高等教育出版社,2002,37~45

4 郎锐.数字图像处理学 visual C++实现. 北京希望电子出版社,2002,58~64

三维图像范文4

【关键词】SIFT;图像处理;匹配;欧氏距离

【Abstract】In the process of the 2D image restoration into 3D structure, image matching technology is one of important link. Due to image translation, rotation, scaling, and the advantages of affine transformation keep invariance, SIFT algorithm is the most widely used. SIFT algorithm, however, the inherent defects, such as matching SIFT points limited number, high repetition rate and the low accuracy in the shape of a lot of similar area matching, matching time is long, etc. Based on the simplified model of SIFT two-way match[1], at the same time increase the matching conditions improved distance matching combined with cosine matching[2], the experimental results show that the improved SIFT algorithm to shorten the operation time, improves the precision of matching, can be better applied to image matching..

【Key words】SIFT; Imageprocessing; Matching; Euclidean distance

0 引言

图像特征在图像处理中具有非常重要的意义。目前,几何特征、彩色特征、纹理特征和特征点在目标识别、运动估计和立体匹配等领域中均已得到了一定程度的应用。在实际应用中,图像经常会发生变化,提取具有较强鲁棒性的图像特征就显得尤为重要。近年来,双目立体视觉技术成为研究的热点,其中,如何有效的提取图像特征进行立体匹配是核心技术之一。

本文采用目前图像匹配领域最活跃的SIFT[3](Scale Invariant Feature Transform,尺度不变特征转换)算法进行图像匹配。针对SIFT匹配点数量有限重复率高,在大量形状相似区域匹配正确率低,匹配时间长的缺点,在保持原算法优良特性前提下,采用简化SIFT模型,在距离匹配与余弦相似度匹配相结合的基础下,同时采用双向匹配,不但缩短了运算时间,而且提高了匹配的精准度,一定程度上提高了匹配的准确率。

1 标准SIFT算法

4 结束语

本文在分析原SIFT算法的基础上,尝试对原算法进行改进,继承了原算法的优良特性,同时减少运算时间,提高匹配效率。但是,匹配精度和匹配时间不可同时达到最大,如何选择最优化,将是我们要深入研究的后续问题。

【参考文献】

[1]刘焕敏,王华,段慧芬.一种改进的SIFT双向匹配算法[J].兵工自动化,2009,06:89-91.

[2]白廷柱,侯喜报.基于SIFT算子的图像匹配算法研究[J].北京理工大学学报,2013,06:622-627.

[3]汪松.基于SIFT算法的图像匹配方法研究[D].西安电子科技大学,2013.

[4]杨晶晶.数字视频图像预处理算法的研究与实现[D].复旦大学,2012.

三维图像范文5

Abstract: VTK(Visualization Toolkit) is areconstruction and visualization toolkit with strong function. This paper first automatically and accurately segments the human MR brain regions using an active contour model and reconstructs the 3D model of the human brain using VTK with VC++, the results show that VTK can help to develop the 3D visualization system of medical images in PC environment.

关键词:VTK;MRI;图像分割;三维重建

Key words: VTK;MRI;image segmentation;3D reconstruction

中图分类号:TP391文献标识码:A文章编号:1006-4311(2010)35-0119-02

0引言

近20年来,尽管计算机断层技术(CT)、核磁共振成像(MRI)和超声(US)等医学影像技术已广泛用于疾病的诊断,但它们只能提供病变部位的一组二维断层图像,医生只能凭经验估算出病灶的大小及形状,缺乏客观性和准确性。得到人体器官准确的形态描述对医学诊断、医学教学以及手术规划方面有广泛的应用前景,近年来已经成为医学图像处理界的热点,尤其是从MRI或CT图像入手来重建三维模型的方法得到了很大的发展,MRI三维结构重建也是结构成像和功能成像融合的必要步骤。由于人脑结构十分复杂,所以能够真实反映脑组织结构的脑模型的三维重建也就显得尤为重要。核磁共振图像(MRI)脑区分割是将脑部组织从非脑组织中分割出来,去除脑外组织。脑组织的准确分割不仅是其他图像处理算法例如配准、脑组织分类或者灰度不均匀性校正等的预处理步骤[1],也是脑组织体积测量以及实现三维重建的关键技术。

目前国内外都开发出了一些优秀的可视化系统,例如Cube-3、AVS、VolVis、 apE、 3DVIEWNIX、VolView等。但是它们无一例外都要求具有高性能图形工作站的支持,这些系统在功能上各有长短,但大都是在工作站上开发,或者与医疗设备捆绑销售,不仅软件且所需硬件设备价格昂贵,升级维护成本高,使用不太方便,在国内难以普及。VTK(Visualization Toolkit)[2] 是一种基于OpenGL的具有强大功能的用于3D图形学、图像处理及可视化的一种工具包,它是一种基于OpenGL的3D可视化工具,包含500多个类库,可以通过调用类库,快速高效地进行体视化的开发,拥有强大的三维图形功能。开发者可以在VTK基本函数的基础上根据自己需要开发自己的库函数。而且由于VTK是开放式的免费软件,且具有强大的三维图形功能、良好的体系结构和高度的灵活性、可移植性,目前在世界各国的高校、研究所已经得到了广泛的应用。

本文首先使用主动轮廓模型自动、准确的分割人脑MR图像脑组织区域,然后使用Visual C++开发环境结合VTK工具对分割后的人脑MR图像脑组织区域进行三维重建,结果表明基于VTK的三维可视化研究具有广阔的应用前景,可为下一步探索开发基于VTK的医学影像三维可视化系统打下基础。

1基于主动轮廓模型的人脑MR脑区自动分割

1.1 水平集方法Osher 和Sethian[3]提出了水平集模型,其基本思想是将平面闭合曲线隐含地表示成高维曲面函数的水平集,通过高维函数曲面的进化隐含地求解曲线的运动。演化曲线用C表示, 函数的零水平集表示为:

c(t)={(x,y)│(t,x,y)=0}(1)

根据链式法则,将函数(x,y)的水平集方程表示成:

t+F││=0(2)

其中函数F为速度函数,是梯度算子。

1.2 使用SPF函数的几何活动轮廓模型几何活动轮廓模型(Geometric Active Contour Model)是由Caselles与Malladi等人[4,5]分别独立地提出的基于曲线演化和水平集方法的活动轮廓模型。几何活动轮廓模型利用水平集函数来隐含地表示模型轮廓线,从而成功地解决了轮廓线拓扑变化的问题。传统的几何活动轮廓模型的曲线演化方程可表示成以下形式:

=g││(k+v0)(3)

其中是演化曲线C所对应的水平集函数,即水平集函数用其零水平集来表示曲线C。k表示曲线的曲率,v0是一常值系数,g是一个依赖于图像特征的图像边缘指示函数。

符号压力函数(signed pressure force,SPF)也可以称为区域函数,具有图像统计特征信息的SPF函数的取值范围为[-1,1]。区域函数利用区域信息调节压力的符号,使得当演化曲线位于感兴趣区域内部时演化曲线膨胀或位于外部时收缩。符号压力可以解决所谓的由弱边缘引起的边缘泄露问题。 因此,本文使用SPF函数构建活动轮廓模型用于人脑MR脑区自动分割,其水平集方程为:

=spf(x)(k+v0)││,x∈Ω(4)

其中k,v0的定义与方程(3)式相同。

构建的SPF函数如下:

spf(x)=,x∈Ω(5)

其中c1和c2为两个常数,分别为轮廓线内、外图像灰度的平均值。G表示标准方差为σ的二维Gaussian滤波器,*表示卷积算子。

2基于VTK的人脑MR脑区三维重建

医学图像的三维重建方法主要有两大类:面绘制算法和体绘制算法。面绘制的特点是提取出所要查看的结构的表面轮廓,用算法把某种几何面片施加到每一轮廓点上,再除去隐藏面并进行明暗处理就得到绘制的表面。面绘制技术的优点是轮廓数据量小,因此绘制速度快。但该方法只能表现物体的表面舍弃了物体内部的大量信息,对于复杂的人体器官则无法准确描述。体绘制算法的最大特点是不需要构造物体表面的几何信息,而直接基于体数据进行显示。这种算法使得细节信息得以保留,结果的保真性高,更能反映真

实的人体结构;但计算量很大,相对面绘制算法重建时间较长。由于基本方法的不同,这两种方法在绘制的效果、时间等多方面都存在着很大的差别。本文表面绘制用的是移动立方体(marching cubes)方法,体绘制用的是合成(composited)体绘制的方法。

3结果

3.1 MRI数据来源与方法数据来源为首都医科大学宣武医院提供的五例健康成年人的头部MR图像,应用德国SIEMENS公司AVANTO 3.0T磁共振系统。扫描参数如下:矩阵256x256,共计176层,扫描范围从左到右包括全脑,层厚为1mm,层间距为0mm,层内像素间距离0.5mm。图像分割软件环境: Matlab 6.5, 三维重建软件环境:使用Visual C++开发环境结合VTK实现,硬件环境:CPU: Intel 双核T6500,内存2G。

3.2 人脑MR脑区自动分割和三维重建结果人脑MR脑区自动分割结果如图1。采用面绘制和体绘制三维重建整个脑部的效果如图2。

4讨论

通过对重建效果和速度进行比较,可以看出,面绘制重建结果细节表现上不如体绘制;但是重建速度远快于体绘制。缺点是内部信息的丢失比较大,其物体仅仅显示为一个空壳。与面绘制相比,体绘制可以将各组织器官的形状特征及相互之间的层次关系表现出来,不丢失细节,缺点是运算速度较慢,而且每次改变视角和光照时,要重新进行投影运算,难以运用到实时绘制中。下一步的工作考虑将面绘制和体绘制算法相结合,开发新的混合绘制算法。

目前,国内外许多著名大学和研究机构都在利用ITK和VTK进行医学图像处理系统的设计和开发。从三维重建效果来看,VTK作为一种图像处理和可视化工具包,具有广阔的应用前景。因此,如果基于VTK可视化平台,将面绘制和体绘制算法优点相结合,开发新的混合绘制算法能大大提高医学影像三维重建的效果及效率,这也正是本课题下一步的研究目标。

参考文献:

[1] Woods R P, Dapretto M, Sicotte N L, et al. Creation and use of a Talairach-compatible atlas for accurate, automated, nonlinear intersubject registration, and analysis of functional imaging data[J]. Hum. Brain Mapp, 1999, 8:73-79.

[2]W.Schroeder, K.Martin, and B.L.Schroeder. The Visualization Toolkit: An Object Oriented Approach to 3DGraphics, 3rd ed. NewYork: Kitware, Inc., 2003.

[3]S. Osher, R. Fedkiw. Level Set Methods and Dynamic Implicit Surfaces, Springer-Verlag, New York, 2002.

三维图像范文6

[关键词] CT;三维重建;腰椎病

[中图分类号]R814.42 [文献标识码] B[文章编号] 1673-7210(2010)01(c)-093-02

Research on three-dimensional reconstruction of CT images and its application in the diagnosis of lumbar spondylosis

LIU Jing, QIU Dawei

(Shandong University of Traditional Chinese Medicine, Ji'nan 250355, China)

[Abstract] 3D reconstruction techniques of CT images introducing a variety of methods in data processing make the volume data displayed fully and provide clear and detailed information for the diagnosis of lumbar spondylosis. The paper presents techniques, technology developments and the common procedures of 3D reconstruction and its applications in lumbar spondylosis diagnosis in detail.

[Key words] CT; 3D reconstruction; Lumbar spondylosis

在医疗诊断中,常规CT是通过观察人体的某一切片图像来进行诊断,这种二维切片丢失了大部分三维空间信息,难以完整地表现人体内的组织结构及病变形态。医生只能推测或想象观察对象的立体形态,从而作出判断。受多种因素的影响,这样的判断难以客观、准确,有时甚至可能导致错误的结论。因此,仅凭医生“在他头脑中进行重建”是十分困难的。

运用计算机图形、图像处理技术,将一系列二维CT切片重建为立体的三维图像,可以更完整、直观、真实地再现各种组织形态及其相对位置,使医生能够从三维图像中直观地观察出病灶区和周围组织器官的关系,更好地进行疾病的诊断和治疗。

1 医学三维重建技术

医学图像三维重建(three dimensions reconstruction,3D)于20世纪80年代逐渐应用于临床,它是指通过计算机断层扫描(computerized tomography)、磁共振成像(magnetic resonance imaging)和超声波扫描(ultrasonography)等成像设备,按某种物理学原理,对从人体器官采样得到的单张或序列图像进行计算机处理,从而恢复器官的三维表面形状,重建出直观的立体图像[1]。

1.1 主要技术对比

医学图像三维重建的主要技术包括:

1.1.1 表面遮盖显示(surface shaded display,SSD)

SSD是通过计算被观察物体表面所有相关像素的最高和最低CT值并保留其影像,但超过限定CT域值的像素被当作透明处理后重组成三维图像。此技术用于骨骼系统、空腔结构、腹腔脏器和肿瘤的显示,其空间立体感强,解剖关系清晰,有利于病灶的定位[2]。

1.1.2 多层面重建(multi plane reconstructions,MPR)

MPR是在横断面CT图像上按需要任意画线,然后将一系列横断面重建、重组,即可获得该画线平面的三维重建图像,包括冠状面、矢状面和任意角度斜位面图像。可较好地显示组织器官内复杂的解剖关系,有利于病变的准确定位。

1.1.3 多层面容积重建(multi plane volume reconstructions,MPVR)

MPVR是将不同角度或某一平面选取的原始容积资料,采用最大密度投影(MIP)、最小密度投影(MinIP)或平均密度投影(AIP)方法进行运算所得到的重组二维图像的方法,这些二维图像可从不同角度观察和显示。

1.1.4 曲面重建(curved planar reconstruction,CPR)

CPR是指在容积数据基础上,沿感兴趣器官划一条曲线,计算指定曲面的所有像素的CT值并以二维图像形式显示出来。它将扭曲、重叠的结构伸展拉直,显示在同一平面上,较好地显示其全貌,是MPR的延伸和发展[3]。

1.2 三维重建的一般过程

1.2.1 进行CT图像三维重建的一般过程

见图1。

图1 三维重建流程

1.2.2 本研究所用重建过程中的关键技术

1.2.2.1 获取断层图像数据要进行医学图像三维重建,首先必须得到清晰的二维断层图像。由于不同厂家CT机的主控计算机型各异,且不同的CT设备具有不同的数据格式。另外,由于技术保密和其他方面的原因,数据往往还经过了压缩和加密,要实现数字图像的获取需考虑以上不同。

1.2.2.2 图像分割图像分割是三维重建的基础,分割效果直接影像三维重建的精确度。图像分割是将图像分割成有意义的子区域,将医学影像中感兴趣的物体(一般是病灶区)提取出来,由于医学图像的各区域没有清楚的边界,为解决在医学图像分割中遇到不确定性的问题,可以引入模糊理论予以解决[4]。

1.2.2.3 切片重组、内插目前,CT三维成像的主要方法是通过多幅等间隔的相继断层图像重建三维目标,实现人体组织器官的立体显示、操作和分析。由CT扫描仪得到的断层图像序列在空间三个正交的方向上分辨率通常不同,断层内像素空间分辨率远远高于各断层间的空间分辨率。直接用这种图像进行分析、处理和显示,由于三个方向空间分辨率不一致,使显示结果呈阶梯状。因此,要实现物体的三维显示和处理必须形成等分辨率的数据,而内插是三维重建中必不可少的环节,内插效果直接影响重建的质量。

断层插值方法大体上可分为两类:一类是基于图像灰度值的插值方法,如最邻近法、线性插值、样条插值等,它是在原始灰度断层图像序列中,补充若干“缺少”的切片。另一类是基于形状的目标插值,只需对目标物体的轮廓进行插值。这种方法的插值精度较好,但只适用于二值化的切片图像。

1.2.2.4 图像数据的存储和压缩体数据在计算机中的快速存取是研究较多的问题,它要求结合数据的特点、主机内存容量和所采用的显示方法统一考虑。

1.2.2.5 图像的处理和显示三维图像的显示可以采用OpenGL函数库。OpenGL是SGI公司提供的开放式图形库,是目前应用最广泛的二维和三维图形程序设计标准。由于有硬件(3D图形加速卡)的支持,使用OpenGL可以方便的进行旋转、移动、缩放和光照模型设置等等,可以让医生方便地从各个角度观察三维图像。

2 三维重建技术在腰椎病诊断中的应用

腰椎病是指因脊柱急慢性损伤及椎间盘退变、骨质增生等原因所引起,在临床上表现为以腰腿痛和腰部活动受限为主要症状的疾病,是当前临床上难以治疗的病症之一。据统计,世界上有60%~80%的成年人发生过腰腿痛。常见的腰椎病有:

2.1 椎间盘退变

实验表明,CT常规扫描有10%~20%的漏诊或误诊,主要因为CT常规扫描的节段性,不能区别韧带下型或穿韧带型椎间盘突出,不能发现游离于椎管内硬膜囊外的髓核碎块;而采用CT三维重建技术可以弥补CT常规扫描的不足,MPR冠状位可以清晰显示椎管内容物和双侧神经根,矢状位在椎体层面可发现椎间盘脱出的髓核以及脊髓或马尾神经的致压物。因此,不但能解决CT常规扫描对椎间盘的诊断,还能发现特殊的椎间盘脱出,减少漏诊,对临床确定治疗方案有很大帮助[5]。

2.2 腰椎小关节病

腰椎小关节病是由于腰椎小关节退行性变,引起腰椎节段性不稳、神经根受压、韧带与肌肉劳损等所致一系列临床症状。CT常规扫描图像显示的只是腰椎小关节横断面,难以显示椎小关节冠状面与矢状面,不能同时在一幅图像上显示多个节段椎小关节[6]。曲面后处理成像(planar reconstruction,CPR)是MPR的一种改进算法,它能在一个平面上完全显示走行迂曲的组织结构。采用多方位CPR,图像清晰,与CT常规轴位图像相比较,在显示腰椎小关节病的各种异象方面,CPR显示效果好,并且全面、具体。尤其是能在一幅图像上任意角度观察每一个椎小关节全貌、椎小关节上下关系、关节突变形和椎小关节脱位。

2.3 腰椎峡部裂

腰椎峡部裂由于峡部在三维空间与人体的矢状位、冠状位、横断位均不平行,一般影像检查困难,尤其不伴滑脱的腰椎峡部裂,X线平片及CT常规椎间盘扫描技术很容易造成漏诊,有文献报道腰椎峡部裂漏诊率高达30%[7]。采用CT三维重建技术可提高诊断率,MPR后处理图像上表现为峡部裂与小关节间的骨片影。对伴滑脱的腰椎峡部裂,SSD价值更大,尤其经矢状位切割,可观察到骨性椎管在矢状位拉长的程度,为滑脱分度提供三维、直观、清晰图像。

2.4 脊柱骨折

脊柱胸腰段是脊柱骨折的好发区域,CT检查是常用的检查方法,但有一定的局限性,对伴有突入椎管的碎骨片整体大小及精确位置,与上下椎体的相互关系等显示欠佳。实验表明,CT重建技术可提供高质量的三维处理图像,较好地解决了这个问题[8]。MPR冠状面及矢状面图像可以显示突入椎管内碎骨片的大小和精确位置,对硬膜囊和神经根的压迫情况,同时对伴有的椎弓等附件骨折及椎体的滑脱程度也能清晰显示。SSD可以显示椎体骨折后压缩程度,特别有利于多椎体压缩骨折的观察。

3 讨论

CT数据三维重建技术能在较短的时间内完成容积数据的采集,从而实现大范围无间断连续扫描,快速成像,获得完整的容积分辨率,达到仿生图像的效果。作为一种新的影像学技术,它能直观、立体、多角度清晰地显示病变部位,为临床提供清晰而丰富的立体诊断,与传统的二维成像技术相比,其图像更直观、更精确。

[参考文献]

[1]隋林,王宏远.应用16层螺旋CT三维重建图像诊断骨关节损伤[J].第四军医大学学报,2008,(16):1509-1511.

[2]苏雨涛,李彦生,韩景芸.CT数据三维重建及可视化技术的研究[J].机械设计与制造,2009,(1):191-193.

[3]Boswell MV, Shah RV, Andrea M, et al. Interventional techniques in the management of chronic spinal pain: evidence-based practice guidelines [J]. Pain Physician,2005,8(1):1.

[4]赵亮,李熙莹,刘嘉昭,等.基于聚类神经网络算法的医学图像分割[J].激光与红外工程,2006,(S4):142-146.

[5]Sehgal N, Dunbar EE, Shah RV, et al. Systematic review of diagnostic utility of facet(zygapophysial) joint injections in chronic spinal pain: an update [J]. Pain Physician,2007,10(1):213-218.

[6]张庆军,曹阿丹,闵会东,等.CT与MRI在腰椎间盘突出症的应用132例分析[J].中国误诊学杂志,2007,7(15):3580-3581.

[7]陈溶,周长林,李小文.腰椎间盘突出症影像诊断及误诊分析[J].贵州医药,2003,27(7):660-661.