图像法论文范例6篇

图像法论文

图像法论文范文1

关键词:研究综述;信息检索;图像检索

1.引言

伴随着计算机网络技术、多媒体技术和数字化信息处理技术的飞速发展,互联网上的多媒体信息迅速膨胀。与此同时,计算机所能处理的媒体信息范围也在不断扩大。如何对海量数字图像信息资源进行高效地组织、管理和检索成为了当前热门的研究课题。图像检索成为多媒体领域研究热点的现实原因包括:一方面,图像作为一种内容丰富、表现直观的媒体资源,已经应用在社会各个层次和领域;另一方面,人们面对日益增长的多样化的图像信息,如何在这些海量图像信息中检索出满足自身需求的资源,是近年来网络图像信息处理领域迫切需要解决的问题。

2.图像检索国内研究综述

从20世纪70年代开始,国外有关图像检索的研究就已开始,当时的研究内容主要是基于文本的图像检索技术,到90年代以后,出现了对图像内容语义检索的研究,即基于内容的图像检索。与国外相比,我国有关图像检索的研究起步较晚,从20世纪90年代开始,我国图情领域的核心期刊才开始有相关图像检索的研究论文出现,研究内容大多也是参考国外的研究方向。近年来,随着相关专家、学者对图像检索领域关注度的提高,我国图情领域有关图像检索的研究论文大量出现,相关研究的理论和技术也取得了一定进展。

2.1图情领域核心期刊中图像检索研究论文分布及相关分析

根据中国社会科学引文索引(CSSCI)数据库1998年来对图书情报领域有关图像研究来源文献的收录情况,下文将运用文献计量方法对目前我国图情领域有关图像检索的研究论文按期刊种类、年份、研究主题分布等进行统计分析。

2.1.1图像检索研究论文年度分布情况及相关分析

从表l可以看出,截止到2014年我国图情领域的相关核心期刊在图像检索方面论文收录量总体上呈余弦波状趋势。其中,2002年以前,我国有关图像检索的论文在图情领域核心期刊上的分布处于量少且分散化的状态。2002年到2006年来数量相对较多,属于有关图像检索研究的高峰期,2005年达到最大值。但在2006年以后,相关论文数量趋于明显回落的状态。从以上表格数据的分布状况可以看出,尽管我国图情领域的专家、学者对于图像检索领的研究出现过关注密集期,但重视程度并非长期处于始终如一的状态。

另外,从上表中还可以看出研究论文在核心期刊的分布状态,其中《现代图书情报技术》、《情报科学》、《情报杂志》、《图书情报工作》这四种期刊对图像检索这一研究方向相对关注较多,几乎每年都有相关的。其余的期刊对图像检索研究方向的关注程度相对不高,只有少量其上,并且期刊中有关图像检索的研究论文按年度划分时,总体分布也是相对比较分散的状态。

2.1.2图像检索相关研究论文主题分布及整体分析

对于CSSCI中所收录的126篇有关图像检索研究的文章,按照所研究的相关内容可大致划分为图像检索基本理论与概述、基于具体图像特征的检索、图像检索的具体应用、图像检索交互性与反馈机制、图像检索系统及搜索引擎的设计与评估和图像检索技术、方法研究六个主题方向。

以上结果表明,我国图书情报领域近十年以来对图像检索的研究主要集中于图像检索基本理论与图像检索技术、方法方面。通过对这些相关主题研究论文的阅读,可以发现近十年来,我国对图像检索的研究比较理论化,缺乏对具体图像检索系统的设计、图像检索技术在实际生活中的应用与用户交互性方面的研究。对基于内容的图像检索技术,无论是从低层视觉特征,还是从高层语义中的图像检索,均是涉及理论方向的探讨居多。这表明我国图情领域有关图像检索的研究,无论是从广度还是深度上,均有较大提升空间。另外,有关图像检索系统及搜索引擎的设计与评估方面,则比较注重典型系统和搜索引擎的比较和分析,新的图像检索系统的设计较少。

(1)图像检索基本理论与概述

该主题方向主要包括图像检索的所涉及的基本原理、基本理论模型构建、已有的国外检索系统简介等。相关论文及研究内容有,毛力、张晓林1999年在“基于内容的图像检索技术与系统”一文中首先简述了传统图像检索中出现的问题,又初步探讨了基于内容的图像检索的原理,并简要介绍了国外几个典型基于内容的图像检索系统,开了我国研究基于内容图像检索的先河。2005年王彤、魏成光在“数字图像信息的组织和检索”一文中介绍了网络信息环境中数字图像信息的检索原理。随后,又有一些新的学科理论原理相继在图像检索领域涉及和应用,相关论文包括“基于压缩与特征点的快速图像检索”、“基于贝叶斯定理的遥感图像检索”“数字图书馆中基于本体的图像检索”等。由研究论文所涉及的内容可以看出,越来越多的新的学科内容将应用于图像检索领域中。

(2)基于具体图像特征信息的检索

该主题主要涉及基于具体的图像内容特征的检索方式,包括基于图像的颜色、纹理、形状等具体内容特征及其在具体实验中的应用。彭斌2000年在“基于颜色内容的图像检索”一文中论述了基于颜色内容的图像检索方法,并提出基于图像分割的颜色直方图和将主色调进行适当扩展检索,这是对原有基于颜色特征的图像检索方法进行改进的开端。随后又有多篇关于颜色内容特征的研究论文相继出现,例如毛力、张晓林的“基于颜色内容的图像检索原理与方法”、张学福的“论图书馆基于颜色内容的图像检索技术”、何立民、万跃华的“数字图书馆基于内容的多分辨率颜色特征检索和相关反馈技术”等。2006年来,并未有涉及具体图像特征信息检索的研究论文出现。

(3)图像检索的具体应用:

主要包括图像检索技术在社会农业、商业、工业、医学、艺术等方面的实际应用及实际现象研究。1999年张学福、冷伏海发表“商标数据库信息检索技术研究”一文,基于当时图像检索技术水平探讨了图像商标信息数据库的检索问题,旨在推进我国商标数据库的建设和利用,更好的满足我国市场经济发展需要。黄琨、赖茂生2007年在“彩色自然风景图片的四季特征提取”一文中根据彩色自然风景图片的特点,提出“天空去除”和“1/2区域分析”提取图像特征改进方法,同时采用四季调查法收集用户评价,然后通过多元线性回归方法建立颜色特征与用户评价的映射关系,用于彩色自然风景图片四季特征的自动提取,通过实验验证了该映射机制对于正确预测彩色自然风景图片四季特征的有效性。近年来并没有相关图像检索的具体应用研究论文的出现。

(4)图像检索交互性与反馈机制

主要讨论目前图像检索系统的交互和有关用户反馈及其相关反馈技术的发展。董文军2001年在“基于内容的图像检索的相关性反馈机制”一文中阐述了一种新的相关性反馈机制―通过对用户指定的相关及不相关图像的特征分布进行统计分析来动态更新相似性度量和查询,从而更准确地表达用户特定的信息需求及提高检索系统的性能。2006年黄琨,赖茂生在“以用户情感为线索的图像检索研究”一文中介绍了以用户情感为线索检索图像的产生背景,并提出了其实现原理、检索流程、检索系统的一般架构。从2006年以后,我国图像检索领域未有关于用户交互性的研究论文在图情领域的核心期刊中出现。

(5)图像检索系统及搜索引擎的设计与评估

该部分主要研究内容有原有系统的改进以及新系统的设计,此外还包括相关搜索引擎的设计与评估标准的研究。文燕平2001年初在《现代图书情报技术》上发表“基于内容的图像检索系统研究”一文,首次介绍了一些国外著名的图像检索系统,并且对图像检索系统的新成果进行了详细阐述。王惠、沈玉利2005年发表“基于内容的图书馆图片检索系统”一文,该文提出了一种基于特征向量的索引方法,构建了一个高效实用的图书馆图片检索系统,并对系统的构建方法进行了较详细的讨论。近年来,又相继有多篇关于图像检索搜索引擎的研究论文出现,例如:“集成式图像搜索引擎体系结构分析”、“基于用户满意度的图像搜索引擎评价研究”等。

(6)图像检索技术、方法研究

主要包含各种各样的图像检索系统的检索工具、支持技术等,以及对原有技术的评估以及对新的核心技术进展的探讨。袁方、刘明2001年在“数字图书馆中的基于内容图像检索技术”一文中分析和介绍了图像数据库构建、图像的内容描述、特征提取和匹配、快速检索等基于内容图像检索的关键技术。高仕龙2010年在“基于特征融合的图像检索算法研究”一文中提出了一种新的基于特征融合的灰度图像检索算法。期间又有多篇有关图像检索技术、算法研究论文的出现,如“图像检索中版面自动分析技术研究”、“图像检索中索引技术研究”等等。

2.2存在问题

通过阅读近年来我国图情领域核心期刊所包含的有关图像检索的126篇研究论文,并对其在发表时间、研究主题、发表期刊的分布状况进行了统计分析,发现目前我国图情领域对图像检索的研究存在着一些不足,需要做出相应的对策以促进其的进一步发展。

2.2.1整体研究水平不高

多年来我国图情领域对图像检索的研究总体关注度不高,有关研究文献分布上较为分散,并没有大量、集中、系统性的研究性文章集合出现。这种分散的趋势给有关人员查找、利用相关信息带来了不便,也不利于图像检索的深入研究。另外,我国图情领域对图像检索的研究课题独立性不强,研究理论和技术也不够成熟。因此,在重视研究成果的系统性与全面性的前提下,更应该积极借鉴国外有关图像检索的研究成果,紧密跟踪图像检索发展动态,关注热点、难点、前沿问题,提高我国图像检索领域的整体研究水平。

2.2.2研究内容不平衡

正如前面表2对论文研究主题统计分析的一样,近十年来我国图情领域有关图像检索的研究集中于图像检索基本理论与图像检索技术、方法方面,缺乏具体图像检索系统的设计,图像检索技术在实际生活中的应用与用户交互性方面的研究设计的也较少。面对这一研究现状,一方面应对现今较成熟的研究方向继续深入探索。另一方面,应拓宽研究领域,促进其他研究方向共同发展。尤其是系统用户界面、图像检索的具体应用等研究薄弱的方向更应该引起相关领域的专家、学者的足够重视。

3.发展与展望

由于其检索对象和应用领域的多样性,有关图像检索的研究具有广泛的内容,它不但吸收了传统计算机信息的存储、检索和图像处理等各方面的理论和技术,同时又促进了这些理论和技术研究的深入和发展,成为了一个目前比较热门的研究课题。目前,在图像检索技术的新发展方面,还要解决多种检索手段相结合的问题,以提高图像检索的查全率、查准率。有关图像检索算法、方法研究的发展趋势表现为,一是对原有算法的不断改进;二是新方法、新概念的引入和多种方法的有效综合运用。与此同时,图像检索有关新的算法、方法应该向更智能化、精确化和实用化方向发展。本文通过对我国图情领域有关图像检索的研究论文进行统计分析,发现我国图情领域有关图像检索研究的不足,并预测未来的发展方向,以期为今后我国图像检索领域的发展与完善起到参考作用。(作者单位:乐山职业技术学院)

参考文献:

[1]韩建新.图像数据库与图像检索.图书与情报(J),1993(03):38―40

[2]毛力,张晓林.基于内容的图像检索技术与系统.现代图书情报技术(J),1999(05):30―33

[3]柳群英.基于形状特征的图像检索技术.情报杂志(J),2004(04):87―88

[4]董文军.基于内容的图像检索的相关性反馈机制.情报杂志(J),2001(07):17―18

[5]黄琨,赖茂生.以用户情感为线索的图像检索研究.情报科学(J),2006(09):1395―1399

[6]严丽君.新浪、Google、Yahoo图像搜索引擎比较.图书情报工作(J),2003(10):83―87

[7]吴金红,张玉峰.基于内容的图像检索之相关标准研究.图书情报工作(J),2004(09):48―51

[8]高仕龙.基于特征融合的图像检索算法研究.情报杂志(J),2010(04):126―129

图像法论文范文2

【关键词】图像处理;畸变校正;二元全区间插值

0 引言

近年来,随着国民经济与科学技术的飞速的发展,在医学、工业、科研等领域对细微物体的精密测量技术提出了越来越高的要求。在众多的测量技术中,图像识别与处理技术具有检测速度快、精度高、重复性好,且检测具有非接触性等特点,已成为当前细微粒度测量研究的一个热点和发展趋势。然而,典型的图像识别与处理技术很难满足高精度的测量要求,因此,如何提高微小型物件的测量精度已成为该技术领域的主要研究方向之一。本文以提高微小型物件的测量精度为背景,研究摄像机标定的相关技术和方法,从中探究矫正图像畸变的优化方法,为精确建立起三维空间物体与二维图像间的对应关系提供可靠方案。

1 摄像机畸变原理

针孔成像模型是摄像机成像模型中最常用到的基本模型,但它每次只能通过一束光线,这导致实际应用中摄像机曝光不足图像生成缓慢,因此并不适用于实际的成像系统,于是,人们在针孔模型的基础上使用弯曲的透镜,使得大量光束收敛聚焦到投影点上,加快了图像的生成速度,但却引入了畸变。此外,在实际成像过程中,由于CCD等的加工装配误差,也会使投影点偏离投影几何中心形成畸变。

1.1 径向畸变

径向畸变是由于透镜的工艺缺陷造成的,它使得摄像机的透镜总是在成像仪的边缘产生显著的畸变,比如筒形畸变和枕形畸变,如图1所示:

(a)是筒形畸变,(b)是枕形畸变,光线在偏离透镜中心时会比靠近中心的地方畸变更加明显。对于径向畸变来说,成像仪的中心(光心)畸变可以视为0,因此,它们是相对光心对称的。以r=0展开泰勒级数,可以表示为如下形式:

3 结果分析

本文在摄像机标定技术的基础上,使用经过参数优化的摄像机模型对测试图片进行畸变矫正,由于本文使用高清摄像机,因此图像畸变现象并不明显,为便于观察实验效果,本文利用图片处理工具对其中一幅图像进行畸变加强,然后用本文阐述的方法对已经严重畸变的图像进行畸变校正,最终得到的效果如图2所示:

图2(a)为矫正前的畸变图像,图2(b)为经过畸变矫正后的新图像,从图中可以观察到本文使用的畸变矫正方法矫正效果显著,且二元全区间插值平滑,图像灰度没有发生明显跳变现象。

为减少冗余数据量,本文选择观察图像中角点的位置迁移情况,但由于图像中的角点数为144个,因此本文只截取少量数据列于表1。

表1比较了原始图像、畸变图像及其对应矫正图像的角点位置情况,从表中数据可以看出,即使图像发生了严重畸变,但经过本文矫正方法矫正后,依然可以恢复到几乎未发生畸变的情况。此外,通过与原始图像对比,可以推测,若摄像机理论成像模型与真实成像模型间的误差越小,畸变矫正的效果会越好。为验证该结论,本文将原始图片分别置于OpenCV计算得到的理论模型以及经过遗传算法优化后的理论模型中矫正畸变,然后计算矫正图像中每个角点的投影误差,误差结果如图3所示:

根据图3结果可以得出两个结论:第一,图中角点位置越接近光心,畸变值越小,几乎为0;越靠近边缘,畸变越明显,甚至可达光心点处畸变值的50倍以上,符合畸变映射原理。第二,经过遗传算法参数优化,所有角点的投影误差都在1个像素以下,而未经过优化处理的图像,误差接近10个像素,这不仅说明了遗传算法能有效提高摄像机的标定精度,而且也验证了畸变矫正的准确度与成像模型真实度之间成正比关系。

4 结论

本文研究了摄像机几种主要畸变的成因,并对畸变矫正算法做出了改进,引入了二元全区间插值法,该方法不仅解决了畸变矫正后的点不能落在实际图像像素点上的问题,还使插入的值更加平滑、连续,为后续颗粒测量工作提供了更精准的理论数据。

【参考文献】

[1]胡占义,吴福朝.基于主动视觉摄像机标定方法[J].计算机学报,2012,25(11): 1149-1156.

[2]陈天飞,马孜,吴翔.基于主动视觉标定线结构光传感器中的光平面[J].光学精密工程,2012,20(2):256-263.

[3]孟晓桥,胡占义.摄像机自标定方法的研究与进展[J].自动化学报,2012,4(1): 110-124.

[4]A.Y. I. Abdel-Aziz, H. M. Karara. Direct Linear Transformation into Object Space Coordinates in Close-Range Photogrammetry[C]. The Symposium on Close-Range Photogrammetry, Urbana, Illinois, USA,1971:1-18.

[5]徐杰.机器视觉中摄像机标定Tsai两步法的分析与改进[J].计算机工程与科学,2012,32(4):214-219.

图像法论文范文3

关键词:艺术;视觉文化;图像;图;影像碎片;艺术学理论

中图分类号:j0 文献标识码:a

2012年6月在南京举办了“图像与表演国际学术研讨会”。与会者就图像与表演之间的关系各自做了主题发言和探讨。这是一个基于艺术学理论的实践研究主题的学术会议,目的在于探讨不同艺术门类之间的关系,以及探讨不同门类艺术的共同规律,并以此寻求艺术的本质与艺术原理。当代各种媒体视屏的传播功能,使人们感到图与图像在传播中的“读图时代”是不可抗拒的。但是如何理解“读图时代”中“图”的概念和含义,是图还是图像,如何区别,一些学者试图把戏剧戏曲和影视中截取的“图”作为“图像”,并以此探讨“图像与表演”的课题。但问题也就随着学者们的探讨出现了。图与图像,我们究竟作何理解。它们仅是概念不同而内涵一样吗?显然,由于一些学者把图与图像混用,或看成没有区别的视觉文化,因而探讨结果依然是表演艺术范畴之内的问,题,并没有涉及到图像——造型艺术的问题。表演艺术与造型艺术之间的关系和规律没有得到有效的解决。因此,“图像与表演”或者说造型艺术(美术学),与表演艺术(戏剧戏曲影视学)的关系,需要依赖艺、术学理论的原理来思考图与图像的概念与内涵等问题,并以此解决好这两种艺术门类之间的学理关系。

一、图与图像

“读图时代”似乎成为我们这个时代的一个显著特征。实际上,“图”与“图像”是两个完全不同的概念,其内涵也不同。所谓读图时代的“图”并非都是图像,故此人们才感受到读图时代越来越简单与平面化。读图时代的“图”多是一种后文化时代的产物,其特征是简单、浮躁、肤浅、无深度、游戏性,最大限度的碎片化。“碎片化”是“图”的总体特征,我们也可以将“图”称为“图片”,但不可称为“图像”。图像,具有独立性、完整性、自足性和系统性的特征,它不是偶然的符号集合。图像的“孕育性”具有图像学和叙事学的意义,可阐释,可叙事,包含了某种意义(象征、隐喻等),是“图”与“像”的整合,具有独立意义的传播功能。中国传统文化中的治学方法是“左图右史”。即“置图于左,置书于右;索像于图,索理于书。”(郑樵《通志略·图谱略》)“图”指的是图形,“像”指的是图形中深藏的含义。《说文解字》云:“像,似也”。段玉裁注:“然韩非之前或只有象字,无像字。韩非以后小篆即作像。许断不以象释似,复以象释像矣。系辞日,爻也者,效此者也。象也者,像此者也。又日,象也者,像也。……盖象为古文,圣人以像释之。虽他本像亦作象。然郑康成、王辅嗣本非不可信也。凡形像、图像、想像字皆当从人,而学者多作象,象行而像废矣。”段注提到了“图像”,意在解释“像”的出处与来历,像与爻辞功能大体一致,故圣人以像释之。《易·系辞上》云:“仰以观于天文,俯以察于地理,是故知幽明之故。”《易·系辞下》又云:“仰则观象于天,俯则观法于地”。“观天文”实为观天象(像),与“索图于像”,说明了二者合二为一的“图像”,自有深妙的玄机。《易·系辞上》所指的“河出图,洛出书,圣人则之”的“图”,当为“图像”理解,很有玄机可阐释。当今“图像”与西说融合,基本上属于美术学(造型艺术)意义的范畴,有独立的自足的编码符号系统。即显示了母题、主题、意象、形象、结构以及相关联的系统,这与西方图像志与图像学有关分析和阐释的对象——图像的理论有关。因此,图像一系列的编码符号(图像逻辑)隐藏有深刻的含意,具有阐释学和叙事学的意义。不仅如此,作者(艺术家)赋予给图像的精神与情感是丰富的和完整的。当然,一些折射了历史、文化、民族、社会等价值的具有可阐释性、叙事性的摄影作品,也因此可作为图像来分析和

阐释。

图不具有上述所说的图像的编码符号与意义。图是时间过程中一瞬间截取的片段,是非独立性、非自足性和非系统性的时间碎片,不孕育整个时间过程,其精神和情感也是散碎的。因而,图不具有图像学的意义,也无叙述性。如一些出现在影视、戏剧戏曲或舞蹈表演中一个画面的截取图——剧照,不具有图像学的意义。也就是说,无法从图像志的辨析到图像学的阐释,没有叙事的性质。如同连环画中每一页都是图,不完整,没有独立性,不可阐释。概言之,图的碎片特性,缺乏图像逻辑的系统。正因为如此,连环画的图才配以文字,并且由众多的图构成一本可阐释的、可解读的具有完整性的连环画。连环画的每一页仅仅是孤立的图,而不是图像。影视、戏剧戏曲和舞蹈等中截取出来的图——剧照,仅仅是图而已,而不是图像。今日流行的动漫(学科上归属影视戏剧戏曲学)、网络上流传的照片,等等,皆为图,非图像。正是应为这些“图”充满了我们的视觉世界,我们才惊呼读“图”时代的来临。但仅仅是“图”的到来,而非真的“图像”的到来。因为我们的视觉文化大都是图,所以我们感到今天的“读图时代”越来越简单,越来越觉着肤浅。而真正的图像却受到图的冲击,使我们难以辨认,或根本没有认识到图像本身到底是什么。于是有的学者认为图像与表演无法辨分:图像就是表演,表演就是图像。这种认识是值得商榷的,主要问题在于把图与图像混同了。

图像包含了最基本的单位或元素——母题、主题、意象、结构以及与之相关联的符号等。人们通过对母题的分析与辨认,最后进行图像学对主题的阐释与研究,这是对图像的基本研究路径和研究手段。这就涉及到图像的符号以及编码问题。19世纪西方产生的图像学理论主要是对古希腊和中世纪宗教艺术的图像进行研究的一种方法,并由此使艺术史研究进入到人文主义的学科中。法国艺术学家埃米尔·马勒所著的《图像学:12世纪到18世纪的宗教艺术》便可使我们了解图像学研究的对象,并由此也了解西方“图像”一词所指的含义了。图像学成为艺术史学家对图像隐藏的某种文化、思想、宗教或历史最完美的解释。阐释和研究的这些图像本身有这样几种特征:其母题或主题隐含或象征了某种意义,显现了它的历史性、社会性、政治性、宗教性和叙事性的特征。西方最早被认可为图像的不是别的,正是那些被今天称为宗教的和古典的“艺术”。它们是由“艺术家”依据某种意图而创作的。某个艺术(图像)体现了某个“艺术家”思考和表达的意图,或者表现了他者(教会或赞助者)的意图。“在12和13世纪意大利和法国艺术中我们可以找到许许多多类似的例子,即,艺术家直接和精心地从古典的母题中借用了母题,却把异教的题材改变成基督教题材。”母题、主题、意象等,都是经过艺术家或赞助者的意图来编译符号构成了图像不可缺少的元素并由此产生了意义,从这个层面上说,图像还具有符号学的意义。结构是图像隐含的内容之一,是符号系统的编码程序。如何构图画面,如何取舍母题或意象,并从各种构成关系中产生某种特定的主题,这就是创作者所要思考的结构要素。西方中世纪的宗教图像,是创作者与赞助人(教会组织)共同完成的艺术(图像)形态。当代学者研究与阐释它们,提出了图像学的研究方法,同时还提出了一个肖像学(圣像学)的概念,“肖像学是艺术史中研究与艺术形式相对的艺术题材或含义的一个分支。”正是因为这些中世纪的艺术(图像)具有象征意义、为现代人难以知晓的隐喻,以及它们隐藏的事件和某种可叙事的关联情节,才被研究者称为图像。在西方,图像显然包含了中世纪的宗教绘画与雕刻,通过运用图像学方法研究,揭示这些图像在中世纪宗教文化系统中的现象和宗教文化的形成与变迁,以及图像所暗示出来的宗教思想与其它观念。图像学研究不仅仅是针对宗教艺术图像的研究,也包含对古希腊艺术(图像)的研究,其实际目的还是因为中世纪宗教艺术中,借用了古典艺术的母题,但因某种主题的需要而使母题发生了变异。图像学正是要阐释这种变异而叙事新主题的含义。因此,图像学研究和阐释的是,西方各个时期图像所显示的文化形成和变迁,以及这些图像隐藏的文化、社会、宗教、思想与政治的意义。西方现代图像学转向对所有图像领域的研究与阐释,因为图像中最要的是它包含了思想与观念,显示了图像中某种历史与观念。

不难理解,图像就是我们今天说的造

艺术,是空间艺术的概念,非时间艺术的概念,是艺术家的独立创作的作品(图像)。艺术家在创作作品(图像)时,都有自己的思路、观念和企图,这就是我们说的一整套艺术构思和技术,也可以说是“编码系统”,故此自成独立的系统。一些摄影作品,由于摄影师有意识地选取某些重大的事件进行抓拍,使其作品本身具有了叙事性因素,随着时间的推移成为将来历史中的某个重要事件,再经过一些艺术化形式的处理,如构图剪裁、光线等暗房技术的处理,使摄影作品成为可阐释和可叙述的图像。还有一些摄影作品,经过摄影者后期制作处理,即后期编码,使其成为图像。当代一些广告摄影作品,之所以也可以称为图像,是因为这些广告被摄影师按照商家和市场(客户)的消费观念的需求,以及时代文化时尚包括审美属性等,即我们通常说的“设计意图”,进行了“观念”的处理,做了后期编码制作,使其突出商业与市场价值的效应并体现了设计师的设计理念,体现了“我消费,故我在”的当代消费文化时代的观念,具有独立的意义。当然广告这类图像比起我们前面描述的图像来讲,因为广告图像注重的是商业价值和商业效应,它缺少叙事学的意义,即使阐释也是单向的,隐含的人文思想较少。总之,广告设计经过“编码系统”的处理,较多的是体现了某个阶段的时尚设计观念或创意理念,自身也构成了独立的、可解读的和阐释的价值体系。

质言之,图像应该具有这样几个术语来指向它的全部意义:形式、形象、母题、主题、意象与象征(寓言)。

图或图片,无上述我们说的这些基本元素。之所以说“读图时代”是肤浅的、无深度的,甚至是游戏性的,就在于“读图时代”的图没有独立性,没有编码的符号系统,缺乏隐含的历史性独特含义,没有叙事的结构。这就是造成我们今天焦虑读“图”时代肤浅的根本原因。尤其是今日的各种媒体在传播过程中的视觉文化现象,基本上是贴“图”视觉现象。因此,才被认为当今是“读图时代”。也有西方后现代文化理论家认为媒体与语言发生的词与物的关系,使当代的视觉文化现象具有“图像转向”的意义。但是,“不管图像转向什么,应该清楚的是,它不是回归到天真的模仿、拷贝或再现的对应理论,也不是更新的图像‘在场’的形而上学,它反倒是对图像的一种后语言学、后符号学的重新发现,将其看作是视觉、机器、制度、语言、身体和比喻之间复杂的互动。它认识到观看(看、凝视、观察实践、监督以及视觉快感)可能是与各种阅读形式(破译、解码、阐释等)同样深刻的一个问题,视觉经验或‘视觉读写’不能完全用文本的模式来解释。”这里我们看到了,即使西方后现代文化理论阐释图像并使图像转向成为后现代文化阐释,图像依然脱离不了上述的“术语”。不是任何“图”都是可以作为“图像”来认识的。

二、表演艺术中的碎片影像

表演是时空艺术,它包含了造型元素,又必须需要时间完成叙事。它包括了早期传统的舞蹈、戏剧戏曲和后来工业社会的电影电视。这些是不同历史阶段的表演艺术形式和现象,虽有差异,但其艺术的本质和规律是不变的。时间艺术是需要在一段时间内展现其叙事的结果,它不暗示某种未完结的内容或含义。因此,“时间”就是表演艺术的主要叙事方式。然而作为空间艺术的那些图像,它们的叙事是在阐释者的阐释中完成的,故此阐释(破译、解码等)是空间艺术的主要叙事方式。表演艺术的“时空”也是它的存在的方式;作为造型艺术的图像的“空间”是它存在的方式。艺术分类学依据艺术的存在方式分类,把艺术分为时间艺术与空间艺术,表演一类的同时具有时间与空间性质,故为时空艺术。也正应为如此,表演某些性质又复杂一些。在一般人的心理上,读图看似比较简捷和容易,一眼望去尽收眼底。现代人们的生活方式越来越紧张,时间越来越“少”,人们沟通的方式依赖电脑等多媒体视屏技术,视觉文化便在各种媒体上呈现。“读图时代”正是这种社会生活现状中产生的。“读图时代”的中的“图”的概念是混杂的,事实上是包含了“图”与“图像”。但是,表演艺术中截取下来的图(剧照或还不如剧照的图),以及动漫作品中截取下来的图,只能是图,或称为影像碎片,不能作为图像。这种影像碎片的图,貌似成为了空间艺术,其实不然。原因就在于它不可阐释,不可叙事。它阐释的符号是乱码,叙事的主要方式——时间没有了。也不是空间的艺术,因为它是

从时间艺术中抽离出来的瞬间碎片的影像,没有经过编码系统的过程,不具有自足性的独立特征。

在南京举行的“图像与表演”主题的国际学术会议,主办方是中国艺术学理论(原艺术学)学科的发源地、全国唯一的“艺术学理论”重点学科的东南大学艺术学院,也是全国首家艺术学理论的博士点授予权单位和全国首家艺术学理论博士后流动站单位。其举办“图像与表演”会议的宗旨与目的不言而喻,就在于探讨造型艺术(图像)与表演艺术(影视戏剧戏曲)之间的某些关系。这是一个基于艺术学理论实践层面研究课题的国际学术会议。一些研究者把注意力放在了表演艺术中的图与表演本身的研究视野中。他们几乎都把图与图像混淆了,以至于有的学者认为,当今的图像与表演无法分清。造成这种误读的根本原因,就是没有打通最关键的三个门类艺术——美术学、音乐学与舞蹈学,缺乏研究和架构艺术学理论的学术能力,错把“图”当作“图像”了。因而,所研究的图像与表演之间的学理问题,实际上依然是表演艺术自身的问题。即用戏剧戏曲影视中截取下来的图片,探讨戏剧戏曲和电影自身的问题,与造型艺术的图像没有关联。甚至一些与会者,还把一些采用社会学方法收集的一手资料图片,作为图像来理解。这些一手资料的图片对于帮助和了解研究者考察某个民族的传统文化习俗,具有资料性的考证意义和价值。但仅是图片资料,非图像资料。

艺术学理论学科的重要创始人张道一先生,很早就对从事艺术学理论研究者提出了要求,他指出研究者必须将美术、音乐与舞蹈这三门打通,这是从事艺术学理论研究者所必须具备的基本要求和学术能力。张道一先生在“艺术三要素”中,始终反复强调了研究者要打通艺术的“三大块”:美术、音乐与舞蹈,掌握它们、了解它们共同规律和基本原理。不仅如此,张道一先生还强调要抓住艺术的“三要素”:思维、载体、技巧,才能抓住艺术的真谛,“可以说思维、载体、技巧是创作艺术的三条腿,三足鼎立不但站得稳而且走得远。”张道一先生的“艺术三要素”分别从艺术创作与艺术理论两个方面探讨了艺术“三大块”与“三要素”的关系问题。目的就是阐明艺术学理论研究的基本原理和基本理论必须建立在打通美术、音乐与舞蹈三门学科基础上,建立在艺术实践中对艺术的思维、载体和技术的掌握的基础上。一个从没有从事过造型艺术创作的艺术学理论研究者,对图与图像的理解自然难度很大。他无法理解“图像”为什么是独立的系统,为什么“图”就不是独立的系统。艺术离不开思维,这是最基本的。造型艺术的图像首先是需要艺术家的思维,他要在作品中表达自己的思想、观点、看法和态度,使作品具有某种意义。载体是艺术呈现的物质形式,没有物质这个载体,艺术永远不能够实现物质化,艺术品无法产生,艺术家的思想、观念、看法和态度等,都只能装在他的头脑中,表达不出来。选择什么物质作为承载艺术的载体,是艺术的本体问题,物质关系到艺术的语言、表达和技术等艺术的本体问题。但是,有了思维和载体,不等于就有了艺术作品。艺术家如何表现他的思想和观念等,还必须依赖于艺术的技巧。如果一个造型艺术家(画家、雕塑家),没有掌握一定的艺术技巧,再好的思想或想法也是无法表现出来的,或者创作不出来好的艺术品。艺术技巧的好坏不但影响到艺术家思想观念的表达,也影响到艺术作品的品质和艺术价值。这三者是相互叠加与印证作品(图像)的自足系统的,使艺术作品(图像)产生了独立的、完整的图像学与叙事学的意义,具有文化与艺术的价值和意义。  表演艺术中截取某个瞬间的图,仅仅是整个时空艺术中的一个“碎片影像”。对这样的碎片影像作完整的描述,只能将无数碎片影像叠加起来还原到时间的方式逻辑系统中才能做到。这样做实际上依然还原为表演艺术的形态,或者就是连环画的形态。把电影转换为“连环画”的这种形态,是上世纪70年代我国很流行的一种阅读方式,用碎片影像组成一组一组的画面,图片的下面配上一段文字说明,这就是“电影连环画”。我把这种阅读形式称为看“静态电影”。这就说明了“图”不是“图像”。我们不能把影视戏剧戏曲中截取的影像——图,这些乱码碎片,当作图像并试图进行阐释。企图对碎片影像这样的图作图像学的阐释和叙事学的文本诠释,其结果都是无法进行的。即便试图对这些影像图进行阐释与诠释,阐释或诠释者也是依据已知的表演

艺术的过程与结果作某种诠释性的“复制”工作。即使像米歇尔这样的后现代文化理论者,在其《图像理论》中也说,“不管图像转向什么,应该清楚的是,它不是回归到天真的模仿、拷贝或再现的对应理论”。图的不可阐释性和不可叙事性,使其图本身不具有深刻性,不具有孕育事件前后的延续性,图的乱码和碎片性决定它自身的肤浅,无深度、戏谑性以及无风格等特征。也许正是因为图的这些特征,恰恰碰巧对应了后现代主义的文化理论,人们才开始意识到“读图时代”的“图”之浅薄。

三、结语

图像法论文范文4

论文摘要:分割的目的是将图像划分为不同区域。图像分割算法一般是基于亮度值的两个基本特性之一:不连续性和相似性。第一类性质的已用途径是基于亮度的不连续变化分割图像,比如图像的边缘。第二类的主要应用途径是依据事先制订的准则将图像分割为相似的区域。门限处理、区域生长、区域分离和聚合都是这类方法的实例。遗传算法具有简单、鲁棒性好和本质并行的突出优点。其在应用领域取得的巨大成功,引起了广大学者的关注。在图像分割领域,遗传算法常用来帮助确定分割阈值。

本文介绍讨论了几种目前广泛应用的图像边缘检测、图像阈值分割的各种算法,并给出了对比分析;对遗传算法的基本概念和研究进展进行了综述;给出了标准遗传算法的原理、过程、实验结果及分析. 实验结果表明,本文提出的遗传分割算法优于传统分割算法。

第一章 绪论 1.1  图像分割综述

图像分割就是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程。这里所说的特性可以是灰度、颜色、纹理等,而目标可以对应单个区域,也可以对应多个区域。图像分割是数字图像处理中的一项关键技术,它使得其后的图像分析,识别等高级处理阶段所要处理的数据量大大减少,同时又保留有关图像结构特征的信息。而且,在数字图像处理工程中,一方面,图像分割是目标表达的基础,对特征测量有重要的影响;另一方面,图像分割是自动目标识别的关键步骤,图像分割及其基于分割的目标表达、特征提取和参数测量等将原始图像转化为更抽象更紧凑的形式,分割中出现的误差会传播至高层次处理阶段,因此分割的精确程度是至关重要的。只有通过细致精细的图像分割,才能使得更高层的图像分析和理解成为可能。因此,图像分割是由图像处理进到图像分析的关键步骤,在图像工程中占据重要的位置。

1.2  图像分割的研究意义与发展现状

作为计算机视觉和图像处理中的难点和热点之一,图像分割的研究受到了研究工作者的高度重视,对图像分割进行了深入、广泛的研究。作为一种重要的图像技术,图像分割在不同领域中有时也用其它名称:如目标轮廓(object delineation)技术,阈值化(thresholding)技术,图像区分或求差(image discrimination)技术,目标检测(target detection)技术,目标识别(target recognition)技术,目标跟踪(target tracking)技术等,但这些技术本身或其核心实际上也就是图像分割技术。图像分割作为图像处理、分析的一项基本内容,其应用非常广泛,几乎出现在有关图像处理的所有领域,并涉及各种类型的图像。在工业自动化、在线产品检验、生产程控、文件图像处理、遥感图像、保安监视、以及军事、体育、农业等行业和工程中,图像分割都有着广泛的应用。例如:在遥感图像中,合成孔径雷达图像中目标的分割、遥感云图中不同云系和背景分布的分割等;在医学应用中,脑部 mr 图像分割成灰质(gm)、白质(wm)、脑脊髓(csf)等脑组织和其它脑组织区域(nb)等;在交通图像分析中,把车辆目标从背景中分割出来等;在面向对象的图像压缩和基于内容的图像检索中将图像分割成不同的对象区域等。在各种图像应用中,只要需对图像目标进行提取,测量等都离不开图像分割。

自 20 世纪 70 年代至今,已提出上千种各种类型的分割算法。如:门限法、匹配法、区域生长法、分裂-合并法、水线法、马尔可夫随机场模型法、多尺度法、小波分析法、数学形态学等。随着新理论、新技术的发展,一些新的图像分割方法也随之出现,但这些分割算法都是针对某一类型图像、某一具体的应用问题而提出的,并没有一种适合所有图像的通用分割算法。通用方法和策略仍面临着巨大的困难。另外,还没有制定出选择适用分割算法的标准,这给图像分割技术的应用带来许多实际问题。

1.3 本论文所作的工作

据此,在本论文中只对常用的、并在实践中行之有效的边缘检测方法和阈值分割方法进行深入的了解,并对阈值分割方法中的灰度直方图双峰法和基于遗传算法的最大类间方差法进行详细的讨论,同时用matlab对上述两种方法进行验证并给出结果。

1.4 本论文的论述内容

本文对图像分割的整个过程中的一些常用的,经实践检验行之有效的算法进行了讨论和 改进。全文共七章。第一章为绪论,主要介绍了现阶段图像分割技术的发展现状和研究意义。其他六章分别在以下几个方面介绍了本文所做的工作:

1.对本文所采用的试验测试工具matlab 进行简介。

2.简介数字图像的基础问题。概述了数字图像的基本概念和特点,简介了各种图像格式的特点和应用,为全文的讨论作一铺垫。

3.详细讨论了图像分割中的基于阈值的图像分割方法,给出了直方双峰法的算法和验证结果,并简要介绍了普通最大类间方差法的算法过程。

4.对遗传算法理论进行简介。详细讨论了遗传算法的定义和标准遗传算法的流程和要素。为应用此方法对最大阈值进行迭代寻优打下基础。

6.应用遗传算法改进了最大类间方差法。给出了整个遗传操作的使用函数与具体进程,并对实例图片进行处理,得到处理结果并得到迭代最优阈值m。

本文研究了图像分割的相关理论和常用技术,并对遗传算法进行了介绍,对遗传算法应用于图像分割进行了验证.

 

第二章  matlab简介 2.1  matlab的概况和产生背景 2.1.1   matlab的概况

matlab是矩阵实验室(matrix laboratory)之意。除具备卓越的数值计算能力外,它还提供了专业水平的符号计算,文字处理,可视化建模仿真和实时控制等功能。matlab的基本数据单位是矩阵,它的指令表达式与数学,工程中常用的形式十分相似,故用matlab来解算问题要比用c,fortran等语言完相同的事情简捷得多.

当前流行的matlab包括拥有数百个内部函数的主包和三十几种工具包(toolbox).工具包又可以分为功能性工具包和学科工具包.功能工具包用来扩充matlab的符号计算,可视化建模仿真,文字处理及实时控制等功能.学科工具包是专业性比较强的工具包,控制工具包,信号处理工具包,通信工具包等都属于此类.开放性使matlab广受用户欢迎.除内部函数外,所有matlab主包文件和各种工具包都是可读可修改的文件,用户通过对源程序的修改或加入自己编写程序构造新的专用工具包.

2.1.2   matlab产生的历史背景

在70年代中期,cleve moler博士和其同事在美国国家科学基金的资助下开发了调用eispack和linpack的fortran子程序库.eispack是特征值求解的foetran程序库,linpack是解线性方程的程序库.在当时,这两个程序库代表矩阵运算的最高水平.到70年代后期,身为美国new mexico大学计算机系系主任的cleve moler,在给学生讲授线性代数课程时,想教学生使用eispack和linpack程序库,但他发现学生用fortran编写接口程序很费时间,于是他开始自己动手,利用业余时间为学生编写eispack和linpack的接口程序.cleve moler给这个接口程序取名为matlab,该名为矩阵(matrix)和实验室(labotatory)两个英文单词的前三个字母的组合.在以后的数年里,matlab在多所大学里作为教学辅助软件使用,并作为面向大众的免费软件广为流传。1983年春天,cleve moler到standford大学讲学,matlab深深地吸引了工程师john little.john little敏锐地觉察到matlab在工程领域的广阔前景.同年,他和cleve moler,steve bangert一起,用c语言开发了第二代专业版.这一代的matlab语言同时具备了数值计算和数据图示化的功能.1984年,cleve moler和john little成立了math works公司,正式把matlab推向市场,并继续进行matlab的研究和开发.

在当今30多个数学类科技应用软件中,就软件数学处理的原始内核而言,可分为两大类.一类是数值计算型软件,如matlab,xmath,gauss等,这类软件长于数值计算,对处理大批数据效率高;另一类是数学分析型软件,mathematica,maple等,这类软件以符号计算见长,能给出解析解和任意精确解,其缺点是处理大量数据时效率较低.mathworks公司顺应多功能需求之潮流,在其卓越数值计算和图示能力的基础上,又率先在专业水平上开拓了其符号计算,文字处理,可视化建模和实时控制能力,开发了适合多学科,多部门要求的新一代科技应用软件matlab.经过多年的国际竞争,matlab以经占据了数值软件市场的主导地位.

在matlab进入市场前,国际上的许多软件包都是直接以fortranc语言等编程语言开发的。这种软件的缺点是使用面窄,接口简陋,程序结构不开放以及没有标准的基库,很难适应各学科的最新发展,因而很难推广。matlab的出现,为各国科学家开发学科软件提供了新的基础。在matlab问世不久的80年代中期,原先控制领域里的一些软件包纷纷被淘汰或在matlab上重建。

时至今日,经过mathworks公司的不断完善,matlab已经发展成为适合多学科,多种工作平台的功能强大大大型软件。在国外,matlab已经经受了多年考验。在欧美等高校,matlab已经成为线性代数,自动控制理论,数理统计,数字信号处理,时间序列分析,动态系统仿真等高级课程的基本教学工具;成为攻读学位的大学生,硕士生,博士生必须掌握的基本技能。在设计研究单位和工业部门,matlab被广泛用于科学研究和解决各种具体问题。在国内,特别是工程界,matlab一定会盛行起来。可以说,无论你从事工程方面的哪个学科,都能在matlab里找到合适的功能。

2.2 matlab的语言特点

一种语言之所以能如此迅速地普及,显示出如此旺盛的生命力,是由于它有着不同于其他语言的特点,正如同fortran和c等高级语言使人们摆脱了需要直接对计算机硬件资源进行操作一样,被称作为第四代计算机语言的matlab,利用其丰富的函数资源,使编程人员从繁琐的程序代码中解放出来。matlab最突出的特点就是简洁。matlab用更直观的,符合人们思维习惯的代码,代替了c和   fortran语言的冗长代码。matlab给用户带来的是最直观,最简洁的程序开发环境。以下简单介绍一下matlab的主要特点。

1. 语言简洁紧凑,使用方便灵活,库函数极其丰富。matlab程序书写形式自由,利用起丰富的库函数避开繁杂的子程序编程任务,压缩了一切不必要的编程工作。由于库函数都由本领域的专家编写,用户不必担心函数的可靠性。可以说,用matlab进行科技开发是站在专家的肩膀上。 更为难能可贵的是,matlab甚至具有一定的智能水平,所以用户根本不用怀疑matlab的准确性。

2. 运算符丰富。由于matlab是用c语言编写的,matlab提供了和c语言几乎一样多的运算符,灵活使用matlab的运算符将使程序变得极为简短。

3. matlab既具有结构化的控制语句(如for循环,while循环,break语句和if语句),又有面向对象编程的特性。

4. 程序限制不严格,程序设计自由度大。例如,在matlab里,用户无需对矩阵预定义就可使用。

5. 程序的可移植性很好,基本上不做修改就可以在各种型号的计算机和操作系统上运行。

6. matlab的图形功能强大。在fortran和c语言里,绘图都很不容易,但在matlab里,数据的可视化非常简单。matlab还具有较强的编辑图形界面的能力。

7. matlab的缺点是,它和其他高级程序相比,程序的执行速度较慢。由于matlab的程序不用编译等预处理,也不生成可执行文件,程序为解释执行,所以速度较慢。

8. 功能强大的工具箱是matlab的另一特色。matlab包含两个部分:核心部分和各种可选的工具箱。核心部分中有数百个核心内部函数。其工具箱又分为两类:功能性工具箱和学科性工具箱。功能性工具箱主要用来扩充其符号计算功能,图示建模仿真功能,文字处理功能以及与硬件实时交互功能。功能性工具箱用于多种学科。而学科性工具箱是专业性比较强的,如control,toolbox,signl proceessing toolbox,commumnication toolbox等。这些工具箱都是由该领域内学术水平很高的专家编写的,所以用户无需编写自己学科范围内的基础程序,而直接进行高,精,尖的研究。

9. 源程序的开放性。开放性也许是matlab最受人们欢迎的特点。除内部函数以外,所有matlab的核心文件和工具箱文件都是可读可改的源文件,用户可通过对源文件的修改以及加入自己的文件构成新的工具箱。

2.3 matlab 遗传算法工具箱简介

  鉴于matlab强大的扩展功能和影响力,各个领域的专家相继突出了许多基于matlab的专用工具箱。本文所采用的遗传算法工具箱,就是由英国谢菲尔德(sheffield)大学设计推出的。相对于其他版本的遗传算法工具箱,如:美国北卡莱罗纳州立大学推出的遗传算法优化工具箱gaot(genetic algorithm optimization toolbox),以及mathworks公司最新的一个专门设计的matlab遗传算法和直接搜索工具箱(genetic algorithm and direct search toolbox),本工具箱的出现最早,影响较大且功能较为完备。文中所采用的所有遗传操作函数大部分出自本工具箱。 第三章  数字图像基础简介

 图像处理的首要一步,就是要了解图像的基本性质与特点。只有充分了解和掌握了所要处理得图像的特点和性质,才能在接下来的处理中根据图像的特点获取所需的信息,并对其进行相应的处理。

本章将介绍数字图像的基础知识,以及图像在计算机处理中的信息表达形式,并对几种常用的图像文件格式bmp, jpeg以及png等做简要的介绍。

3.1  图像的基本概念及其特点

要对图像进行处理,必须清楚图像的概念。一般来说,二维或三维景物呈现在人眼中的样子就是图像。图像具有以下三个方面的特点:

①图像带有大量的信息,一幅图像顶得上千言万语;

②图像种类繁多,包括照片、绘图视频图像等;

③人类从外界获得的大部分信息来自视觉系统。

人们看到的任何自然界的图像都是连续的模拟图像。其形状和形态表现由图像各位置的颜色来决定。可以用f(x, y)表示一幅模拟图像,其中x, y表示空间坐标点的位置,f表示图像在点(x, y)的某种性质的数值,如亮度、颜色等,f、x、y可以是任意的实数。而把连续空间的图像在坐标空间(x, y)和性质空间f都离散化,以便于计算机进行加工处理的离散化的图像则称为数字图像。数字图像用i (r, c)来表示,其中:r=row为行,c = col为列,表示空间离散点的坐标,i表示离散化的图像f。i, r, c都是整数。实际中仍习惯用f (x, y)表示数字图像。图像存储画面的形式为栅格结构:即将图像划分为均匀分布的栅格(像素),显式的记录每一像素的亮度和颜色;而将像素的坐标值规则地隐含起来,其位置排列规则,通常为矩形排列。

3.2 图像的格式

组成数字图像的基本单位称为像素(pixel),把像素按不同的方式进行组织和存储,就得到不同的图像格式;把图像数据存为文件就得到图像文件。图像文件按其格式的不同一般具有不同的扩展名。常用的图像文件格式有位图文件、jpeg文件、gif文件、png文件等。每一种格式都有它的特点和用途,在选择输出的图像文件格式时,应考虑图像的应用目的以及图像文件格式对图像数据类型的要求。下面我们介绍几种常用的图像文件格式及其特点。

3.2.1 bmp图像格式

这是一种dos和windows兼容计算机系统的标准图像格式。bmp格式支持索引色、灰度等色彩模式。图像存储为bmp格式时,每一个像素所占的位数可以是1位、4位、8位或32位,相对应的颜色数也从黑白一直到真彩色。对于使用windows格式的4位和8位图像,可以指定采用rle压缩。bmp图像文件含文件头、调色板数据和图像数据三个层次。其中文件头由定义文件标识、大小即图像数据偏移量的bitmapf工leheader以及指定bmp图像自身的若干参数的bitmapinfoheader两部分组成。这种格式在pc机上应用非常普遍。

3.2.2 jpeg图像格式

jpeg是由联合照片专家组(jiontphotographic experts group)开发的一种图像文件格式。它采用有损压缩方式去除冗余的图像和彩色数据,在获取极高的压缩率的同时也能展现十分丰富生动的图像。也就是说,可以用较少的磁盘空间得到较好的图像质。另外,jpeg还是一种比较灵活的格式,当将图像保存为jpeg格式时,允许用户用不同的压缩比例对文件进行压缩,就是可以指定图像的品质和压缩级别。

3.2.3 tiff图像格式

tiff文件主要由三部份组成,包括文件头、标识信息区和图像数据区。t工ff文件的图像数据区以行扫描的方式存取图像,存储图像前先将图像分割成若干部分,压缩后再存储。存储时,单色图像一个字节存储8个点,16色图像一个字节2个点,而256色图像就是一个字节存储一个点。tiff图像格式是一种应用非常广泛的位图图像格式,几乎被所有绘画、图像编辑和页面排版应用程序所支持。tiff格式常常用于在应用程序之间和计算机平台之间交换文件。

3.2.4 gif图像格式

cif是graphics interchange format(图形交换格式)的缩写,是由computerserve公司推出的一种图像格式。该种图像格式的特点是压缩比高,可以极大地节省存储空间。最初的gif只是简单的用来存储单幅静止图像,后来可以同时存储若干幅静止图像从而形成连续的动画;同时,gif格式支持透明背景,可以较好地与网页背景融合在一起。因此,gif常常用于保存作为网页数据进行传输的图像文件,成为网络和bbs上使用频率较高的一种图像文件格式。但是gif最多只能处理256种色彩,不能用于存储真彩色的图像文件。

3.2.5 png图像格式

这种格式称为可移植网络图像文件格式(portable network graphics),由thomas boutell, tom lan。等人提出并设计。其特点是:①支持48位真彩色图像、16位灰度图像和颜色索引数据图像;②主要面向网络图像传输和图像编辑,其提供的二维交叉存储机制使用户在图像网络传输过程中能更快的观察到接近真实的近似图像;③对用户完全透明且无专利限制,用户可以从internet上随时下载与png文件格式配套的图像数据压缩算法源程序代码:④ 具有比gif高5-20%的压缩效率;⑤ 具有可扩展性。

作为目前最不失真的图像格式, png格式图像吸取了gif和jpeg二者的优点。它可以把文件压缩到极限以利于网络传输,但由于采用无损压缩方式来减少文件大小,png格式能保留所有与图像品质有关的信息。同时,png支持图像背景透明,显示速度快。

本文的所有图像的处理都是对由jpg格式图像通过图像格式转化得来的bmp格式的索引色图像进行的,其具体转换程序参见附录[一]。

第四章  图像分割 4.1 图像分割算法的定义与分类

在图像的研究和应用中,人们往往只对一幅图像中的某些部分感兴趣,这些感兴趣的部分一般对应图像中特定的、具有特殊性质的区域(可以对应单个区域,也可以对应多个区域),称之为目标或前景;而其它部分称为图像的背景。为了辨识和分析目标,需要把目标从一幅图像中孤立出来,这就是图像分割要研究的问题。所谓图像分割,从广义上来讲,是根据图像的某些特征或特征集合(包括灰度、颜色、纹理等)的相似性准则对图像象素进行分组聚类,把图像平面划分成若干个具有某些一致性的不重叠区域。这使得同一区域中的象素特征是类似的,即具有一致性;而不同区域间象素的特征存在突变,即具有非一致性。从集合的角度出发,图像分割定义如下:

设整个图像空间为一集合r 。根据选定的一致性准则p ,r 被划分为互不重叠的非空子集(或子区域):{r1, r2,l, rn},这些子集必须满足下述条件:

(1) r = 

(2) 对于所有的i和j ,当i ≠ j,  =空集

(3) p(ri) = true ,对所有的i

(4) 所有i ≠ j;ri ,rj相邻,p(ri u rj) = false

(5) 对i =1,2,l,n, ri是连通区域

其中:p(ri)为作用于ri 中所有象素的形似性逻辑谓词,i, j =1,2,l,…n。上述条件

(1)指出分割后的全部子区域的总和应包含图像中的所有元素,或者说分割应将图像中每个象素都分进一个子区域中。

(2)指出各个子区域相互不重叠。

(3)指出分割后得到的属于同一区域中的元素应该具有某种相同特性。

(4)指出对于分割后得到的属于相邻两个区域中的元素具有某种不同的特性。(5)要求同一个子区域内的元素应当是连通的。

其中分割准则p 适用于所有象素,由它来确定各区域元素的相同特性。上述数学条件说明了图像分割算法的一些特点,凡不符合以上特点的图像处理算法则不能称为图像分割算法。

目前,在己提出的多种类型的分割算法中,大致可以分为基于边缘检测的方法和基于区域的方法。而在实际应用中,这些方法主要又可划分为三种类型: 边缘检测型、阈值型和区域跟踪型。本文的讨论正是基于阈值型图像分割方法展开的。

4.2 基于阈值的分割 4.2.1方法定义与特点

基于阈值的分割方法是一种应用十分广泛的图像分割技术。所谓阈值分割方法的实质是利用图像的灰度直方图信息得到用于分割的阈值。它是用一个或几个阈值将图像的灰度级分为几个部分,认为属于同一个部分的象素是同一个物体。它不仅可以极大的压缩数据量,而且也大大简化了图像信息的分析和处理步骤。因此,在很多情况下,是进行图像分析、特征提取与模式识别之前必要的图像预处理过程。它特别适用于目标和背景占据不同灰度级范围的图像。阈值分割方法的最大特点是计算简单,运算效率高,在重视运算效率的应用场合,它得到了广泛的应用。

4.2.2阈值的分割的描述

设(x,y)是二维数字图像的平面坐标,图像灰度级的取值范围是g= {0,  1,  2,…l-1 }(习惯上0代表最暗的像素点,l-1代表最亮的像素点),位于坐标点(x, y)上的像素点的灰度级表示为f (x,  y)。设t∈g为分割阈值,b= {b0, b 1}代表一个二值灰度级,并且b0, b1∈b。于是图像函数f 1(x,y)在阈值t上的分割结果可以表示为:

阈值分割法实际就是按某个准则函数求最优阈值t的过程。域值一般可写成如下的形式:

t=t[x,y,  f (x,y),p (x,y)]                    

其中f (x,  y)是在像素点(x, y)处的灰度值,p(x,y)是该点邻域的某种局部性质。4.3.3阈值分割方法的分类

通过上文的讨论,结合所给公式,可以将阈值分割方法分为以下3类:

1)      全局阈值:t=t[p(x,y)〕,即仅根据f(x,y)来选取阈值,阈值仅与各个图像像素的本身性质有关。

2)      局部阈值:t=t[f(x,y),p(x,y)],阈值与图像像素的本身性质和局部区域性质相关。

3)      动态阈值:t=t[x,y,f(x,y),p(x,y)],阈值与像素坐标,图像像素的本身性质和局部区域性质相关。

   全局阈值对整幅图像仅设置一个分割阈值,通常在图像不太复杂、灰度分布较集中的情况下采用;局部阈值则将图像划分为若干个子图像,并对每个子图像设定局部阈值;动态阈值是根据空间信息和灰度信息确定。局部阈值分割法虽然能改善分割效果,但存在几个缺点:

1)      每幅子图像的尺寸不能太小,否则统计出的结果无意义。

2)      每幅图像的分割是任意的,如果有一幅子图像正好落在目标区域或背景区域,而根据统计结果对其进行分割,也许会产生更差的结果。

图像法论文范文5

【关键词】图像配准;压缩感知;小波变换;互信息值

引言

遥感图像分辨率的提高,必然要求器件的采样率的提高,因此,在传统的Nyquist-Shannon采样体制下,采样率是限制分辨率提高的瓶颈之一。与此同时,采样率提高导致数据海量增加,还会给存储、处理和传输带来很大的压力。近年来研究的压缩感知技术(CS)[1-2]可以很好地解决这一问题,被广泛研究用于遥感之中[3-4]。

图像配准是图像融合等各种图像处理的前提[5-6],也是遥感领域研究的重要内容[7-8]。在现有的图像配准方法中,基于小波变换和互信息的配准方法因无需对图像做预处理、自动化程度高、精度高等原因,是计算机视觉和图像处理研究的热点。但是,在CS体制下,图像传感器输出的是图像的观测值,不再是传统的图像,接收端需通过重构算法,才能重构出原来的图像。因此,本文研究一种方法,利用观测值进行配准,将配准与重构作为一个整体来考虑,这样可以减少延时,提高配准效率。

1.压缩感知理论

压缩感知,又称为压缩采样,是信号采样与重构的新技术。CS理论指出,只要信号是稀疏的,则可以远低于Nyquist速率进行采样,然后利用这些少量的采样值,解一个优化问题,就能以高概率重构原信号[1-3]。

设信号是稀疏的,则它可以用基表示为:

(1)

显然向量和向量是同一个信号的等价表示,如果向量有k个非零分量,则称信号为k稀疏。压缩感知的观测模型可表示为:

(2)

其中是未知的N维向量,是M维向量,是一个M×N维矩阵,称为恢复矩阵。在CS体制下,传感器输出的是观测值,接收端利用这M个观测值、观测矩阵、稀疏基和k稀疏的约束条件,重构信号,从而通过反变换得到。

光学图像在小波域是稀疏的,本文讨论的是图像,是其观测值,是小波基,是小波系数。如果采样基于小波域的配准方法,则可直接利用CS重构的小波系数进行配准,省去小波域到图像,图像到小波的反复变换过程。

2.最大互信息配准方法

最大互信息配准方法主要有基于灰度值的配准和基于小波域的配准,在文献[5,6]中具有详细的研究。本文不介绍这两种方法的实现过程,仅仅从信息论的角度来建立这两种配准方法的等价关系,然后用上述文献介绍的方法进行配准。

2.1 基于灰度值的最大互信息配准

互信息(MI)是信息论中的重要概念,可用来度量两个随机变量或随机序列(图像)的相似程度。设输入图像为,它们的互信息可表示为:

(3)

其中:

分别表示信源熵和两个序列的联合熵,表示求均值运算,为图像灰度概率分布,为灰度的联合概率分布。

互信息反映了两图像的相似程度,两图像的相似性越大,其互信息越大,当两图像对准时,其互信息最大,因此,可以互信息最大化为准则,来配准图像和。求两图像互信息的详细过程,可以参考文献[8]。

2.2 基于小波域的最大互信息配准

基于小波域的最大互信息配准方法和基于灰度的方法相似,文献[7]中有详细介绍,这里仅仅从理论上推导灰度值与小波域最大互信息配准方法的等价性。

设图像的小波系数为的小波系数为根据公式(1)及信息论有:

同理,可以推导两幅图像在空域的互信息与它们在小波域的互信息相等,这是因为:

(4)

在上述推导过程中,稀疏基是确定的(常数),不包含任何信息。由此可见,图像和的互信息等于小波系数的互信息,基于空域的图像配准等价于基于小波域中的配准。有了此等价关系,我们可以直接利用CS重构得到的小波系数进行配准。

基于小波域的配准还有一个重要的好处是可以采样多分辨策略[7],即先对低分辨率图像配准,然后将配准结果作为参数进行下一级配准,这样不仅可以避免出现局部极大值,而且可以提高算法执行速度。

3.重构-配准算法

压缩感知算法是压缩感知理论中至关重要的一个部分。不相关性或约束等距性(RIP) [3]为近似精确或精确恢复信号提供了理论上的保证。重建算法的设计应该遵循下面的基本准则:算法应该利用尽可能少的测量数M,快速、稳定、精确或近似精确地重建原始信号。压缩感知算法可以分为以下四类:贪婪算法,凸优化算法,非凸算法,组合算法。本文使用正交匹配算法OMP作为重构图像的算法,具体过程见文献[2]。

在压缩感知体制下,图像传感器所获取的是观测值,因此,本算法的实现从观测值开始。为了方便比较,观测值从两幅给定的图像进行观测而来,即首先分别对输入的源图像进行观测,分别得到观测值,然后将观测值通过OMP算法重构,得到输入源图像的重构小波系数,得到小波系数利用互信息最大的理论进行配准,然后进行图像(系数)融合,最后经过小波反变换得到融合的图像,最终输出重构的融合图像。基于压缩感知理论的图像融合算法具体实现如图1所示。设A、B为两幅源图像,F为融合后的图像,具体步骤如下:

1)利用随机产生的高斯阵对源图像A、B进行观测,分别得到观测值a,b。

2)利用OMP算法分别重构出小波系数。

3)利用上述重构得到的小波系数,根据互信息最大进行准则,实现两幅图的配准。

4)利用加权平均融合规则,得到融合后的系数。

5)在配准的基础上,对融合后的系数进行小波反变换,得到输出的图像。

图1 重构-配准方法流程图

Figure 1 Reconstruction-Registration flowchart

4.实验结果及分析

本节利用MATLAB对图1描述的过程软件实现,并对图2所示的两组图像进行仿真实验。图2(a)中的图像是MATLAB提供的图像(256×256),图2(b)是从某地区的遥感图像中截取的部分图像,其中参考图像为248×267,待配图像为259×276,配准融合的结果如图2所示。从实验的结果来看,本文研究的方法能够实现通过观察值来进行图像的配准和融合。

互信息和峰值信噪比(PSNR)是评价图像配准融合质量的指标。本文从互信息和峰值信噪比两个指标,进一步对本文的方法进行检验与评价。其中互信息用来衡量融合图像从源图像中继承的信息多少,互信息越大,说明融合的效果越好。PSNR是最广泛使用的评价图像质量的客观标准,衡量融合图像相对于标准参考图像灰度的偏离程度,其值越大,说明融合图像和标准参考图像的差异越小,融合效果越好,计算公式如下[1]:

(5)

上式中MSE是最小均方误差。

根据公式(5)可以计算峰值信噪比,通过仿真过程可以输出互信息,结果如表1所示:

表1 图2和图3中互信息和峰值信噪

Table 1 PSNR and mutual information in figure 2 and figure 3

源图像 MI PSNR

图2 3.872 31.15

图3 0.322 10.74

由于图2中配准前的图像是严格对准的图像,它的互信息和PSNR都较大,而图3是截取的部分图像,参考图像和待配准图像不一样大,而且有些部分有较大差异,因此配准图像的互信息和PSNR都较小。另外,最终的输出图像的效果,还跟融合规则有关。

5.结论

CS技术是近年兴起的信号处理理论,它能够节省硬件成本,并且尽可能地利用已有的先验知识来重建出待求信号,在信号采样和图像处理领域具有很好的应用前景。本文研究了基于CS观测值的重构与配准方法,将重构和配准结合起来,提高了配准的效率。由于本文仅仅从可行性方面进行探索,而没有考虑各种预处理,这些在实际中是必须考虑的,这些将在后续研究中展开。

参考文献

[1]pressed sensing[J].IEEE Trans.on Information Theory.2006,52(4):1289-1306.

[2]LingYun Bai,ZhiYi Liang,ZhiJun Xu.Adaptive orthogonal multi matching pursuit based on compressed sensing signal reconstruction algorithm[J].Computer Application Research,2011,28(11):4060-4063.

[3]EM.T.Alonso,P.López-Dekker.A novel strategy for radar imaging based on compressive sensing[J].IEEE Trans.Geosci.Remote Sens,2010,48(12):4285-4295.

[4]JianPing Xu,YiMing Pi.SAR image reconstruction based on bayesian matching pursuit[J].Computer Application Research,2012,29(7):2722-2724.

[5]JianQiu Cao,MengMeng Zhao.Subpixel level fuzzy image registration algorithm[J].Computer Application Research,2013,30(4):1244-1246.

[6]HaiYan Yang,WenChao Luo,GuoDong Liu.Image registration based on SURF algorithm and SC-RANSAC algorithm[J].Computer Application Research,2013,30(5):1586-1588.

[7]ZhiGang Ling,Yan Liang,YongMei Cheng.A healthy steady multi-source feature remote sensing image registration method[J].Chinese Journal of Electronics,2010,38(12):2892-2897.

[8]HaiQing Sun,XiaoQing Wang.Marine dynamic information acquisition base on SAR sub aperture image sequence registration[J].Journal of Electronics & Information Technology 2012,34(1):179-186.

基金项目:国家自然科学基金(41071286);指导老师:郭建中。

作者简介:

图像法论文范文6

在西方英语国家学术界,对视觉文化的研究,大致有英国学派和美国学派二者。尽管二者间的交流既多且频,甚至主要人物也跨越大西洋而在英美两国从事教学和研究,如英国学者诺曼· 布莱逊(norman bryson),但二者却有一些区别。就方法论而言,二者大同小异,基本上都借用了二十世纪的欧美哲学理论、文化研究理论、美术史研究方法和美术批评方法,并采纳了当代影视理论、传播学理论和大众传媒的方法。但在研究领域和研究对象方面,二者却同中有异。其异在于,英国学者的视觉文化研究,包括了视觉艺术,例如绘画。相对而言,美国学者的视觉文化研究,则跨出了视觉艺术的界线,主要研究美术之外的图像及其功用,例如新闻媒体和商业广告所使用的图像。

美国学派的代表学者是芝加哥大学教授米歇尔(w.j. thomas mitchell,1942-),他任教于该校英文系和美术史系,并任著名学术期刊《批评探索》的主编。米歇尔的学术专长在于比较文学和美术史论,他对二十世纪的批评理论和方法比较了解,并站在当代学术前沿,引领美国视觉文化研究的方向。米歇尔在中国的影响也比较大,其“图像转向”(pictorial turn)的概念,甚至成为国内文化商业界一些从业人员鼓吹文盲式“读图时代”的理论根据。米歇尔著述甚丰,涉及视觉文化之图像理论的主要有三部,《图像学:图像、文本、意识形态》(iconology: image, text, ideology,1986)、《图像理论》(picture theory,1994)和《恐怖的克隆:图像战争,从美国九一一到伊拉克虐囚》(cloning terror: the war of images, 9-11 to abu ghraib),其中《图像理论》有中文译本,由陈永国、胡文征翻译,北京大学出版社2006年出版 。

2008年1月,米歇尔应邀到加拿大蒙特利尔,在康科迪亚大学美术学院讲学,介绍他的图像学新著《恐怖的克隆:图像战争》,研讨视觉文化与当代图像学。其间,笔者有机会向米歇尔请教诸多问题,尤其是与笔者正写作的专著《视觉文化传播》相关的一些具体观点和概念。

在涉及视觉文化的研究领域和对象时,笔者专门向米歇尔求证其观点:您主张的视觉文化研究,包括不包括视觉艺术,诸如美术或绘画?米歇尔的答复非常明确:不包括。作为视觉文化研究之美国学派的领军人物,米歇尔早在八九十年代就对潘诺夫斯基的传统图像学进行了挑战,并以“图像转向”为号召,主张超越绘画和视觉艺术,使图像研究成为后现代以来之文化研究的一个重要内容。为此,他弃用潘诺夫斯基图像学的专业术语iconology,转而使用一个极其普通的日常词汇picture(图画),以示自己的大众文化研究与前者的精英文化研究相区别。

要之,视觉文化研究中的美国学派,是指以米歇尔为代表的学者,他们主张从大众传媒的角度去研究非艺术的图像,而不再局限于美术的角度和作为艺术作品的图像。本文作者赞同超越美术领域去探讨美术,也认为美术研究不应该局限于大师及经典作品。但是,笔者不认可美术研究同视觉文化研究相对立的观点,不认为二者相互排斥。相反,笔者认为,美术研究是视觉文化研究的一个重要组成部分,美术研究与视觉文化研究的关系是,视觉文化研究包括了美术研究,并为美术研究提供了一个超越美术的视角,这使研究者有可能从其它视角去发掘美术的更广、更深的意义,及其可能被美术研究所忽略的潜在价值。

二 三种图像

虽然笔者不能全盘接受米歇尔关于视觉文化之研究领域和研究对象的褊狭主张,但这并不妨碍笔者向他进一步请教相关问题:美术史研究与视觉文化研究有何区别?米歇尔回答说,美术研究和美术史研究,是将美术作为一种艺术现象来看待,即研究“艺术的图像”(artistic image),正如文学研究之于语言,是探讨怎样艺术地使用语言。相反,视觉文化研究关注的是“非艺术的图像”(non-artistic image),也即世俗的图像(vernacular image),尤如语言研究中对日常用语及其使用方法的关注。

在这样的意义上讲,所谓“图像转向”就不符合我们国内一些学者为“读图时代”的视觉狂欢而寻找舶来理论的初衷。就这个问题,笔者特意向米歇尔求证:您说“图像转向”,是否意味着语言文字的表意功能被图像取代了,是否意味着语言文字在当代文化研究中不重要了?米歇尔的回答十分清楚:绝不是这样。他说,语言文字自有其价值,不可能被视觉图像所取代。今天,所谓图像转向,是说图像研究超越了美术研究的疆界,而进入了摄影、电视等新的大众传播领域。这个观点,正是米歇尔新著《恐怖的克隆:图像战争》的理论前提。

米歇尔的当代图像学涉及三个“图像”术语,颇能说明“图像转向”及美国学派之视觉文化研究所关注的新对象。第一个是潘诺夫斯基采用的图像学术语iconology,源出古希腊语和拉丁语中的“肖似”一词,后来指基督教的图像,自19世纪初则被东正教用来指称圣像。潘诺夫斯基将这个词发展为专业术语,用于他对中世纪和文艺复兴之宗教艺术的阐释。第二个术语picture以其通俗化和大众化而具有后现代主义之平民文化色彩,不仅是对潘诺夫斯基之专业术语的颠覆,也是对其图像学基本概念的颠覆。然而,在米歇尔新著《恐怖的克隆:图像战争》中,他又使用了一个比较中性的术语image。于是,笔者向米歇尔请教:在当代图像学和视觉文化研究中,image与picture这两个概念有什么异同?

米歇尔用形象的语言来解释这个问题:一个picture就象一张画片,你可以用电脑软件来修改它,也可以把它撕毁,但画片上的原初图像却无法被改变或毁掉,这原初图像就是image,它以不同的方式存在于不同的地方,例如,它以数码方式存在和传播。于是笔者问:这是不是说,picture指图像的物理(physical)存在,而image则是原初图像本身,超越了物理的存在,而隐身于变形的picture中?米歇尔回答说是这样,并进一步解释道:作为原初图像的image不能被人为地任意扭曲,而被扭曲的只能是picture。经过人为扭曲后的图像,已经不再是最早那个未被扭曲的原初图像,而是一个具有实际用途的picture,例如商业或宣传用途。然而,在这被扭曲的picture中,却以基因密码的方式保存着原初image的信息。米歇尔的当代图像学和视觉文化研究,关注image怎样变成了picture,关注image所携带的信息,以及image经过了加工或人为的扭曲而成为picture后,这picture所具有的信息传播和宣传功能。

米歇尔的新著《恐怖的克隆:图像战争》便是对这一理论的阐述和实践。在涉及image转化为picture的过程和方式时,米歇尔提出了一个关于当代图像学的关键词“生物图像”(biopictures)。

三 生物图像

米歇尔对“生物图像”这一概念的阐释,是从人工智能、遗传基因、生物工程、数码复制等角度进行的。他的基本看法是,当作为image的图像借助大众传播工具而被广泛复制和传输时,不会出现失真的情况,因为这是一个数码复制和传输的过程。在这个过程中,数码信息保留了image原初的dna编码。与此相对,失真的图像是人为操作时出现的有意扭曲,是操作者出于某种目的而特意为之。他认为,当代大众传媒对于图像的使用,有意利用了人为失真的picture,但我们透过这图像的表象,却能把握其原初图像的真实信息。

照我的理解,任何图像一旦经过传播,无论是image还是picture,都会失真。传播是一个大规模复制并散发的过程,处于传播之另一端的图像,与原初图像有时间和空间的距离,这使复制和传播的图像,失去了它原初的语境。图像携带的原初信息,在相当程度上由其语境所确定,一个失去了自身时空语境的图像,只能是一个失真的图像,这就像本雅明所言,失去了该图像产生时的特定“光晕”(aura)。因此,无论以何种方式传播图像,都是无根漂浮,在相当程度上失去了原初的本真。

针对笔者提出的这个疑问,米歇尔说,本雅明所说的图像复制,是机器复制,与今日数码复制完全不同。数码复制所传输的是图像的生物信息dna,而不是机器复制所传输的图像外观。生物信息虽然脱离了原初的“光晕”,但所携遗传密码并未改变,因此不存在失真问题,这是今日数码传输的要义。我在此注意到,米歇尔的探讨转入了技术层面,他绕过了图像文本与其语境的关系问题,而开始了形而下的解说。虽然笔者坚持认为,图像的信息受制于原初的语境,但“生物图像”之说,却仍然具有启发意义。

对我而言,这启发就在于“仿生学”(bionics)和仿生艺术。仿生学是二十世纪兴起的一门工程技术科学,它研究生物功能,并转而将其应用于工程设计。例如在潜艇的设计中,为了降低航行的噪音,设计师们研究鲨鱼皮肤的内部构造,并模仿其构造而设计出具有静音功能的人工鲨鱼皮,用以制成消音瓦,将其覆盖于潜艇外壳,从而降低潜航噪音。这种生物仿制,是一种仿生学复制,尽管不必复制生物的外在表象,但却把握了生物遗传的信息编码,这使工程技术中的复制得以实现高保真。仿生艺术在西方兴起于八十年代末九十年代初,是环境保护主义的产物,多是以装置为外在形态的观念艺术,旨在传播环保意识。

由于米歇尔强调图像所携带的信息是以生物编码的方式来复制和传输,于是笔者便问他为何不用现成的术语“仿生图像”(bionic pictures),而要生造一个新术语“生物图像”,并问及二者有何种关系。米歇尔回答说,“生物图像”是一种用类似于克隆技术复制的图像,与机器复制的图像不同,不仅没有失真,反而因基因改造而优化了图像,而机器复制却因“光晕”不再而失去了原初的本真,因此,“生物图像”与“仿生图像”并无本质区别。

笔者由此想到,借助仿生学技术来复制图像,涉及的不仅仅是图像的外形,更重要的是涉及了特定外形所携带的内部基因密码。正是由于这生命遗传的密码,才使生物的外形与其功能密不可分,而生物外形与其生命功能的关系,又是达尔文进化论的要义,在今天不仅涉及到科学技术的进步,也涉及到文化和学术的发展。在此,“生物图像”关注的是生物外形与生命信息的编码,关注二者间的功能关系,并与当代艺术的方式发生了某种关联。

四 恶搞图像

关于这种关联,在我看来,米歇尔的上述理论虽然不是关于美术的,但这理论的意义,却在于它可以帮助我们理解当代艺术。例如,生物图像的复制,可以帮助我们从理论渊源上认识今日艺术中的“恶搞”方式。恶搞是视觉艺术的一种修辞方式,然而西方当代艺术中的恶搞与今日中国时髦的恶搞却有本质的区别。尽管两者都以幽默为基调,但前者带有相对强烈的政治信息,而后者则大多出于赢利的商业目的和庸俗趣味。我这样说并不是要无条件地赞同西式恶搞或一概否定中式恶搞,我说的只是今日艺术中的一种倾向。

西式恶搞的政治内含,与米歇尔所说的“图像战争”(war of images)密切相关。米歇尔的讲座,从头至尾贯穿了他对美国总统布什及其发动伊拉克战争的指责,他在讲座中使用的图像,也大多是伊拉克战争的新闻图片。照他的说法,发动战争和反对战争的双方,都利用了战地新闻图像。布什发动战争,其视觉依据之一,是九一一恐怖袭击中纽约世贸中心浓烟滚滚的图像,而后来人们反对伊拉克战争,其视觉依据之一,则是伊拉克阿布格拉监狱的虐囚照片和视像资料。

在虐囚图像中有一令人触目惊心者,是一个囚徒从头披着一身破麻布,双手接通两条电线。这个图像经过新闻媒介和网络而迅速传向世界各个角落,成为布什战争罪行的一大证据。由于这一图像广为流传而且极具感召力,美国苹果公司便将其借用来作商业推销,把原初图像中受电刑的囚徒,修改为一个听ipod的人正载歌载舞。这个被修改被扭曲了的图像作为广告推出后,招来社会各界的一片责难,苹果公司只好收回了这一不道德的广告,并灵机一动,又改头换貌赶制了嘲讽伊拉克战争的广告,继续推销自己的产品。

苹果公司对虐囚图像的两次修改利用,其实就是一种恶搞,先是商业恶搞,然后涂上了政治色彩。的确,除了这种商业恶搞,在西方有更多人对虐囚图像作了政治恶搞。米歇尔展示的一幅政治恶搞图像,是利用图中人的外形相关性,而将受电刑的伊拉克囚徒与西方文化传统中经典的耶稣受难图重叠起来,由此赋予这一虐囚图像以强烈的政治性,表达了恶搞者对布什发动战争的不满。从米歇尔之当代图像学的角度看,原初的虐囚图像image和被修改的虐囚图像picture之间,虽然经过了复制和传播,外貌发生了变化和失真,但其生命遗传的编码却得到了保存。换言之,原初图像中的生命密码,通过数码复制和传播而被转移到扭曲的图像中。这生命密码所携带的信息就是有关人类蒙难的信息。正因为人类蒙难的基因密码以数字方式保存了下来,所以虐囚图才与耶稣受难图有了内在的同构,这类似于仿生学的同构,于是进一步唤起了读图者对这二者之视觉外形的认同,从而使政治恶搞的目的得以实现。

虽然米歇尔的视觉文化研究不涉及美术,但在虐囚图像的话题上,他却言及了旅居纽约的著名哥伦比亚画家费南多·博特罗(fernando botero),因为这位以描绘傻笨肥俗的浅薄形象而闻名于世的当代大师,近年绘制了一系列关于美军在伊拉克监狱虐待囚徒的作品,以幽默的恶搞,来表达了艺术家明确的反战态度。博特罗的作品在纽约和欧美各地展出后,引起了广泛的反响,应和了西方世界的反战呼声。

在博特罗的绘画中,作为一种寓言的政治恶搞,发挥了图像的修辞功能,显示了图像的威力。米歇尔的当代图像学是一种具有强烈政治色彩的视觉文化理论,他超越了美术的领域,将视觉文化研究引入了传媒政治中,使我们可以从大众传媒的角度来阐释博特罗绘画的政治性和批评价值。然而非常有趣的是,米歇尔却口口声声说自己是一个“死心塌地的形式主义者”(i am a die-hard formalist)。我猜测,米歇尔的视觉文化研究,关注图像的构成、存在、复制、扭曲和传播方式,因此他是形式主义的。但是,我们应该看到,在这一切的背后,以生命密码的方式潜藏着米歇尔的政治态度和批判精神,这使他成为一个具有批判性的文化政治学者。

如果借用他自己的术语,我想这样说:米歇尔之视觉文化研究的政治性,以生命遗传的密码方式而成为其当代图像学内在的原初图像image,而他从形式角度对图像构成和传播方式的研究,则是其外在的picture。反过来说,在这个image中,以生命密码的方式,潜藏着他的政治信息。唯其如此,我们才明白他为什么会批评布什发动的战争,而不是去进行浅薄的商业恶搞。

上一篇施工图论文

下一篇房产税论文