地理数据的基本特征范例6篇

地理数据的基本特征

地理数据的基本特征范文1

【关键词】变化检测;矢量;叠加

0 引言

在经济高速发展的今天,各种遥感卫星相继运行,多时态遥感数据不断积累,多时相遥感影像变化检测已经在土地利用、环境监测等各个领域得到广泛应用。目前,遥感影像变化检测技术正处于结合人工解译和计算机自动发现的阶段。

1 特征库设计与建立

建立多源特征库以辅助实现影像变化检测。该特征库主要包括感兴趣区域类别特征,感兴趣区域变化信息数据库,感兴趣区域图斑特征,光谱特征,纹理特征以及指数特征。

(1)感兴趣区域类别特征――通过分类体系来表达。将已建立的分类体系存放在特征库中,采用分类后比较进行变化检测时,调用特征库中的分类体系,方便快捷的进行遥感影像的分类,提高变化检测效率。

(2)感兴趣区域变化信息数据库――通过影像类别及其类别信息来表达。采用比较后分类的方案进行变化检测时,手绘变化图斑进行图斑地类判别,调用特征库中已存放的感兴趣区域变化信息数据库,方便快捷的进行前后时相变化图斑地类划分,提高变化检测效率。

(3)感兴趣区域图斑特征――感兴趣区域分类库,通过感兴趣区域表达。将比较后分类及分类后比较两种方法产生的不同地类变化图斑矢量层保存在特征库中,供用户查询不同区域地类变化信息。

(4)光谱特征――针对每一类别的光谱信息,统计每一类别地物的均值与方差等。光谱特征可用于影像信息提取,影像分类等方面。

(5)纹理特征――针对每一类别的纹理,利用共生矩阵计算纹理信息。

(6)指数特征――植被指数、水体指数等。指数特征应用广泛,是进行图像分割,影像信息提取等不可或缺的条件,因此,将指数特征入库管理,将大大提升遥感影像处理的效率。

该特征库主要实现三方面功能:一是,存放已建立分类体系与样本图斑,供变化检测导入使用。二是,存储变化地类矢量图层。三是,采取分类建立索引的方法,解决了查找速度慢的问题。可通过行政地名、行政境界、图层数据编码等方式进行快速定位搜索变化图斑,提高了数据库管理的效率。

2 变化检测流程设计

遥感影像变化检测由影像几何配准、辐射校正、变化信息提取及后处理等几大部分构成。本文采用自动一体化流程,实现计算机对同一地域多时相遥感图像的分析和比较,得出变化数量及类型,为决策者提供必要的参考信息。

2.1 数据输入

在以环境与灾害监测预报小卫星星座为主要数据源的基础上,结合气象卫星、海洋卫星、资源卫星等数据。

2.2 变化影像产生

不同时相影像通过基于直方图曲率的CVA变化检测方法得到变化掩膜,将掩膜影像与原影像进行叠加,利用MaskFilter滤波,得到变化影像。

基于直方图曲率的CVA分析法主要思路包括三个方面:

1)在已知的变化强度特征基础上,以两期影像每个像元的相关系数作为一个新的特征,采用两个特征来判断最佳阈值;

2)对变化强度图和相关系数图的直方图进行数值分析,计算直方图的曲率,从而确定初始分割阈值的上下限范围,在阈值上下限内计算Kappa系数,选取Kappa系数最大的变化强度值为最佳分割阀值,对变化强度图进行二值化分割,确定变化范围;

3)在发生交化的区城内,提取分类信息。

2.3 掩膜后处理

计算相应的错判误差,漏判误差,检测精度,总体精度,以及Kappa系数等精度评价指标。

2.4 变化检测

文采用分类后比较的方法,首先导入特征库中的感兴趣区域类别特征,即分类体系,利用已存放的各地类图斑,采用极大似然分类方法进行变化影像的分类处理。优化分类图斑边界。对各前后时相分类影像分层矢量化文件进行矢量叠置分析,得到不同地类变化矢量图层,系统将自动保存变化地类矢量图层,即感兴趣区域图斑特征到特征库中。

3 结论

本文研究遥感影像变化检测方法研究以环境卫星数据为基本数据源,实现了图像预处理、变化信息提取及后处理等一体化的技术流程,可以高效的进行变化信息的检测;特征库中的感兴趣区域类别特征可以辅助进行变化检测,其它特征具有实时查询、更新变化图斑数据库的功能;但是,基于地物的高强度变化,变化信息检测算法框架有待进一步细化与改进,使其达到更高的精度,得到更广泛的应用。

【参考文献】

[1]孙家.遥感原理与应用[M].武汉:武汉大学出版社,2006(4):115-116.

[2]汤国安,张有顺,等.遥感数字图像处理[M].北京:科学出版社,2004(1):270-271.

[3]赵英时.遥感应用分析原理与方法[M].北京:科学出版社,2005(3).

地理数据的基本特征范文2

关键词:特征价格加权平均房地产价格指数

目前,我国房地产市场处于供求两旺的状态。面对房地产业的大好形势,为了防止泡沫现象的发生,促进房地产市场信息的透明化是一个重要举措。房地产价格指数是房地产市场综合因素影响下,供求关系的直接体现,能及时地向社会传达市场信息,是房地产市场信息透明化的主要标志。

一国内外研究现状

目前,我国房地产价格指数的编制与既有政府主持的,也有民间承担的。民间的房地产指数由房地产开发商或中介机构编制,如中房指数(CREIS)、戴德梁行指数(DTZindex),伟业指数、中原城市指数(包括CCI和CCL)等。政府的房地产指数一般由房地产管理部门组织编制,如全国35个大中城市房地产价格指数、深圳房价指数、上海住宅预售价格指数、西安40指数等。这些价格指数的编制和使用上存在以下几个问题(张宏斌、贾生华,2000):指数编制过程中,板块、片区和商业圈的划分缺乏必要的理论依据;指数的计算方法落后;价格指数的预测方法不能体现房地产市场的内在特点;各地编制房地产价格指数的主体不一样,造成了数据的来源和样本的选择方法存在很大的差异。

国外的房地产价格指数编制方法众多,从现有文献来看,大致可归纳为以下几种关键类型:重复交易法、特征价格法以及混合模型方法。其中重复交易法和特征价格法是解决房地产价格指数编制中由于房地产结构差异、品质差异所造成的指数偏差等问题的较好方法,尤其是特征价格法在国外住宅价格指数的应用中最为广泛。然而,由于我国特殊的国情和市场条件,国内目前十余种房地产指数的编制大多采取了理论上简单、实际编制上粗糙的加权平均法,或者是加权平均法和重复交易法相结合的不规范做法。在指数的理论和实践中存在着指数测算方法不完善、样本数据缺乏代表性、指数的应用受到很大的局限等问题。

然而,随着我国市场经济改革的不断深入和国民经济的稳步高速增长,我国各地房地产市场在数年内就有了前所未有的变化和发展。在经济发展迅速、市场体制较完善的地区和城市,房地产市场不断规范和成熟,市场交易案例逐步增多,房地产交易登记备案制度也逐步得以实施和完善。这样,我国城市房地产指数在编制的基本理论方法上,一些城市地区已初步具备了应用特征价格法的现实可行性,大量的交易案例和实际价格数据使得房地产各属性与房地产价格关系的测算成为可能。同时,由于我国目前房地产市场仍然以一级市场(即新盘的交易)为主,大多数城市的二手房市场远未放开,市场交易资料相对来说还是较封闭不公开,这种现实状况极大地限制了重复交易法的应用。当然,在一些二手房市场较发达、市场基础较好的个别地区,如上海,可以考虑采用该方法编制房地产指数。此外,由于大多数地区和城市,毕竟房地产市场的发育晚、规范慢、交易少,在一定的时期内都不一定能够具备仅仅应用征价格法的条件。这样采用细分市场和加权平均法以及特征价格法可能对目前国内很多亟需编制房地产价格指数的城市还是一种可行的思路。

总之,从未来我国房地产价格指数编制的趋势看,特征价格法因其方法的科学性和理论的完善性而具有广阔的应用前景,应加强这方面的理论研究。此外,应针对不同地区不同条件选择合适的、可行的房地产价格指数编制方法。在有条件的地区、城市,可分别采取两种以上的方法进行房地产指数的编制,并进行比较研究。

二特征价格模型

房地产特征价格法编制房地产价格指数的理论依据源于“特征价格理论”,最早由美国经济学家Lancaster于1966年创立,其意义为每单位消费者在追求效用极大的过程中,每增加一个单位某种属性的消费,所愿意支付的边际费用。这种方法是应用特征价格理论,运用模型求出影响房地产商品价格的品质因素所隐含的价格,并可确定每一品质因素变动对商品价格的影响程度。这样即使是非同质商品也可以在基期和报告期进行比较。设p为房地产商品价格;Xi为房地产品质因素;βi为各品质因素对房地产商品价格的影响系数;Tj为房地产商品在j期售出的虚拟变量,若出售Tj=1,否则Tj=0;rj为在j期出售的房地产商品价格变动;为随机误差项。根据特征价格理论可以建立房地产商品价格模型:

LnP=∑βiLnXi+∑rjTj+e(1)

通过回归分析,以得到各期的值,利用这些数据就可以编制房地产价格指数。这种方法虽有较好的理论基础,但在应用时要注意考虑这样几个问题:影响房地产价格的特征因素有那些;房地产价格与这些特征因素之间的关系是什么样的。因此,在实施时,该方法需要大量的房地产价格资料及相应的大量统计数据,这样有助于发现其中的规律,目前国外一般采用特征价格理论编制房地产指数,使计算出来的房地产指数尽可能反映房地产市场供求关系的变化。特征价格模型的实证研究和应用分为两个方面:

价格指数的编制。特征价格模型最初的用途是编制价格指数,即使在现在,特征价格模型的第一种且非常重要的用途,也还是根据数据的性质(时间序列数据、横截面数据、面板数据)对价格指数的编制方法进行全面改善,研究的基本目的是提高住宅价格基准的精确性,一些研究还构建了适用于特别用途的住宅价格指数,如对贫困分界点的测量进行改进。

推断特征的隐含价格和估计特征的市场需求。大多数研究往往把焦点集中在运用模型如何求得科学合理的特征价格这个问题上。而美国不少学者研究不同人种、社会经济状况等因素对住宅价格的影响。另外,有不少学者使用特征年龄系数来测度折旧。尽管估计特征的市场需求存在一些困难,但还是有许多研究试图得到单个住宅特征或特征群的需求参数(有时是供给和需求参数)。

三我国房地产价格指数的构建

应用特征价格模型的理论前提是市场均衡,在现实世界中满足这一理想条件的情况不存在。但是,国内市场经济的发育已经为应用特征价格模型创造了条件。应用的切入点可以房地产行业,因为在国外大约有一半多的房地产价格研究采用特征价格模型进行的实证研究,这些研究为本文提供了丰富的文献资料和借鉴经验。此外,国内房地产行业的资料收集条件已经基本成熟,可以通过政府部门、中介机构等各种渠道获取市场资料。因此可以从以下三个方面进行重点研究:一是房地产价格指数的编制;二是房地产评估方法的完善;三是研究环境、交通等具体因素对房地产价格的影响,这些都是可行的且具有重要的实践意义。由于房地产价格特征指数法要采集大量的数据,一般直接编制全国的房地产价格特征指数有困难,现以成都市房地产为例,探讨改进的房地产特征指数的实施方案。

(一)对城市房地产市场作分区、分类

这里主要是指对住宅的分类,可分为普通住宅、公寓、别墅,或分为多层、高层等,主要是使各类之间的品质更为接近,各类之间的区别更大些。分区就是将城市区域划为一个个片区,划分的原则就是保证每一个片区在环境品质方面,如周边学校、商业中心、医院、周边道路、空气污染情况、治安环境等方面大体的相同性。在实际操作时,应邀请本地区房地产市场方面的专家,采用特尔斐法确定影响房地产商品价格的品质因素。

(二)采用抽样调查方式获取数据

该方式能够事先计算和控制误差,同时还可以降低编制指数的成本。首先对房地产市场进行了分区分类后,抽样时宜采用分层抽样的方式。根据抽样原理在允许误差的情况下确定样本数目,再根据各片区的规模及近几年各片区的交易量来确定在每个片区抽样的数目。

然而,在同一片区内,房地产商品之间仅在楼层、建筑面积、装修程度、朝向等建筑物本身品质方面存在不同,因此较容易应用特征价格理论建立模型来评估这些品质的变动对房地产价格带来的影响。这样,如果同一房地产商品在报告期没有交易,也可采用在同一片区有交易的房地产商品修正后的价格作为代替,解决了样本前后期同一性的问题。同时因为同一片区的环境品质大体一致,前后期品质的影响也可消除。这样,在很大程度上解决了前面提到的样本可比性和价格评估的问题。

(三)价格指数的构建

1.分区分类房地产均价。每一个片区同一类别的房地产价格保证了同质可比性,因此可以通过计算分区分类均价:

pij''''=∑p''''ijsq''''ijs/∑q''''ijs(2)

其中:i表示片区,j表示住宅类别,s表示样本房地产,t表示报告期,p''''ijs样本房屋用于房地产指数编制的房地产价格,q''''ijs为该房地产交易面积,t表示报告期,0表示基期。

2.分区分类房地产指数。由于每一个片区同一类别的房地产可以看作是同质样本,因此分区分类房地产指数就相当于个体指数,其计算公式如下:Iij=p''''ij/q0ijs(3)

3.综合指数。接下来就要采用加权的方法将分类分区指数合成综合指数,根据需要,可以合成某一行政区指数,也可以合成某一类别指数,或者合成总体综合指数。由分区分类指数合成综合指数,非常关键的是权重的选择。权重的选择要考虑两方面的问题:一是采用成交面积还是成交金额,目前国内房地产指数较多的采用成交面积,略显不足,有些高档住宅成交面积虽小,但成交金额较大,在整个房地产市场中所占地位较重,这在权重中应有反映。二是只考虑有交易的房地产还是考虑全部的房地产交易面积都会发生变化,也就意味着现实中的权重在每一个计算期都发生变动,因此,按基期权重计算的结果就会与实际情况出现偏差。有些片区经过一段时间可能因各种原因而退出指数计算,而有些新建小区可能要成为指数计算的样本。另外根据本地区房地产市场的情况,各片区所占权重经过一段时间也要进行调整。这些调整间隔大约一至两年为宜。样本或权重调整后都要对当期指数进行调整,以保证指数前后的衔接。

四结论

理论上,特征价格法要求房地产市场完全竞争。就房地产市场而言,由于房地产行业具有资金密集、开发规模大的特点。同时,我国政府对房地产企业的管理实行严格的行业准入制度,这样房地产市场存在一定的进入壁垒;而房地产建设投资周期长的特点又决定了企业在退出房地产业时也存在一定的障碍。房地产企业的数目与具有完全竞争行业的企业数目相比,相对而言要少得多。同时,虽然房地产业的一个显著特点是产异质性,但应该看到,在同一类型的产品上,各企业提供的产品差别实际上并不是很大的。因此可以判定房地产市场至少不是完全竞争市场。

本文提出的房地产价格指数构建方法,不仅保留了特征价格指数方法的优点,还充分结合了目前我国实际的情况,对于构建适合我国房地产市场的价格指数具有参考价值。

参考文献:

1.张宏斌,贾生华.编制城市房地产价格指数的理论模型和现实用法[J].中国软科学,2000(4)

2.BaileyMJ,MuthRF,NourseHO.Aregressionmethodforrealestatepriceindexconstruction[J].JournaloftheAmericanStatisticalAssociation,1963

3.KuoCL.ABayesianapproachtotheconstructionandcomparisonofalternativehousepriceindices[J].JournalofRealEstateFinanceandEconomics,1997,14(1-2)

4.GrilichesZ.Priceindexesandqualitychanges:studiesinnewmethodsofmeasurement[M].Cambridge,Mass:HarvardU.Press,1971

5.WilsonWW.HedonicpricesintheMaltingBarleymarket[J].WesternJ.Agri.Econ.,1984,9(1)

地理数据的基本特征范文3

关键词:计算机取证特征集模型皮尔森相似度算法

中图分类号:TP393 文献标识码:A 文章编号:1672-3791(2016)8(b)-0000-00

1 构建特征集模型的意义和目的

计算机取证技术的研究主要是为了保证电子证据的可信性和完整性,为此,取证专家们在研究过程中推出了一些计算机取证模型。一些常见的取证模型主要有:基于过程的取证模型、事件响应过程模型、抽象过程模型、综合数字取证模型、多维计算机取证模型(MDMF)、基于蜜罐技术和入侵检测的取证模型等。

利用计算机作为存储工具的犯罪案件在计算机犯罪中占有很大的比例,当前可供人们使用的存储设备多种多样,硬盘、U盘和可移动磁盘等都是最常用的存储工具。由于电子证据的易改变性,磁介质存储的数据很容易被修改或者删除。因此,基于磁盘的特性和文件系统的结构特点,数据恢复技术成为了静态取证的重要手段。计算机取证最大的困难就是取证过程中证据的真实性问题。由于电子证据的易改变性,数据很容易被犯罪分子删除或者改变,电子证据进行事后取证获取的很有可能是犯罪嫌疑人处理过的数据。为了改变静态取证中存在的这个问题,研究者们提出了动态取证的概念,利用入侵检测的机制,将入侵检测技术和计算机取证结合起来,形成了具有实时性、智能性、可扩展性的动态取证模型。传统动态取证系统由数据获取、数据挖掘、数据分析、证据鉴定、证据保全和证据提交等模块组成,各模块之间通过信息访问进行通讯,完成协同取证功能。

入侵监测模块进行系统监测,一旦发现非法入侵便及时报警。数据获取模块从文件系统中和网络数据包中获取文件,对文件进行提取和捕获。并将数据处理后存入数据仓库。数据挖掘模块对数据仓库的数据进行分析,找到与犯罪文件相关的数据文件,并且将文件的分析结果存入知识库,对数据文件的下一次分析起指导作用。最后,将分析过滤后的原始证据文件进行证据鉴定并且归类提交。

传统的动态取证模型大多是面向过程的取证,其最大的缺陷是不能保证证据的连续性,传统的取证模型将提取后的原始证据文件直接加以分析鉴定,并不对证据获取和入侵检测环节进行反馈,这就造成了证据链难以形成以及重要证据文件的缺失。

对文件系统的研究可以得出,文件系统的组织结构和日志文件的存在使得被删除的文件得到恢复成为了可能。但是由于文件系统的特殊结构和日志文件的记录方式,文件的删除后对文件系统结构的影响不尽相同,从而造成文件恢复的困难。例如Mac OS上的HSF+文件系统采用B-树来组织文件,进行文件删除操作时,文件系统现将删除后的文件记录写入日志文件,然后再由日志文件对文件系统进行更新,因此,日志文件的记录和文件系统显示删除后的内容完全一致,这对数据恢复没有任何帮助,删除文件后,文件系统的卷头、头节点、叶子节点均会发生变化,也只节点中文件记录前移,覆盖被删除文件,被删除的文件记录会完全消失。这时,被删除文件的类型和特征就成为文件恢复的可能因素,结合盘区文件存储的连续性特点,文件的恢复便成为可能。因此,如何通过构建文件的特征集,就成为本文研究的关键性问题。基于这个前提,本文提出了基于特征集构建的取证模型。

2 基于特征集构建的取证模型的提出

本文提出的基于特征值构建的计算机取证模型是为了解决原始证据文件获取方面的困难,以数据恢复等取证技术作为出发点,运用数据挖掘技术对以获取的文件数据进行分析处理,得到原始证据的同时,构建异常文件的特征集合,形成特征集模型,并且将文件特征反馈给证据获取阶段所运用的核心――数据恢复技术,使得整个取证系统形成自学习的功能,从而更加精准地获取磁盘原始文件数据并且有效地挖掘原始证据文件之间的关系,形成证据链。取证模型如图1所示:

获取文件仓库:运用数据恢复等数据获取常用技术将本地磁盘或者移动设备的数据文件提取并保存在获取文件仓库,以待进一步分析认证。

异常文件库:对获取文件库中文件运用数据挖掘等方法进行分析,得到孤立点文件集合,并且归并为原始证据集合,以待证据鉴定。

特征集模型:分析异常文件库中文件特性,提取证据文件特征,将特征构建特征模型,并入特征集模型。特征集模型的主要作用是提供异常文件的特征,并且对证据获取阶段的相关技术提供支持和反馈。

本文将特征集定义为一个多元组 ,其中 为针对每个文件的不同特征值,每个文件可以选取n个有效地特征。特征的结构如下:

每个特征包含两个属性,name属性表示特征的名称,prior属性表示特征的优先级,这个属性值将在分析异常文件时确定。当特征集模型在数据恢复等技术中应用时,遵循以下原则:当文件判断为可疑文件待恢复时,优先考虑文件特征prior属性值较高的特征作为恢复依据。

3 基于特征集构建的取证模型的取证步骤

与传统的取证模型相比,本文所提出的取证模型的工作步骤主要是增加了特征集模块的构建工作以及对证据获取过程的反馈环节,基于特征集构建的取证模型工作步骤如图2所示:

图2 取证流程图

取证前准备阶段要保证取证环境的安全性和完整性,即待测设备和系统并未受到外界的破坏或者改变。随后可以通过入侵检测技术进行网络数据截取或者利用数据恢复技术对磁盘文件进行提取的方式构建数据仓库。接下来,对数据仓库中的数据应用数据挖掘技术进行分析,找出孤立点文件并入异常文件库。对异常文件库中的文件进行特征分析,得到文件特征属性并构建特征集。最后对异常文件库中的文件进行证据鉴定,形成原始证据,并对其保存、归类和提交。构建完成的特征集模型可以对数据获取阶段的入侵检测技术和数据恢复技术加以支持,从而提高文件获取的效率,并且保证证据的真实性和可信性以及证据链的构建。

4 基于皮尔森相关系数的文件特征相似度计算

对文件特征集的构建包括以下概念:

设备类型集 :文件所属设备类型组成的集合,包括本地磁盘( )、U盘( )、移动硬盘( )、光驱( )、其他存储设备( )。 ,其中 表示设备类型,分别赋值并且标准化为0.1、0.2、0.3、0.4、0.5。

文件类型集 :文件类型的集合,由于本文所研究对象为文本文件,所以文件类型包括.doc文件( ),.pdf文件( ),.txt文件( ),其他文本文件( )。 ,其中 表示文件类型,分别赋值并且标准化为0.1、0.2、0.3、0.4。

文件状态集 :文件在系统中存在的状态及来源组成的集合,文件状态包括一般文件( )、隐藏文件( )、加密文件( )、恢复文件( )。 ,其中 表示文件状态,分别赋值并且标准化为0.2、0.4、0.6、0.8。

最后修改时间集 :文件的最后修改时间与基准时间距离的集合, ,其中 为文件最后修改时间与基准时间的距离( )。根据案件基本发生时间推测出基准时间段,如果文件最后修改时间在基准时间段内,则设为0, 不在基准时间段内且 ,则设为0.3, ,则设为0.4。

特征值权重 :对于不同文件特征在相关度计算中所占权重不同,根据实验结果,设置上述特征集的权重分别为 , , , 。

定义 为要比较的文件对象,每个文件有上述4个特征,即

5结语

根据本文第四部分介绍的内容,利用皮尔森相关系数计算文件特征值之间的相似度得到文档的特征相似度系数。通过对特征相似度系数的比较,可以将特征差异较为明显的文档孤立出来,进而形成异常集,通过分析异常集中文件的特征属性的影响程度和出现频度确定name和prior属性,构建出特征集模型。

本文在传统静态和动态取证模型的基础上提出了基于特征集构建的取证模型,模型增加了特征集模块,这个模块的构建使得证据获取和分析过程形成一个闭环,建立起了自学习的系统,对静态取证中电子证据的完整性和真实性起到了一定的保障作用。

参考文献

[1]苟木理.面向Windows 8物理内存镜像文件的内存取证技术研究[D].重庆大学,2013.

[2]王连海.基于物理内存分析的在线取证模型与方法的研究[D].山东大学,2014.

[3] Shao J D, Rong G, Hai-Jie G U. Fast mining of distance-based outliers in metric space[J].Journal of Zhejiang University,2009,43(2).

地理数据的基本特征范文4

关键词:森林资源;遥感;分类;特征变量

1 引言

目前,各国研究机构广泛发展了基于遥感与抽样技术相结合的森林资源面积监测体系。抽样方法可大范围、快速监测森林资源动态变化,但无法在实际监管中存在有效利用,也就是存在监管不到位的现象。因此,结合实际,深入研究森林资源遥感分类区划方法中的一些关键技术,对促进森林资源调查遥感监测技术的发展具有重要意义。

2 森林资源分类中遥感数据的波谱特征

2.1 光谱特征 多光谱遥感影像能够对不同的森林进行区分,也是森林资源遥感分类应用最广泛和最基本的识别特征。目前基于多光谱特征的森林资源定量分析则是通过计算各个类别的均值、方差、标准偏差和离散度等统计量,作为比较不同类别相似度的量化依据,并在这些统计量的基础上建立判别函数实现森林资源遥感分类。但由于遥感数据空间分辨率、光谱特征值、光谱波段设置等限制,以及遥感影像像元都是地物光谱综合信息的特点,致使单纯依靠多光谱特征的森林资源遥感分类存在诸多分类混淆,“同物异谱、异物同谱”现象广泛存在。

2.2 高光谱数据特征 高光谱数据的光谱分辨率很高,能精确识别不同的树种。但高光谱数据各波段之间存在着高度的相关性,对分类精度有很大的影响。因此,高光谱数据的降维处理是目前高光谱数据处理的必经过程。目前,降维方法可分为两大类:①基于变换的方法,如主成分变换、正交子空间投影、正则分析、离散小波变换等。基于变换的降维方法优点是可以经若干变换直接将高维数据降低到几维甚至一维,信息量高度集中,降维速度快;其缺点是改变数据原始特性;②基于非变换的,主要是波段选择。基于非变换的降维方法保持数据原有特性,但波段选择算法目前均不成熟,难度大。

3 森林资源分类中遥感数据的纹理特征

纹理特征作为遥感影像数据重要的空间特征之一,是对影像像元之间空间分布的一种描述,其空间分辨率决定了纹理结构信息的丰富度。高分辨率遥感影像可大幅度减少了混合像元的比例,能非常直观的展示地面目标地物的空间位置、结构、形状、色彩等信息,有利于辨识目标地物。但高分辨率影像数据量巨大,所含信息量十分丰富,在抑制异物同谱现象的同时增加了同物异谱现象,此外还存在着阴影问题等,这些均有可能引起分类精度的降低。为充分利用高分辨率影像,基于纹理、面向对象或光谱与空间信息结合等分类方法可有效提高分类精度得到迅速发展和应用。然而在图像分类中,特征并不是越丰富越好,对分类结果不利的特征可对分类结果起到干扰作用,导致识别或分类精度的降低。因此,选择合适的纹理特征,制定一个特征选择准则,配合一个好的搜索算法就显得十分必要。

4 森林资源分类中遥感数据的时间特征

单一时相的遥感数据只能反映拍摄时间森林资源的波谱特征,但不同时期植物的生长发育规律可在遥感影像表现出不同的波谱信息。因此,可利用植物的时间效应特征来提高森林资源遥感分类识别能力。

5 研究展望

5.1 森林资源遥感分类特征变量选择存在的问题

5.1.1 森林资源遥感分类特征变量的选择的理论研究还不完善 在现有特征变量选择过程中高度依赖遥感数据的光谱特征,没有充分研究森林资源本身的特征在遥感数据上的机理体现,也就是没有从遥感机理上去分析、构建和选择特征变量。

5.1.2 森林资源遥感分类特征变量的综合应用问题 目前森林资源遥感分类特征变量较多的使用单一类型的特征变量,在利用单一类型的分类特征变量只能体现森林资源的一个方面,不论应用何种算法,对提高遥感分类精度的力度有限。因此,多类型分类特征变量综合应用是提高分类精度的有效途径。5.2 森林资源遥感分类特征变量选择发展方向

5.2.1 新的特征变量的不断挖掘 影响不同植物差异,可从植物本身的主要物理性状,这些因素主要受植物本身基因控制,这些特征变量参数可通过过SAR数据来解决。一些植物生化组分含量特征方面,可利用高光谱数据反演植物内部生化组成含量,探索基于生化组分含量与光谱的相互作用显著的敏感波段,并利用这些波段的影像对森林资源进行分类,使遥感分类更具机理性。

5.2.2 特征变量的综合应用 由于不同区域范围内具有特定的植物种群结构,不同时相植物存在着不同的生长规律,可根据植物生长状态,及其生长周期内生理、外形、结构等变化或季节变化特点,研究出某类植物最佳辨别时相,以及组合分类的特征变量组合。基于不同传感器数据提取不同森林资源遥感分类信息,联合使用多种分类特征的互补信息可有效提高遥感分类精度。开展森林资源遥感分类特征变量和敏感性与不确定性分析,在分类特征变量深入挖掘的基础上,结合主要分类器,建立不同分类特征的精度敏感性分析,进一步建立评估模型,为模型通用性检验及区域推广提供技术基础。

因此,不同区域的森林资源分类可按区域特性,建立区域特征数据库,综合应用适合该区域遥感分类特征变量,提高分类精度,使其更好的服务于森林资源调查分类及遥感监测需求。

地理数据的基本特征范文5

[关键词]特征价格模型;城市综合体;价格弹性

[DOI]10.13939/ki.zgsc.2015.13.014

本文根据前人对特征价格模型的研究成果,选取北辰财富中心&欣都龙城、昆明同德广场、西山万达为代表,通过搜房网、百度地图、昆明市房地产中介公司获得相关数据并整理量化,从空间层面研究城市综合体对周边商品住宅价格的影响,旨在为政府制定相关政策、为开发商制定开发战略以及为消费者购房提供更为准确的参照。

1模型的理论基础

特征价格模型,是一种国外处理异质产品差异特征与产品价格间关系经常采用的模型。自从Ridker在1967年把特征价格理论应用到住宅市场分析,经过40年的实践和不断完善,特征价格模型已经发展为房地产领域广泛应用的模型之一。特征价格理论认为,房地产产品是作为内在特征的集合来出售的,通过产品特征的组合从而影响消费者的选择,房地产的价格也将因内在特征及其数量的不同而不同。因此,研究房地产特征与其价格之间的关系,用数学函数进行模拟,估计特征的隐含价格,从而分析房地产特征对房地产价格影响程度,正是构建特征价格模型的主要目的。特征价格模型常用的函数形式有线性形式、对数形式、对数线性形式和半对数形式,这四种称为基本函数形式。

1.1线性形式(linear)

P=α0+αiZi+ε

自变量和因变量均以线性形式进入模型,回归系数是一个常数,对应着特征的隐含价格。

1.2对数形式(log-log)

lnP=α0+αilnZi+ε

自变量与因变量均以对数形式进入模型,回归系数是一个常数,对应着特征的价格弹性。

1.3对数线性形式(log-linear)

lnP=α0+αiZi+ε

因变量采用对数形式,而自变量用线性形式,回归系数对应着特征价格与产品总价格之比,即αi=PZi/P。

1.4半对数形式(semi-log)

P=α0+αilnZi+ε

因变量用线性形式,自变量用对数形式,回归系数对应着产品中某一特征价格的总价格,即αi=PZi/P。

2研究区域的选择与数据收集

本近几年昆明市城市综合体大力发展,因此如何选择城市综合体是本文的首要问题,笔者选取北辰财富中心&欣都龙城、昆明同德广场、西山万达为代表是因为这三个综合体从体量、建筑特点、功能等各方面比较符合现代城市综合体的定义。本文所采用的数据来源于昆明市搜房网和百度地图,数据包括住宅到城市综合体的距离、城市综合体体量、公交路线、所处环线位置、建筑年龄、朝向状态、楼层、总层数、建筑面积、装修程度、绿化率、容积率、物业管理费等。本文主要以多层和小高层为研究对象,不考虑别墅及排屋等建筑。样本数据收集自2014年12月1日至2015年1月1日,时间间隔在一个月内以便不受时间因素的影响,数据有效样本量为481个。

3实证研究

3.1模型的比较与选择

分别采用特征价格模型的四种形式建立模型发现对数模型拟合优度最高,具有最好的解释力(见表1)。

对数模型:lnP=α0+αilnZi+ε

基本模型的复相关系数R=0.965,判定系数平方为0.932,经调整为0.930。说明自变量和因变量之间的线性关系很强,模型所能解释因变量差异的百分比约为93.0%,具有良好的解释能力(见表2)。

3.2城市综合体特征变量的价格弹性与边际价格分析

在对数模型中,为标准化的回归系数对应住宅特征价格弹性系数或者半弹性系数,价格弹性系数对应的变量为连续变量,其数值等于相应回归系数,而对于不是连续变量的自变量,其价格半弹性系数需要进行转换。综合体体量的价格弹性为0.103,表示在其他变量不变化的情况下,住宅最近的城市综合体体量每增加1%,住宅总价增加0.103%;距离综合体的距离的价格弹性为-0.029,表示当保持其他特征变量不变时,住宅到周边最近城市综合体距离每增加1%,住宅价格下降0.029%。

根据数据样本的描述性统计,本文样本数据的总价的平均值为968999.3859元,笔者将其作为标准的价格。结合特征价格模型得到的价格弹性系数,对城市综合体相关特征变量为标准价格的边际贡献进行测算。基于标准住宅,到最近城市综合体距离每增加100米,住宅价格下降28100.98元,而最近城市综合体体量每增大10000平方米,住宅价格将增加9980.6937元。

4结论

第一,商品住宅的价格受多因素共同影响。根据本论文的特征价格模型分析得出的结果,物业费、房龄、建筑面积、住宅到城市综合体距离、最近城市综合体体量、装修情况、朝向、公交数量、容积率、绿化率,对城市综合体周边住宅价格产生一定影响。其中物业费、建筑面积、最近城市综合体体量、装修情况、朝向、公交数量和绿化率有正向影响,住宅到城市综合体距离、房龄对住宅价格有负向影响。

第二,城市综合体对住宅价格具有显著的影响。距离城市综合体越近的居民越能够便利地享受到城市综合体给居民带来的娱乐、购物、生活、办公等一站式需求。因此住宅到城市综合体距离对住宅价格有负向影响。对最近城市综合体的面积而言,能够从另一个角度反映该城市综合体业态丰富性,居民的购物、娱乐等需求的选择多样性等,因此对附近住宅价格有正向影响。

第三,政府在根据住宅片区的实际情况,进行旧城改造时设计合理的城市综合体项目,对开发体量进行管控;开发商在新建住宅小区时建议适当增加容积率和绿化率,选择靠近城市综合体近一些的地块进行开发。购房者可以根据自身需求和能力,选择合适的城市综合体附近的住宅进行投资或居住。

参考文献:

[1]张红.房地产经济学[M].北京:清华大学出版社,2005.

[2]温海珍,贾生华.住宅的特征与特征的价格[J].浙江大学学报,2004(10).

[3]路丰同.沈阳市商品住宅特征价格实证研究[D].长春:吉林大学博士学位论文,2007.

[4]郝前进,陈杰.商业便利性与住宅价格:基于上海的经验研究[J].中国房地产研究,2007(2).

[5]周丽萍,李慧民,杨嘉.基于GIS的房地产特征价格模型研究[J].西安建筑科技大学学报,2008,27(2).

地理数据的基本特征范文6

关键词:人体运动跟踪;三维重建;特征融合;情感识别

中图分类号:TP182文献标识码:A文章编号:1009-3044(2011)11-2649-03

The Research of Affective Recognition on the Human Motion Tracking

DING Yi1,2, FU Xian1

(1.The College of Computer Science and Technology, Hubei Normal University, Huangshi 435002 ,China; 2.College of computer science and technology, Huazhong University of Science and Technology, Wuhan 430074, China)

Abstract: Tracking of human motion is an important research area which combines computer vision and Man-Machine Interaction. The focus of the research is in detecting and tracking figures in videos, capturing and reconstructing the human motion, and then describing and interpreting the human behavior. In this paper, a recognition method for multiple classifiers is proposed, which combines human motion tracking and an Eigen face method with support vector machine(SVM). and fuse ISR results and FER results by marking punctuation and achieve the recognition results.

Key words: human motion tracking; three dimensional reconstruction; feature fusion; affective recognition

在交流中检测并理解他人的情感状态是人类智能的一种核心能力。这种能力在人的社会生活中是不可或缺的。但是在人与计算机的交流中,情感的作用在很长的一段时间都被忽视了。能够感觉到悲伤、高兴等情感并且根据这些情感调整自己行为的人机交互系统将会使计算机更加自然、高效和更加值得信赖。具有情感识别能力的人化人机交互将使计算机易于使用,并使使用者更愉快,因而可提高生产效率。目前已经有学者研究试图让计算机根据脸部表情和声音特征来理解人的情感,但是还很少有人研究根据人体运动特征识别情感。研究表明,人体运动特征中不仅包含丰富的情感,而且包含有一些面部表情和声音中所没有的情感信息。因此根据人体运动特征识别情感具有重要的意义和不可替代的地位。

1 国内外发展现状与趋势

通过情感识别来设计更加自然的、人化的人机交互系统是从Picard提出情感计算[1]的概念开始的。20多年来,研究者们从人的脸部表情和声音特征研究情感识别的方法,取得了大量的研究成果。最初的情感识别研究是从面部表情开始的,对面部表情的分析,已经形成了一个标准的面部表情编码系统(Facial Action Coding System)。面部表情编码系统将面部表情特征通过面部关键部位的60多种动作单元来描述。研究者们通过先提取出这些动作单元构成面部表情特征[2],再利用机器学习方法从这些特征中挖掘出情感模式来识别人的情感状态[3]。基于声音特征的情感识别也取得了大量研究成果[4],识别的步骤和基于面部表情的情感识别类似,也是利用机器学习方法从声音特征中学习出情感模式[5]。近年来一些研究者开始将面部表情特征和声音特征结合在一起设计出基于多模特征的情感识别方法[6]。近年来有的研究者尝试将一些简单的静态的身体姿态特征(如手放的位置)和面部表情结合起来识别情感,结果表明能够大大提高识别率。但是系统地利用完整的人体运动特征(即动态身体姿态的变化规律)来识别情感的相关研究,尚未见公开的文献报道。

综上所述,从目前来看,情感识别的研究主要集中在基于面部表情和声音特征的情感识别,而心理学研究表明人体运动特征中包含有丰富的情感信息,是情感识别的一条重要途径。人机交互中情感识别的发展趋势有机地融合人体运动特征、面部表情和声音特征来识别情感。

2 基于人体运动特征的情感识别研究内容

本研究实现一个情感识别原型系统。原型系统能够根据人体运动特征、面部表情和声音特征来识别人的情感状态。其中基于人体运动特征的情感识别是本研究的主要研究内容,相应的技术将采用本研究相应的研究成果;基于面部表情和声音特征的情感识别采用已有的技术来实现。原型系统的总体技术路线框架如图1所示。

从数据的处理流程来看,情感识别的过程分两步完成:特征提取和情感分类。特征提取从原始数据空间中提取出对情感识别有用的便于操作的特征数据,是一个将数据从原始数据空间映射到特征数据空间的过程;情感分类根据特征数据确定人的情感状态,是一个将数据从特征数据空间映射到情感描述空间的过程。

从所使用的特征数据来看,整个过程是基于人体运动特征情感识别、基于声音特征情感识别和基于面部表情情感识别的综合。三者的融合可以采用信号级融合、特征级融合或决策级融合。信号级融合将多个信号混合在一起,这要求所融合的信号是同步的,并且具有相同的性质。特征级融合将不同的信号处理模块输出的特征混合在一起,这种方法能够保证多媒体数据中足够多的信息被利用。

2.1 人体运动特征提取

人的肢体运动主要表现骨架关节的角度和位置变化,人体运动特征提取就是从视频中恢复出三维空间骨架关节角度即人的姿态的过程。以线图模型(Stick Figure)为基础建立模糊的人体运动模型,线图模型能够较好的描述人体各关节的结构约束,是一种合适的人体姿态描述方法,本研究在线图模型的基础上加入模糊的人体运动描述方式,同时加入二阶ARP运动学约束,构成模糊人体运动模型,根据前两帧的状态来预测当前帧的状态。整个特征提取的过程以模糊运动模型为基础,分为初始化、自底向上分析、自顶向下合成几个模块。

初始化模块从视频中获取人体的初始姿态来实现模糊运动模型的自动初始化。首先,采用基于HOG(方向梯度直方图)的人体检测方法定位人体的位置,然后,基于学习回归的三维姿态估计提取出人体轮廓的形状描述子,根据形状轮廓描述子通过一个经过学习的RVM(Relevance Vector Machine)回归得到三维姿态。

自底向上分析模块从视频中恢复出二维姿态。首先,全局运动跟踪从当前帧图像中定位人置,跟踪算法使用计算量比较小的卡尔曼滤波器,定位匹配使用的特征采用颜色特征和LBP(局部二进制模式)纹理特征。接下来,从跟踪得到的人体区域中检测定位头、手、脚等关键部位,关键部位的检测采用支持向量机。最后,由定位得到的各关键部位的位置进行分析整理得到人体二维姿态。

自顶向下合成模块主要通过模糊运动模型的人体结构约束和运动学约束预测人体的三维姿态。首先,通过模型的预测得到一个可能的三位姿态空间,接着,利用自底向上分析得到的二维人体姿态根据摄像机定标得到的映射矩阵映射到三维空间,由于从二维空间映射到三维空间是一个不适定问题,得到的解是多值的。最后,最优解搜索将映射得到的解空间与预测得到的解空间取交集,同时使用颜色等其他特征消除多义性,得到最优的三维姿态。多个三维姿态的序列就构成了人体运动特征。

2.2 面部表情特征、声音特征提取

面部表情特征提取从视频数据中提取出与情感相关的面部特征,本研究采取基于面部表情编码系统的方法。首先采用已有的人脸检测算法从视频中检测并定位人脸,分割的人脸图像经过Gabor滤波提取小波特征,同时从人脸中检测并定位眼睛、鼻子和口等关键部位,根据这些关键部位的位置确定需要提取特征的特征点的位置,根据特征点位置从小波图像中提取特征。

将视频中分离出的声音信号根据采样率进行分帧,采取现有的比较成熟的特征提取算法,逐帧提取能量(Energy)、基音频率(Pitch)、频率重心(Spectral Centroid)、美尔倒谱系数(MFCC)等类型特征,形成特征序列,以各个特征的均值与方差作为特征值。对提取出的特征值进行标准化,以使各特征都能够足够得对分类结果产生影响。归一化后的特征向量序列作为声音特征输入到HMM进行情感分类。

2.3 情感模式学习以及建模

情感识别采用隐式马尔科夫模型。一种情感状态对应一个隐式马尔科夫模型,对一个运动特征序列的情感识别的过程就是一个模型评价的过程,即通过计算特征序列对应各个模型的概率取概率最大的模型的过程。模型参数的学习采用一种状态动态裂变的方法,如图2所示。

在学习过程中,不但根据调整模型参数使其最大化适应本类型情感的样本,而且根据模型对本类型情感样本和其他类型情感的样本进行状态裂变来调整模型的拓扑结构,最终使各模型对情感的区别能力满足情感识别的需要。HMM设定一个初始拓扑结构,利用Baum-Welch算法从样本序列中学习得到初始的参数。将初始参数用来计算对本类型样本序列和其他类型样本序列的概率,选择一个合适的状态进行状态裂变,选择的原则是裂变后模型对本类型样本的概率变大,对其他类型样本的概率变小。裂变之后重新利用Baum-Welch进行学习,直到模型的区分能力达到一个满意的级别。

采用八种基本情感(愤怒、悲伤、害怕、高兴、喜爱、惊讶、厌恶、害羞)为基础,根据实验数据分析人体运动中那些情感表现比较明显,在八种基本情感之上进行添加和删除,最终得到一个适合于人体运动情感识别的基本情感集合。对不同的情感类型的样本使用HMM学习,分析学习得到的HMM参数,从中找出运动特征与情感之间的关系。通过对不同文化、性别和个体的样本学习,再对学习得到的HMM参数进一步进行挖掘,得到参数的模式后,通过参数的模式解读相应的运动特征模式。

2.4 决策级融合

决策级融合分别根据三种特征进行情感识别,然后根据识别得到的情感状态和概率确定最后的输出。根据三种特征对每种情感状态都可以由分类器得到一个后验概率,用pmn表示(其中m=1,2,3分别代表人体运动特征、声音特征和面部表情,n=1,2,3…N分别代表愤怒、悲伤、害怕等八种情感状态,例如p31表示根据面部表情判断情感状态为愤怒的概率)。决策准则从“最大值”、“平均值”、“乘积”和“加权”四种准则中选择。“最大值”准则从输出的概率中取最大概率对应的情感状态作为最终结果输出,用f表示最终输出情感状态,“最大值”准则用公式描述如下:

“平均值”准则分别对每种情感状态由三种特征得到的概率求平均值,取平均值最大的情感状态作为最终输出的情感状态。即:

“乘积”准则分别对每种情感状态由三种特征得到的概率求积,取积最大的情感状态作为最终输出的情感状态。即:

“加权”准则分别对每种情感状态由三种特征得到的概率求加权平均值,取加权平均值最大的情感状态作为最终输出的情感状态。用w1、w2和w3分别表示人体运动特征、声音特征和面部表情对应的权值,“加权”准则用公式描述如下:

由于融合准则的选择只能凭经验判断,本研究对所有的准则进行试验,根据试验结果分析得出合适的融合准则。

3 总结

本研究实现一个情感识别原型系统。原型系统能够根据人体运动特征、面部表情和声音特征来识别人的情感状态。其中基于人体运动特征的情感识别是本研究的主要研究内容,相应的技术将采用本研究相应的研究成果;基于面部表情和声音特征的情感识别采用已有的技术来实现。从而得到有效的基于人体运动特征的情感识别方法,最终将基于人体运动特征的情感识别方法和已有的基于脸部表情和声音特征的情感识别研究成果结合在一起,实现一个多模情感识别原型系统。

参考文献:

[1] Rosalind W. Picard, Affective Computing, The MIT Press, Cambridge, MA, USA, 1997.

[2] Chao-Fa Chuang, Frank Y. Shih, Recognizing facial action units using independent component analysis and support vector machine, Pattern recognition, 2006, 39(9):1795-1798.

[3] Jia-Jun Wong, Siu-Yeung Cho, Facial emotion recognition by adaptive processing of tree structures, The 21st Annual ACM Symposium on Applied Computing, Dijon, France, 2006.

[4] Dimitrios Ververidis, Constantine Kotropoulos, Emotional speech recognition: Resources, features, and methods, Speech Communication, 2006, 48(9):1162-1181.