数学建模的含义范例6篇

数学建模的含义

数学建模的含义范文1

论文关键词:设计;多元识读;信息量;模态

一、多元识读理论

科技的飞速发展促使我们转向多模态符号系统构建意义;同时文化多元化趋势增强以及各种语言变体增多。因此,传统的读写识读已不能适应信息时代的需求,一种新的多元识读的识读形式已经出现。“多元识读”最早由Norman Fairclough, James Gee以及 Gunther Kress等著名西方学者组成的“新伦敦小组”(The New London Group)首次提出(韦琴红,2009:129)。他们(1996)提出基于“design” 的多元识读,它包含语言、视觉、听觉、姿态、空间以及把这五者联系在一起的多模态等六个方面的“设计”,强调构建意义是一个主动的动态设计过程。它包含三个元素:可用的设计(available design)、设计(designing)和重新设计(the redesigned)。

可用的设计指在特定文化情境中可供意义构建的资源。如文字、图片、音乐和视频等符号资源,学生可以自主选择这些符号资源表达意义。设计是运用已有资源制造意义,这个过程不是复制或拷贝原有资源而是转化已有资源创造意义,即学生根据自己的兴趣和已有知识经验转化并生成意义。最后产生可供意义构建的新资源,即重新设计(Kalantzis和Cope,2008: 204)。本文试图以非英语专业学生设计的34份电子小报为语料,从信息量和模态运用两方面分析学生运用多种模态和多种信息渠道构建意义的能力,即多元识读能力。

二、从电子小报设计看大学生多元识读能力

(一)研究方法——电子小报设计

本文通过电子小报设计分析大学生多元识读能力。本研究选择电子小报设计的原因在于这个设计过程包含了将可用设计进行设计,最后达到再设计的动态过程。这个设计过程中,学生查找、浏览、筛选、下载以及创造性和批判性地运用已有资源,如文字、图片、视频等符号资源,并选取自己所需资源自主构建意义,最后获得具有意义潜势的新资源。

本次实验对象为已通过大学英语四级的34名学生,要求学生以社会问题(Social Problems)为题设计电子小报。设计主要包括三个方面,第一,目前社会中存在的社会问题以及这些社会问题带来的负面影响;第二,产生这些社会问题的原因;第三,如何解决这些社会问题。

(二)电子小报信息量和模态运用的分析

1、信息量

衡量电子小报的信息量主要有三个指标,即页数、话题选择和单词数量。经统计可知,16名学生的设计为1页,17名学生为2页,因此基本所有学生的设计都在2页之内,仅有1名学生设计7页。这些设计作品都包含所要求的信息,但是并没有很好地整合资源,使信息成为一个有机整体,只是零散地呈现信息。因此如何整合信息是学习者更为重要的能力。学习者必须筛选已获取的可用资源,并和自己已有知识交融,使之成为新的可用资源,而不是机械地复制和粘贴已有资源。

在电子小报的主题选择方面,有些学生讨论一个话题,有些学生讨论两个以上的话题。经过统计得知:讨论两个以上话题的学生有6名,其余学生都讨论一个话题。其中讨论最多的是环境问题(13人);人口问题次之(10人);5名学生以贫富差距为题,4名学生以就业问题为题,剩下的学生选择一些极少关注的话题,如药品滥用、腐败、食品安全和酒驾等。总的来说,学生们选取的话题还是趋于同一化,选择较常见的环境问题、人口问题或贫富问题等,还未能充分利用庞大的网络资源以及尽可能多的信息渠道有效地获取更多的可用资源,使得话题更加丰富和多样化。

此外,电子小报的单词数量也是衡量信息含量的一个重要方面。大多数学生(25人)电子小报的单词数量在300字以下;300—500字的有6人,500字以上的仅3人,因此只有极少数学生信息含量较丰富,使用大量单词表达意义。可见,学生们查找、筛选和整合信息的能力均较弱。笔者认为小报设计的质量不仅和信息含量和模态运用等相关,而如何整合信息是一个更为重要的方面。作为学习者必须将获取的资源进行系统整合使之成为一个有机整体,而不是机械地复制和粘贴已有资源。

2、模态运用

生命科学的研究表明,生物体在进化演变过程中有5种不同的感知渠道,从而产生5种交际模态,即视觉模态、听觉模态、触觉模态、嗅觉模态和味觉模态(朱永生,2007:83)。而和电子小报设计密切相关的主要是视觉模态和听觉模态。

34份设计作品中,所有学生都运用了视觉模态,只有少数学生(12人)运用听觉模态。他们基本都借助文字、图像和颜色模态构建意义,只有2人没有运用颜色。可见文字、图像和颜色已经被学生熟练而广泛地运用并构建意义,同时这三种模态也是他们构建意义的主要模态。而12名运用听觉模态的学生全部都运用了声音模态,仅有2人运用视频模态。可见,较少学生运用视觉模态构建意义,说明他们还是倾向于运用单一模态,而不是多模态构建意义。因此,大多数学生还是缺乏充分利用各种符号资源构建意义的能力,不能灵活运用所有可表达意义的符号系统构建意义。

数学建模的含义范文2

一、在生活原型中建构概念型数学模型

课件依次呈现:平衡(空天平)――不平衡(天平的左边放入两瓶200克的牛奶)――平衡(天平的右边放入400克砝码)。学生边观察天平,边说出变化过程。当天平保持平衡,教师提问:如果从左边拿走一瓶牛奶,天平还平衡吗?当不知道具体是多少时,可以用字母来表示。随后,课件呈现:天平左边放入3个苹果,右边放1500克砝码。学生交流,列出算式:3X=1500。结合这些算式,教师提问:这些式子可以分为几类?学生容易想到两类:一类是等式;一类是不等式。教师追问:它们之间又有什么不同之处呢?学生总结出不含未知数的等式表示的是已知量之间的相等关系,含有未知数的等式表示的是已知量和未知量之间的相等关系,进而得出“含有未知数的等式叫做方程”这一概念。

在小学数学教材中,方程是一种典型的数学模型。在这个案例中,从生活中的天平这一生活原型出发,引导学生逐步体会和理解等式和方程的含义。通过天平一边放入物品导致两边不平衡到天平两边都放物品达到两边平衡,学生理解了等式的含义。从放入已知物品的重量后平衡到放入未知物品的重量后平衡,学生体会了方程的含义。直观的天平原型为抽象的方程概念提供了鲜活的学习载体。对学生来说,方程概念变得形象、具体、直观。这种基于生活原型建构概念模型的方法,有助于学生对概念的本质建立正确而清晰的认识。

二、在符号表达中建构方法型数学模型

课始,课件呈现购物情境:一件短袖衫32元,一条裤子45元,一件夹克衫65克。买5件夹克衫和5条裤子,一共要付多少元?教师板书:(45+65)×5=45×5+65×5。教师提问:这两个算式之间为什么可以用等号连接起来?你还能说一组这样的算式?根据学生回答,教师设疑:这个规律一定对吗?在其他算式中还能成立吗?学生又通过举例来验证这个结论。在此基础上,教师又让学生思考:从算理上来说明理由。有学生结合例题来解释:把45个5加上65个5,合起来就是110个5,所以左右两边相等。教师肯定学生的想法后,提问:怎样才能把这些等式都概括起来?教师依次呈现学生的三幅作品:①(a+b)×c=a×c+b×c;②(+)×=×+×;③(爸+妈)×我=爸×我+妈×我。学生分别说出每道算式中表示的意思。教师引导学生给这些规律取个名字,学生说出乘法分配律。最后,教师小结:字母、图形、文字都是一种符号,用符号来表示这些等式的规律,既简洁,又易记。

乘法分配律是一种比较重要的运算定律。这种运算定律其实就是一种方法模型。“观其形,悟其神”。学生可以通过观察这类算式的特征,就能运用乘法分配律进行计算。但如何帮助学生建构这种方法模型,显得尤为重要。在这个案例中,从购物情境出发,引出两道不同的等式,进而大胆猜测规律,学生通过举例进行验证,在此基础上,引导学生从乘法意义的角度阐述等式左右两边相等的关系,进而让学生用自己的方式来抽象表示出乘法分配律这个数学模型。学生的智慧是无穷的。字母、图形、文字,虽然形式上不同,但实质上相同,都是乘法分配律的模型。

三、在多维变式中建构思想型数学模型

教师在引导学生掌握“鸡兔同笼”的题目特征、解题方法后,“龟鹤问题”、“人狗问题”、“鸡兔问题”都是同一个模型。接着,教师进一步拓展出人马问题、三轮车和小轿车的轮子问题等。随后,师生共同研究“一个信封里有10张纸币,有5元的和2元的,共38元。这个信封里5元和2元的纸币各有多少张?”教师引导学生与“鸡兔同笼”问题进行比较:2元的纸币相当于2只脚的鸡,5元的纸币相当于5只脚的怪兔。这几道题,其实都可以上升到一种模型。解决问题的时候,需要有“模型”意识,这样才能越来越接近问题的本质。

数学建模的含义范文3

[关键词]知识;知识挖掘;产业集群网络;创新模型

[中图分类号]F272.3 [文献标识码]A [文章编号]1006-5024(2013)10-0034-05

一、引言

1912年经济学家熊皮特在《经济发展理论》中首次提出创新理论的基本思想,即把生产要素和生产条件的新组合引入生产体系,以达到降低成本或提高产品质量,从而使实行创新的企业在竞争中占据优势,获得超额利润的一种经营管理活动。随着产业集群的出现和不断发展,Doloreuxa和Partob等学者提出产业集群为创新提供了新的模式,即在一定的地理区域内,各个行为主体在交互作用和协调过程中彼此建立的各种相对稳定的正式或非正式的网络构造体系。随着知识经济的到来,知识已然成为创新的动力源泉,产业集群有其特有的地理区域集中优势,知识资源有其固有的根植性和黏性,更有利于产业集群形成文化、技术、管理特色。但信息量的激增,使知识的获取不再简单。随着本体技术的出现和融入到数据挖掘系统中的理论和实践的不断拓展,知识模式获取的质量也越来越高。因此,本文拟提出通过本体和知识挖掘等智能信息处理技术来构建产业集群的网络创新模型,将产业集群网络中分散的信息资源进行语义分析与整合,并在语义的基础上实施知识挖掘过程,获取高质量的知识模式,实现在整个产业集群价值链上无歧义的高效分享,以提高创新效率。

二、理论基础

(一)知识与语义

关于知识人们都有不同的理解和定义,国内外众多学者结合自身情景从不同的角度对知识做出了定义,如Elias和Hassan认为知识是一种通过经验或学习而获得的理解力,是一种用来完成专门任务的技能,也是事实、过程规则或经验规则的积累。Polvani在1996年首次提出两种知识类型,即显性知识和隐性知识。日本学者Nonaka和Takeuchi认为隐性知识具有一个非常重要的认知层面,它是蕴含在人大脑中的模型和信念,很难被别人模仿。同时,他们认为显性知识是可以编码、存储和共享的知识。我国学者也主要多从知识与数据、信息的关联,和知识的类型等角度对知识的内涵做出了界定。

随着本体论和自然语言处理技术的发展和应用,“语义”一词被广泛提及。被赋予含义的数据就是信息,而这种含义就是语义,知识是用来描述信息的概念、概念之间的关系,以及概念在陈述具体事实时所必须遵守的条件,从这点上看,对于信息的语义以及信息语义之间的关联关系的描述本身就是一种知识表达,因此在许多研究中,往往将语义的描述等同于知识的描述。

(二)知识挖掘与本体

目前国内外学者对知识挖掘内涵的描述还不统一,基本上有两种分歧:一是沿用传统数据挖掘的基本理论和技术来研究知识挖掘,把数据挖掘引用到知识管理领域产生知识挖掘,转变后的知识挖掘比数据挖掘更加注重知识创新的能动性,成为知识发现和知识学习的核心内容,这部分学者认为知识挖掘处理的对象是数据或信息,产生的结果是知识。二是认为知识挖掘的对象不仅包含显性知识,而且包含隐性知识,其中对隐性知识的挖掘应该占据更重要的地位。我国学者冯新民和王建东提出了广义知识挖掘的概念体系架构,传统的数据挖掘、知识发现与知识创新等概念都是广义知识挖掘体系的一部分。

本体原是哲学领域的概念,后广泛引入到计算机工程、人工智能等领域,本体作为共享的概念模型的明确的、形式化的规范描述,在与知识挖掘的融合过程中,常作为数据预处理、提高挖掘技术和算法高效运作的基础,主要起到两方面的作用:一是对所挖掘的数据进行语义预处理和整合,使知识挖掘具备自主推理分析能力;二是针对具体挖掘任务,能够协助用户自动调用最合适的方法和算法,完成知识挖掘过程。

(三)产业集群网络创新

随着社会经济的不断发展,国内外众多学者在熊皮特创新理论的基础上,提出了新的理论,其中Tracey根据创新活动的范围和创新主体的不同,把创新分为渐进式创新、激进式创新、企业系统创新和区域网络创新。对产业集群网络创新的研究多数依赖于区域网络创新理论,因此多数学者将产业集群网络创新的结构划分为正式的经济网络和非正式的社会网络。其中正式的经济网络又可划分为核心网络层和辅助网络层,核心网络层是由集群内企业之间所建立的、围绕整个产业价值链生产运作的、正式的经济合作关系网络;辅助网络层是由大学、科研单位、政府和中介机构所组成的、支撑核心网络层有效实施和运作的重要辅助网络。非正式的社会网络又可划分为文化网络层和群外网络层,文化网络层是对产业集群运作范式产生潜移默化影响的当地区域的文化特征、生活习性等所构成的网络;群外网络层是指与产业集群网络有联系的圈外企业、科研单位、政府、文化地域等所构成的集群网络,即不同区域的集群网络之间是有关联的。

产业集群网络创新的能力取决于集群内部的结构特征,产业集群内各主体之间以及不同产业集群之间的关系强度和关系的质量构成了产业集群网络主要的结构特征,它们与产业集群网络的创新能力有着直接的正相关关系。知识是创新的源泉,产业集群网络中结构关系越强、质量越好的主体之间就越有益于知识的获取、流通、共享和转化。如何识别企业主体之间、企业与科研单位之间等关系的函数值,这对产业集群网络创新的整体优化、提高创新动力具有重要的意义。

三、基于知识挖掘的产业集群网络创新模型构建

(一)模型构建目标

模型构建目标有两个:一要满足企业对高质量知识渴求的目的,即在领域本体技术的支持下,从人类大脑、文字、交易数据等中挖掘潜在的、未知的高质量知识模式,并基于本体的形式化方式进行知识表示,更加有利于知识在整个产业集群价值链网络中流通、共享和创新,提高了产业集群网络创新的能力。二是在领域本体技术的支持下,利用知识挖掘技术从各主体之间业务流程中发现潜在的知识模式,勾勒出产业集群网络中各主体所包含的概念之间关系的强度和质量,以便调整产业集群中各主体之间的函数关系,扬长避短或重新组合,以提高产业集群网络的创新能力。

(二)基于知识挖掘的产业集群网络创新模型

该模型包含一个智能化的产业集群网络创新的循环机制,其中产业集群网络提供知识挖掘所需的数据,企业本体的引入使知识挖掘的数据基础提升到语义层次,根据知识挖掘任务的需求,每个被选择的数据都带有语义标签,使知识获取的过程更加自主化和智能化,分析挖掘出的知识模式用于产业集群网络的创新,即满足产业集群中各主体对知识模式高效运用的需求和产业集群网络结构的调整和优化。该模型包括5个模块,即数据收集模块、数据预处理和语义集成模块、知识挖掘模块、基于本体形式化方式的知识表示模块以及产业集群网络创新模块。各模块所包含的主要内容如下:

1 数据收集模块。数据来源于产业集群网络各企业业务流程中,形式是多样化的,如可呈现出静态和动态、多结构化、显性和隐性等特性。

(1)静态和动态数据收集。静态数据是反映历史情况的,即用数字资料、文字描述来反映已经发生的各种经济活动状况。产业集群中的静态数据多发生在各种数据库记录中,如客户数据库、交易数据库、促销活动数据库、询价记录等。其中客户数据库记录企业现有和历史客户的相关信息;交易数据库包含企业之间、企业与客户进行交易活动的记录;促销活动数据库包含了企业促销活动的细节;询价记录包含了客户、供应商等主体之间的价格谈判活动。

动态数据是反映当前时间活动状况以及将来发展变化趋势的数据,是对正在发生的和未来状况的描述。动态数据的历史积累就成为静态数据的来源,一般来讲,动态数据可采用直接记录、追踪和摄像等方式收集,如企业访谈、会议记录等都属于企业动态数据。

(2)显性和隐性数据收集。显性数据是可以编码、存储和共享的知识,而隐性数据是隐含在人脑中的模型和信念,其中显性数据的收集常用的有两种方式:通过上网等方式搜索已经成为参考资料的数据,如企业年鉴等资料;或是通过市场调查问卷等方式收集数据。

隐性数据多隐含在行为方式中,常用的方式也有两种:通过企业博客、BBS论坛等舆论传播平台收集客户、企业等相关主体的评论意见等;或是通过Cookies或Spider等程序软件抓取客户、企业等相关主体访问网站的行为轨迹。

(3)多结构化数据收集。结构化数据是先有结构后有数据,一般能用统一的结构(如二维表结构)进行表达,如企业各类数据库数据;非结构化数据相对于结构化数据而言,是不方便使用结构化方式表示的数据,如办公文档、企业业务文本、图片等数据;半结构化数据一般是自描述的,数据的结构和内容混合在一起,没有明显区分,如企业网站Web页、客户浏览Web日志等数据。

2 数据预处理和语义整合模块。以互联网为依托的知识经济时代,结构化关系型数据库数据和半结构化Web文本数据是企业电子商务活动中最为重要的两种数据。针对不同结构类型数据的预处理和语义整合的方法与流程也是不同的,详细介绍如下:

(1)结构化关系型数据库数据的预处理和语义整合。在企业本体概念体系的辅助下,采用数据仓库技术对数据库数据进行预处理和语义整合,即建立基于语义的元数据,并在该元数据的指导下实施基于语义的ETL过程。其处理流程如图2所示:

对于企业,关系型数据库承担了绝大多数企业数据的存储任务,实体关系(E-R)模式是关系型数据库语义知识的形式化基础,也是产生元数据的重要来源,而实体关系模式本身又与知识本体存在着某种映射关系,找准这种映射关系便可准确构建出基于本体的元数据内容,从而可指导基于语义层次的ETL过程。我们可以通过分析关系数据库中的表定义和表数据两部分内容,来识别出ER模式中重要的语义信息,并与知识本体中各元素相互映射,即通过关系型数据库的语义反求过程来构建基于语义的数据仓库元数据,实现关系型数据库数据的语义整合的过程。

(2)Web文本数据预处理和语义整合。在企业本体概念体系的辅助下,采用文本数据预处理的方式,并结合聚类和关联规则挖掘方法,从中获取概念、概念之间的关系,完成对Web文本数据的语义标注和整合的过程。其处理流程如图3所示:

Web文本数据集的预处理过程包括分词处理、文本特征标引和词频降维三个步骤。分词处理主要采用词频统计的方法,即通过计算字与字相邻共现的频率来反映字符串确实是一个词的可信程度,只要选用的数学模型适当,就会有较高的切分精度和查全率,其中应用较广的数学模型有N元文法模型、隐Markov模型和最大熵模型等;文本特征标引主要采用矢量空间模型来表示文本中的内容,词代表文本特征信息,该词称为特征项,关于特征项权重的计算方法则采用TFIDF函数;词频降维是预处理步骤中最为关键的一步,主要利用潜在语义标引方法中的奇异值分解技术,目的是生成包含特征项间隐含概念关系的新矩阵。

Web文本数据集进行语义分析的过程包括文本中概念的挖掘和概念之间关系挖掘两部分。主要是在Web文本集预处理的基础上,实施平面划分聚类法进行特征项聚类,在企业本体的辅助下获取Web文本集中的概念集簇,完成Web文本集中的概念获取过程;实施关联规则挖掘方法,在Web文本集中发现具有强关联关系的特征项集,再运用概率统计方法在上述有关联的特征项集中发现具有等价和层次结构关系的概念间关系模式。

3,知识挖掘模块。该模块是整个产业集群网络创新模型中的核心部分。由产业集群网络的业务需求转化为知识挖掘任务,选择相匹配的挖掘方法和算法,在已经实施过预处理和语义整合后的数据基础上实施挖掘过程,即开展数据选择、数据转换、数据挖掘、知识评价和知识优化的流程。与一般的知识挖掘流程相比,该流程减少了数据清洗阶段,因为在数据预处理和语义整合阶段基本上消除了数据中存在的不完整、不一致、不精确和冗余等问题。其挖掘流程如下:

(1)挖掘任务的确定。知识挖掘任务贯穿了整个挖掘过程,无论是数据准备、挖掘工具和算法的选择还是知识模式的评价和优化都与其有直接关系。知识挖掘任务的确定要经历识别业务相关者的真实需求,即识别客户、企业员工、业务合作伙伴对挖掘项目的真实想法;分析知识挖掘环境,即对资金预算、技术人才、知识挖掘软件等做出统筹规划;确定企业业务,即进一步了解企业业务相关者的真实需求和影响挖掘项目进行的一系列环境因素;通过上述步骤,进而确定知识挖掘的任务。

(2)数据选择。由于该阶段的数据选择是建立在数据语义处理后基础上的,因此选择的过程中就不必再考虑数据的系统异构、结构异构和语义异构等问题。选择的标注应该参考如下因素:考虑与知识挖掘任务的相关程度;考虑数据是否完整;考虑数据的时间有效性等。

(3)数据转换。数据转换的目的是使数据更适合知识挖掘方法与算法等的要求,提高知识挖掘的质量。在数据转换过程中应该考虑以下因素:将数据转换成合适的粒度;适时添加衍生变量;着重处理孤立点和重编码。

(4)数据挖掘。该阶段的主要目标是依据知识挖掘任务的需求及所生成的知识挖掘模式的功能,如解释、分类和预测等来选择合适的知识挖掘方法和算法。知识挖掘过程中会涉及到多结构类型的数据,因此该阶段也会根据数据结构的不同来调用最适合的知识挖掘方法和算法,以提高知识挖掘的质量。另外,数据经过预处理和语义整合阶段后,已经对数据的内涵做出了明确的、规范化的定义,因此更有利于知识挖掘方法、算法及工具等实施智能化的处理过程。

(5)知识模式评价。从数据集中挖掘生成的知识模式并不是单一的,我们需要结合知识挖掘的任务来选择出最优良的知识模式,因此需要对产生的多个知识模式进行评价。评价的指标需要考察知识模式的准确性、可理解性、从知识模式中获取结果的效率和模式的构造效率;评价的方法有很多,如可利用错判矩阵、累计增益图等方法来判断知识模式的优劣。

(6)知识模式优化知识模式的调整和优化主要涉及到对知识模式集的调整和对知识挖掘算法相关参数的调整,对多个知识模式的组合应属于知识模式优化策略的一个方面。对知识模式集的调整包括对知识模式集规模、密度、时间特性的调整;对知识挖掘算法相关参数的调整主要是对算法的灵活性进行调整,如增加或减少训练集的数目、增加或减少阈值、增加或减少回归曲线的弯度等;多个知识模式的优化组合方法包括表决组合、分段输入组合、模式分段组合、数据强化组合等。这些知识模式优化的方法都能使所选择的知识模式更好地展现其应用价值。

4 基于本体形式化方式的知识表示模块。Maedche给出本体一个五元组形式化表示的方式,即O={C,R,Hc,Rel,A},其中c代表概念集,R代表概念间关系集,Hc代表概念间的层次结构,Rel代表概念间的非分类关系,A代表公理。由此可见,基于本体形式化的表示方式可将知识模式描述成为一个语义网络结构,即由节点和有向弧构成,节点代表了概念集,而节点之间的有向弧代表概念之间的关系,它们又由公理进行约束规范。

基于本体形式化方式来表示知识模式,可在语义表现、挖掘隐含的语义信息方面有很大的改善,使得知识模式表示事物之间语义关系更加丰富化、统一化和标准化,提高了产业集群内不同企业信息系统之间的可操作性,促进更好的知识共享和知识创新。

5 产业集群网络创新模块。该模块的主要作用是利用所生成的知识模式,提高企业管理决策能力,并优化产业集群网络中各主体之间的函数关系,提升产业集群网络创新能力。特别是基于本体形式化方式的知识表示方式,能够更好地协助产业集群网络识别相互联系的主体之间的概念和概念之间关系的强度等,能够更好地优化配置产业集群的网络资源,使产业集群网络创新能力达到最优。

数学建模的含义范文4

不确定性是信息的属性,而决策是建立在信息的基础上的。与决策相关的信息多半是不确定或不精确的。为了处理现代的基于计算机的技术管理和知识,智能系统是必须的。

本书共有36章,分成五个部分。第一部分不确定性建模,含第1~7章。1,概率博变理论框架;2,聚合似然比较方法;3,有限相加的短问题;4,关于条件可分解信息测量的通用理论;5,作为模型选择的话语解释――种概率方法;6,关于构造可信度函数专家意见的启示;7,管理分解可信度函数。第二部分群集、分类与汇总,含第8~14章。8,广义朴素贝叶斯建模;9,建立在典型性程度基础上的似Gustafson-Kessel群集算法;10,文本群集层次免疫方法;1 1,基于范畴的新闻过滤增量分级模糊群集;12,层次分类间的软映射;13,有关利用模糊逻辑和语言量词的时间序列语言汇总;14,标号语义学的可能领域解释。第三部分决策制定与信息处理,含第15―20章。15,多准则决策中双容量的重要索引定义;16,基于模糊约束的解析分级处理解决途径;17,在群体决策环境中,利用不同的传递性处理不完整的模糊优先权关系;18,谈判代言人模型的对立者与基于熵的推理;19,相加时正确与近似答案选择问大脑活动时空差异的比较;20,柔性查询的过多答案――基于邻近的强化方法。第四部分系统建模及应用,含第21―28章。21,字或数字、Mamdani或Sugeno模糊系统的比较研究;22,利用时间模糊模型比较动态系统建模的新方法;23,一介Takagi-Suge-no模糊系统近似性质的改进;24,知识与时间:一个PHM软计算应用框架;25,直接电子商业服务的多粒度模型;26,在计算机处理层析成像图像中使用模糊空间关系"Between"分段心脏图像;27,动态系统故障检测中神经模糊网络与联机学习;28,诊断系统的新混合融合方法。第五部分逻辑与数学结构,含第29―36章。29,模糊描述逻辑程序;30,双品格中通过扩展逻辑程序的不完整信息表示;31,有关n-收缩模糊逻辑的初步结果;32,弱次序的几何表示;33,基于相似性模糊定序的词典式合成;34,优势归一化核心主分量的有效更新与跟踪;35,模糊区域拓朴关系――相关矩阵的扩展应用;36,量词消去与广义间隔评估――特殊定量约束类的比较。

本书可供从事智能系统研发的研究人员及工程师阅读借鉴。

数学建模的含义范文5

[关键词]数字图书馆 语义模型 信息抽取 本体

[分类号]G250.76

1 引言

语义是指“数据(符号)”所指代的概念的含义以及这些含义之间的关系,是对数据的抽象或者更高层次的逻辑表示。语义通过两种途径产生:①人类赋予;②通过计算模型产生。通过第二种方式产生的语义可以被计算机理解和处理,可以被获取、传递、共享。根据实体资源(如文本和图像)来产生语义或挖掘出信息所蕴含的隐性语义是一个挑战性的任务。基于统计的聚类分析、共词分析、信息抽取和挖掘技术可以帮助实现语义的自动抽取。实现的关键在于建立一个语义模型,该模型既适用于显式语义,又适用于通过显式语义挖掘推导出隐含语义。语义模型是通过模型作为媒介来实现数据语义关系形式化描述的一种方式。基于本体的语义模型是通过以本体为核心的模型作为媒介,实现数字资源语义关系形式化描述的一种方式。本文基于本体构建了语义模型,并基于该语义模型探讨数字图书馆知识组织过程中信息抽取策略。

2 信息抽取与本体

信息抽取是从分布的、异构的文本中提取出特定的事实信息,将其中隐含的语义提取出来并以更为结构化、更为清晰的形式表示,为用户使用提供便利。信息抽取与语义标注总是融合在一起、互相支持的;信息抽取需要在语义标注的基础上进行,语义标注的内容是经过信息抽取提取出来的。因此,目前对于信息抽取研究离不开对抽取对象的语义分析和描述。语义分析与描述技术的研究热点是本体技术。

本体是对面向计算机语言的、已被组织的知识的描述,而信息抽取是面向自然语言,分析文档表达的事实和从这些文档中提取相关信息片段。信息抽取和本体是相辅相成的:作为抽取相关信息的理解程序,本体被用于信息抽取,是信息抽取的语义知识依据;信息抽取可以丰富本体,因为信息抽取出来的文档可以作为设计和丰富本体的知识资源。

这两方面的任务被结合在循环中(见图1)。本体可以有效地、准确地、解释信息抽取出来的数据,而信息抽取从文档提取出来的新知识可以整合进入本体从而丰富本体。

2.1本体对信息抽取的支持

在抽取过程中,本体知识对文档的语义解释具有重要作用。

本体对领域概念以及概念的多种形式进行了规范性说明,因此在信息抽取中可以用来进行字符串的语义分析,进而进行概念识别;在信息抽取过程中,需要领域本体对文档中实体名称进行识别与分类。本体中的类可以对信息抽取文档进行概念识别、语义标注和概念规范。

本体的概念层次结构。传统信息抽取的重点是使用同义词集而不是层次关系。例如,在wordNet中,同义词集可以用于语义标注和消歧,但上下类关系还需要本体参与。本体中包含的语义类型或语义的层次关系,有助于通过抽取内容进行推理和忠实释义。

更先进的信息抽取系统也需要利用领域本体的概念节点、概念节点的属性和相互关系予以描述。本体中的概念与属性值能够清楚地描述信息抽取对象的本质。对于文档中抽取对象的分析既能提高自然语言处理,又能指导概念框架的实体构成,而相应的规则即是基于短语模型,更多是基于语义分析的。

领域概念模型。领域概念模型本身用于推理,它能合并不同表现形式的同一概念,并且能够揭示出隐含的语义。

2.2信息抽取对本体的丰富

本体构建一直是公认的语义进程中的瓶颈,而信息抽取有助于本体构建。已经提出各种方法用于语料库的建设以利于本体构建,如基于规则的信息抽取即是对本体构建方法的补充。基于推理规则抽取出基本数据,通过已有本体对该数据进行概念及概念关系分析,在此基础上将数据中新的概念或概念间的新关系整合到本体。

实体命名抽取:实体命名通过在本体中以实例的形式表示。从这个角度看,需要自动地不断地为本体增添一些热门领域的实体名称。而信息抽取被广泛应用于识别和分类文档、网页、数据库等中的实体。

关系抽取:在结构化本体中,概念与概念之间存在着语义关联。目前从文档中获取本体关系的方法主要有三种:基于共词分析方法、基于知识库方法和基于信息抽取模式方法。信息提取模式方法提升了前两种方式:第一种方法需要对基本关系类型进行解释,而信息抽取中的规则就是特色化关系;第二种方法原有的知识可以帮助设计一个提取规则。

信息抽取通过本体进行基于领域的语义分析,提升信息的语义性,为智能检索打下基础;本体通过信息抽取不断学习,不断演化,解决本体构建的瓶颈问题。鉴于此,本文基于本体构建数字图书馆知识组织语义互联的语义模型,利用语义模型探讨语义互联实现过程中各个重要环节的策略,进而最终完成数字图书馆知识组织的语义互联。

3 数字图书馆互联的语义模型

语义模型是对内容语义、语义类型及语义关系进行描述和组织的机制,它试图在用户的信息需求和信息资源之间搭建一座桥梁,将两者灵活而有机地结合起来,从语义的角度来解析信息资源,进而从互理解的角度来提升用户检索的准确度和召回率,更好地满足用户的信息需求。语义模型是影响数字图书馆知识组织语义互联的核心要素。本文构建了以元数据、领域本体、桥本体和本体解析体系为组成要素的语义模型,利用语义模型实现数字图书馆知识组织过程中的数字资源、用户需求表达的语义解析,完成数字图书馆用户交互层、内容管理与功能层、内容层之间的语义映射。其中,元数据进行资源的标准化描述,领域本体进行概念以及概念之间关系的语义标注,桥本体用于资源之间语义聚合,本体解析主要解决本体的具体效用发挥的方式,如图2所示:

3.1元数据

元数据是数字图书馆用来解决语义互联的重要基础工具。数字图书馆由资源构成,而资源是可以被标识的。元数据提供了对资源各种属性的描述。元数据通过定义数字图书馆中资源的信息结构以及定义由数字对象构成的资源库的组织结构,决定着数字图书馆知识组织和知识服务方式。元数据发展比较成熟,已经形成完整规范的元数据体系,包括元数据格式、元数据标准、元数据方案、元数据应用纲要、元数据注册系统等等,这些为数字图书馆知识组织语义互联打下了基础。

3.2领域本体

领域本体是知识组织体系中重要组成部分,其目标是捕获相关领域的知识。领域本体是对领域内共享概念模型的明确的形式化的规范说明;概念以及概念之间的关系是经过精确定义的,提供了对领域知识的共同理解与描述,能够为计算机所使用并可用数学方

式表达。在领域本体技术驱动下,信息资源以全新方式进行组织,组织原理发生如下改变:①从用户可理解到机器可理解;②从信息描述到知识表现;③从语义隐含到语义揭示;④从“以概念为中心”到“以概念一关系为中心”;⑤从信息表示到智能推理。这些变化要求知识组织理论、形式、方法、技术、体系以及知识组织过程都要随之改变,实现对资源从语法层面向语义层面深入,最后直至语用层面的组织,在获取、表示、加工、存储、重组、提供、共享、利用、控制等知识组织过程中,充分体现语义性,在数字图书馆系统的各层之间,在用户、资源、服务之间,形成语义互理解和互操作。

3.3桥本体

桥本体是一种特殊的本体,完成不同领域本体概念之间关系的映射,进而实现本体整合,形成领域内的共享本体。桥本体记作Obridg。,可以用一个六元组表示:

Obridge={cb,Acb,Rb,Arb,hb,xb}(1)

其中,cb表示桥本体概念的集合,Acb表示桥本体概念所对应的属性集的集合,Rb表示桥本体之间关系的集合;Arb是桥本体之间关系所对应的属性集的集合,Hb代表了概念的层次结构,xb是一系列公理集合。

在概念上,桥本体具有四层树形结构(见图3):第一层是最普遍的概念,标记为T;第二层具有概念桥和关系桥两个概念,它们分别表示了两种不同的桥关系;第三层由10种不同类型的子类桥组成;第四层是一系列动态创建概念的集合,它们的属性描述了不同本体之间关系的信息。其中上面三层是固定的,称之为静态层,第四层的概念是根据已知的多本体动态产生的,为动态层。

3.4本体解析体系

数据存储模式的选择直接影响使用的效率。本体是系统多层之间语义联系的纽带,因此本体、桥本体的存储方式影响数字图书馆知识组织和知识服务的质量。本文选用的本体描述语言为W3C推荐的OWL,将其存储到关系数据库。关系数据库存储本体既有缺点,对本体含有的丰富语义缺乏精准的表现,又有无可比拟的优点。已有文献对本体到关系数据库模式映射进行了详尽的阐述,在此仅谈及桥本体的解析。

根据桥本体的概念结构和关系数据库的形式化定义,下面给出它到关系数据库模式的映射规则。

以桥本体建立数据库,取名为database-brid―geO。

桥本体中的十个桥关系分别为桥本体的子类,分别以这十个桥关系建立十张表,表名为table―Bcequal、table_BCdifferent、table_BCisa、table_Bcinstan―ceof、table BCoverlap、table BChasa、table_Beopposed、ta-ble_BCconnect、table_BRsubsume和table_Brinverse。

将桥本体的属性映射为各个表的属性,属性类型为字符型;各表属性个数并不相同,主要包括三类:一类表示具有该种桥关系的两个领域本体的名称;一类表示具有该种桥关系的领域本体的类名称;一类属性代表该类所对应表的地址。

属性值分别取值为领域本体名、领域本体中类名和类对应的表名。

不同领域本体概念之间的关系构成表中的记录。

表中的主键为复合主键,由不同领域本体名称和不同概念名称组合而成。

4 基于语义模型的信息抽取策略

抽取对象是异质的、异构的、多语种的、半结构化甚至是非结构化的,并且可能存在着语义模糊、语义缺失,因此对抽取对象实体命名识别、实体间关系的识别变得更加困难,需要多种技术协作完成。语义模型能有效协助信息抽取:利用元数据对数字信息资源和用户信息资源进行规范化描述,利用领域本体集和桥本体实现数字资源和用户信息资源语义关系形式化描述,而语义模型中本体解析体系为信息抽取为利用本体提供了途径。因此,利用语义模型可以有效地进行实体命名识别和信息抽取规则制定。基于规则进行信息抽取能有效过滤掉噪声,增加新的结构信息。大体过程如图4所示:

4.1数据采集和数据清洗

通过各种数据采集工具对数据库、文档和网页进行数据采集。数据库中的数据是结构化的,采集相对简易;而文档和网页结构各异,先将它们抓取入系统;数据清洗目的是对有信息价值的各种数据通过处理产生纯文档。首先对抓取的原始数据进行结构分析,去除噪声,分析数据是表结构、文档结构还是网页结构,网页结构是内容型网页还是表单型网页,并对各种结构进行识别剥离;然后进行内容分析,例如网页中的广告、图像、版权信息等等;最后对用户关心的信息内容进行提取,产生待处理的纯文档,如图5所示:

4.2文档预处理

文档预处理的任务是自然语言处理,将文档处理切分为待处理的词汇和信息单元。首先将待处理的纯文档进行词语切分和词性标注,取出分词结果中的名词和动词;然后按标点符号进行短句分割,作为信息单元,并以此作为信息抽取的粒度;最后对短句进行语法词法分析,并实施初次筛选,保留其中至少包含两个名词和一个动词的信息单元。该过程需要相关领域知识的术语表、词汇表、主题词表等,对分词系统中的词表进行二次加工。语义模型中的领域本体可以提供规范化的概念及概念中所涉及术语的多种形式,可以对词表进行丰富和规范,如图6所示:

4.3规则生成

信息抽取规则的生成利用了本文构建的语义模型。语义模型中的领域本体描述了概念、属性、实例以及本体内部概念与概念之间的关系,桥本体描述跨本体的概念之间的多种关系。领域本体和桥本体用OWL描述,将OWL本体映射到关系数据库,形成语义模型数据库;数据库中含有若干个表,通过表、表的属性、表的主键与外键以及属性之间的约束对本体进行解析。信息规则在此基础上生成:首先从语义模型数据库抽取类、抽取属性、抽取实例、抽取关系,对于桥本体还需要抽取表名;然后通过其解析出的本体中描述的概念、关系、层次结构等来生成三元组,再将此三元组作为信息抽取的规则存入规则库。如图7所示:

4.4实体抽取

信息抽取主要是对信息单元进行解析后,对信息单元中的名词基于语义模型中的概念和实例进行实体命名识别,充分利用本体对概念规范描述的优势,提高实体命名识别的准确性;再对信息单元重新规范,形成具有主、谓、宾三元关系的分析树。将该分析树与抽取规则三元组进行匹配,如果匹配成功则将该三元关系存入数据库中,完成信息抽取;如果匹配不成功,对该三元关系的概念与语义模型进行语义相似度计算,根据计算结果,形成本体中的新概念或新关系,添加到语义模型中,完成本体学习,丰富领域本体,如图8所示:

基于语义模型的信息抽取有如下好处:①语义模型的引入既保证了结构的一致性,又保证了数据的一致性,使不同来源的数据都能以统一的标准进行描述和呈现,方便了信息的继承与交换,提高了信息抽取的准确率及召回率;②驱使整个信息抽取过程都直接来自于语义模型,这为利用各种各样的本体数据呈现了一条非常自然的路径;③基于语义模型的系统可以促进本体进化,丰富领域本体。

数学建模的含义范文6

1基于骨架模型的协同建模流程

基于骨架模型的协同建模流程如图1所示。进行协同建模时,总体应根据输入的三维模型建立系统骨架,然后向1级分系统下发,1级分系统接收骨架后根据情况进一步细分骨架向下级分系统下发,直到最末级分系统接收到骨架后开始网格的详细划分,末级分系统详细模型建立后上传上级分系统,由上级分系统进行装配和补充完善,然后再向更上一级分系统传递,最终模型由总体进行装配并最终完成。

2协同建模要求

2.1建模骨架要求

建模骨架包含2方面内容:一是基于Hypermesh的建模骨架模型;二是与之对应的说明文件。建模骨架模型包含的要素包括:坐标系、总装几何模型(含分系统,可部分简化)、接口网格定义等;说明文件包括网格数目要求、网格质量要求、单元类型要求等。总装几何模型为结构力学分析的对象,可根据仿真的需要对各系统几何装配分离面进行简化,也可导入完整真实几何装配,简化工作在网格产生时进行。接口网格定义主要用来定义各分系统之间的网格接口,确保网格模型方便装配并协调一致。根据模型的特点,接口网格定义分为连续体模型接口网格定义和离散体模型接口网格定义2类。连续体模型接口网格包含一维、二维、三维和混合维4种形式。一维模型的接口包括杆、梁、索等单元类型的连接,骨架模型建立时需定义分离节点,分离节点两侧的模型应基于事先定义的节点建立网格,装配时将网格节点进行融合(示例如图2所示)。二维模型的接口主要指板壳模型的连接,需定义分离线的节点要求,包含节点的位置和数目,分离线两侧的模型应基于事先定义的节点建立网格,装配时将网格节点进行融合(示例如图3所示)。三维模型的接口主要指实体模型的连接,需定义分离面的面网格,分离面两侧的模型应基于分离面的面网格建立,装配时将网格节点进行融合并删除面网格即可(示例如图4所示)。混合维数模型的接口分为2种情况,自由度匹配时,可参照同维数模型的连接,定义公共节点或单元;自由度不匹配时应采用耦合自由度、多点约束等方式进行连接,骨架模型中应对采用多点约束或耦合自由度的节点进行定义并分组,装配时同样进行自由度耦合。离散体模型的网格定义适用于螺接、铆接、点焊接等结构连接形式,不同系统结构之间连接多采用多点约束、耦合自由度、增加辅助单元(梁单元、弹簧元等)的多点约束或耦合自由度形式,处理方式如图5所示。离散体模型的接口网格定义时需定义中间节点和辅助单元。

2.2详细建模要求

2.2.1几何模型简化孔的处理:根据孔所在的区域有选择地对孔进行取消或保留处理。非关注部位的螺钉孔、铆钉孔、塞焊孔等一般可忽略。布线孔、工艺孔、减重孔、定位孔等需根据孔径大小确定,如孔径与整体模型相比很小且在非关注区,可取消,反之则应保留。加强筋的处理:关键区域的加强筋应全部保留;对非关注区域的较大尺寸加强筋,一般应保留,尺寸较小的加强筋,可视情简化;冲压件下陷结构应保留原结构形式,不应简化为平直结构。圆角/倒角的处理:对于传力路径上的关键过渡圆角/倒角应保留,其余位置的过渡外圆角/倒角一般可忽略。内圆角/倒角应视情况予以保留。凸台的处理:与模型主体相比厚度较小、面积较小且处于非关注区域的凸台,一般使其与周围的表面同高;其他应按实际结构建模。质量元的处理:计算模型规模过大时,可对不宜忽略的质量结构通过集中质量元模拟简化。简化后的质量元应与原质量结构具有相同的质量、重心和转动惯量,且对所关注的结构件仿真结果无影响或影响不大。

2.2.2网格划分

2.2.2.1单元类型选择单元类型包含实体单元、板壳单元、梁单元、杆单元、刚性单元、弹簧阻尼单元等多种类型。不同类型的单元具有不同的自由度、单元属性、数学描述和积分方式,输出的变量也有差异。网格划分时要根据零部件的物理特征和仿真要求选择相应类型的单元。1)实体单元用来模拟部件中的块状材料,因实体单元可通过其任何一个表面与其他单元相连,因此能够用来模拟具有任何形状、承受任意载荷的结构。2)壳单元用来模拟一个方向的尺寸(厚度)远小于其他方向并且沿厚度方向的应力可以忽略的结构。一般,厚度小于结构典型尺寸的1/10,可以用壳单元模拟,但是不要误解为在壳单元中要求厚度必须小于单元尺寸的1/10。3)梁单元用来模拟某一个方向的尺寸(长度)远大于另外两个方向并且承受弯矩载荷的结构。当梁的横截面尺寸小于典型结构轴向尺寸1/10时,应用梁理论计算的结果可以接受。4)杆单元只能承受拉伸或者压缩载荷,不能承受弯矩,适于模拟铰接框架结构、近似模拟线缆和弹簧(如桁架),还可用来模拟其他单元里的加强构件。5)刚性体通常用于模拟非常坚硬的部件和变形部件之间的约束。6)如果变形体之间的局部特性不重要,可以简化为弹簧阻尼单元。

2.2.2.2单元形状选择单元形状应综合考虑计算精度、计算规模等因素。一般选用原则如下:1)体单元优先选择六面体单元或相应的等参元;面单元优先选择四边形单元或相应的等参单元。2)对于形状不规则的区域,无法使用六面体单元或四边形单元时,可以使用少量的四面体单元和三角形单元,但注意尽量使四面体单元和三角形单元远离关注的区域。3)一般仿真建模时优先选用一阶单元,应力计算中对局部精度有特殊要求时推荐使用二阶单元。

2.2.2.3具体网格划分要求1)实体单元一般不少于3排。2)壳单元一般抽取薄壁件中面上划分网格,且网格一般不少于2排。3)焊接边、面、体处需划分2排以上单元,建议采用焊接元对焊接区域进行网格划分。4)根据结构形状和受力状况,合理设置网格密度。在梯度变化较大的部位(如应力集中区),为很好地反映局部响应的变化特点,应采用较密的网格。对于一般区域,为减少计算时间,可以采用较稀疏的网格。5)对于静态分析,由于位移计算对网格数量不敏感,如果只计算结构的位移分布,网格可以疏一些;如需求解应力分布状态,需增加网格的数量。6)对于动态分析,由于被激发的振型对网格规模比较敏感,使用的网格数量应该能够充分反映出这些振型;如果只需要计算少数低阶振型,网格可以少一些,如果需要计算高阶振型,应该增加网格的数量。

2.3模型总装要求

在Hypermesh软件环境下,依次将分系统模型导入,融合相同内容部分并补充连接关系,完成系统模型的总装。模型之间的连接参照接口网格定义方法。

3质量控制