分子遗传学中心法则范例6篇

分子遗传学中心法则

分子遗传学中心法则范文1

1.考纲要求及教学策略

在高三一轮复习中,学生对知识已有一定的认识,失去新鲜感,因而教师不能对知识进行简单的重现,而应引导学生立足教材,夯实基础知识和基本技能,提高理性思维能力。考纲中对“人类对遗传物质的探索过程”为Ⅱ类要求,“DNA是主要的遗传物质”一节中“遗传物质”是生物学概念,“DNA是遗传物质,遗传信息的传递是通过DNA复制实现的”是核心概念,核心概念的教学实际上是建立在一般概念、原理和规律之上的对生物学核心问题认识和理解的构建[1],前者是构建后者的重要基石。“遗传物质”是亲代与子代之间传递遗传信息的物质,如何理解“DNA是遗传物质,遗传信息的传递是通过DNA复制实现的”这一核心概念?布鲁纳认为“人是通过认知表征的过程来获得知识、实现学习的”。因此,教师不能不遵循认知结构学习的规律,更不能用教师思维替代学生思维的发生、发展、延伸。教师可以科学家的研究历程为背景资料,引导学生思考实验设计思路,分析实验现象,使学生从形象表征走向抽象表针,进而理解核心概念。本节复习思路:遗传现象探究遗传物质遗传物质必备条件经典实验分析正确理解“DNA是遗传物质,遗传信息的传递是通过DNA复制实现的”和“DNA是主要的遗传物质”。

2.复习过程

2.1导入

生命之所以能够一代一代地延续,主要是因为遗传物质绵延不断地向后代传递,从而使后代具有与前代相同的性状。遗传给后代的究竟是什么?通过对细胞结构、细胞分裂、受精作用的学习可知,遗传给后代的细胞是和卵细胞,遗传给后代的结构是染色体,染色体在生物的传宗接代过程中,保持一定的稳定性和连续性。染色体的主要成分是DNA和蛋白质,谁才是遗传给后代的物质呢?引导学生思考“作为遗传物质,必须具备哪些条件”,使学生对遗传物质有正确的认识。遗传物质需满足以下四个条件:(1)能够精确地自我复制,使前后代具有一定的连续性。(2)能够指导蛋白质的合成,从而控制生物的性状和新陈代谢的过程。(3)具有贮存大量遗传信息的潜在能力。(4)具有相对的稳定性,可产生可遗传的变异。

2.2设计实验探究“遗传物质究竟是什么”

田奇林老师在《做一位“发展学生高阶思维能力”的积极践行者》中指出[2]:前天――授人以鱼,“灌知识”“灌方法”,用自己的理解代替学生的理解;昨天――授人以渔,学会阅读学习,变革接受学习,;今天――授人以渔场,给学生提供信息场、创设问题场、留足探索场、提供创造场、建构情感场,让学生摸索着捕,如有不会,再有针对性地指导;明天――“做科学”,生物是一门实验学科。因此,在高中生物学教学中,教师应发展学生理性思维,动脑动手,加强学生实验设计能力尤其是实验设计思路的培养和训练。

根据导入中染色体的主要成分是DNA和蛋白质及遗传物质的满足条件可知,遗传物质是DNA或蛋白质,依据实验设计的单一变量原则和对照原则,实验应设法将DNA和蛋白质分开,可通过分离提纯法或同位素标记法实现,然后单独看其作用。若是探究未知病毒遗传物质是DNA还是RNA,可利用酶的专一性,通过酶解法,破坏一种物质,看另一种物质,也可以使用病毒重组法。

2.3教材中的三个经典实验如何体现单一变量原则和对照原则

从实验设计的两大原则角度,重新审视经典实验,加深对实验的理解。将教材中的基础和主干知识以问题的形式呈现给学生,既能夯实基础,又能提高实验设计和分析能力。

2.3.1肺炎双球菌体内转化实验

(1)R型活细菌 小鼠健康

(2)S型活细菌 小鼠死亡

(3)加热后杀死的S型细菌 小鼠健康

(4)R型活细菌+加热后杀死的S型细菌 小鼠死亡

(1)(2)两组通过控制细菌的类型进行对照,可知R型活细菌是无毒的,而S型活细菌是有毒的。(2)(3)两组通过控制S型细菌的存活状态进行对照,可知加热后杀死的S型细菌是无毒的。在此基础上进行的第(4)组实验,实验现象是小鼠死亡,从小鼠体内分离出S型活细菌,但是注射到小鼠体内的是活的R型细菌和加热杀死的S型细菌,小鼠体内无毒的R型活细菌转化有毒的S型活细菌的实质是什么?第(4)组死亡的小鼠体内都是S型活细菌吗?为什么?

由该实验可知:S型菌中有转化因子,那么究竟S型菌中的什么物质是转化因子呢?怎么从S型菌的组成成分中判断哪种物质是转化因子,实验怎么设计,为什么这样设计?引导学生运用单一变量原则和对照原则积极思考。要判断S型菌中哪种物质是转化因子,要设法将S型菌的各种组成成分分开,单独观察其作用。

2.3.2肺炎双球菌体外转化实验

(1)S型菌的DNA+R型菌R型菌和S型菌

(2)S型菌的蛋白质+R型菌R型菌

(3)S型菌的多糖+R型菌R型菌

(4)S型菌的DNA+DNA酶+R型菌R型菌

(1)(2)(3)三组通过控制S型菌的组成成分进行对照,可知S型菌的DNA使R型菌转化为S型菌,S型菌的蛋白质和多糖不可以。(1)(4)两组通过控制是否加入DNA酶进行对照,可知转化因子是DNA,而不是DNA的分解产物。进一步抛出问题,既然实验遵循了单一变量原则和对照原则,设计合理,那么为什么仍有人对该实验的结论提出质疑?从而训练学生的批判思维能力。

分离提纯得到的物质纯度不能达到100%,有没有更好的方法将DNA和蛋白质区分开来?选择什么实验材料最合适?

2.3.3T2噬菌体侵染大肠杆菌的实验

选择合适的实验材料是十分重要的。从实验操作程度和可控制性等方面看,最好选择只有DNA和蛋白质这两种物质作为组成成分的生物为实验材料。既然无法通过提纯得到100%的相关物质,我们就要追踪DNA和蛋白质的作用,可以用什么方法?引导学生对分泌蛋白形成的复习,得出采用放射性同位素标记法。放射性强度是实验观察指标,我们不能判断具体是哪种物质哪种元素产生的放射性,因而只能对DNA和蛋白质分别进行标记,且标记DNA的特有元素和蛋白质的特有元素。实验通过控制噬菌体中被标记的物质进行对照,可知噬菌体侵染细菌时,噬菌体的DNA进入到细菌细胞中,而噬菌体的蛋白质仍留在细菌细胞外,且两组都产生了子代噬菌体,子代噬菌体中只检测到 P,没有检测到 S。因此 P标记的DNA是亲代噬菌体与子代噬菌体之间传递遗传信息的物质,即DNA是遗传物质。引导学生进一步思考:既然DNA进入细菌体内,蛋白质未进入,为什么 P标记的噬菌体侵染大肠杆菌时,上清液中含有很低放射性?为什么 S标记的噬菌体侵染大肠杆菌时,沉淀物中含有很低放射性?由此,对今后的实验操作和实验设计有什么启发?

自然界中并不是所有的生物都有DNA,如烟草花叶病毒、艾滋病病毒只有RNA和蛋白质两种成分,可通过病毒重组法或酶解法探究其遗传物质。通过对遗传物质的探究发现自然界中大多数生物都是以DNA为遗传物质,所以“DNA是主要的遗传物质”。

3.反思

生物学核心概念的理解不是一节课或一个自然章节就可以完成的,通常需要花费较长时间,从多角度学习才能形成。虽然遗传物质不是核心概念,但它是构建核心概念的基石,在“遗传物质”概念的基础上,教师通过引导学生从实验设计思路和原则角度,抽丝剥茧,分析科学家的经典实验,揭开遗传物质的面纱,理解“DNA是遗传物质”,而对“遗传信息的传递是通过DNA复制实现的”只能通过后续章节来建立。

参考文献:

分子遗传学中心法则范文2

禀赋的概念,在中医学浩瀚的医籍文献中,记述颇多,诸如:禀质、禀受、禀气、资禀、赋气、资质等,另有胎禀、胎赋、胎肖、胎传及天赋、天授、天年、先天、素体、素质等等。禀意接受,是子代承受父代;赋即给予,是父代赋予子代。辞书对于禀赋的解释大体相同,但也有细微差别,《辞源》:“禀赋,称人所禀受的资质。”《辞海》:“禀赋,犹天赋,指人所禀受的天资或体质。”《康熙字典》引“《韵会》:禀受也,给与也。《礼・中庸》:天命之谓性。性者,人所禀受。朱传注曰:气以成形,而理亦赋焉。”在此“气”即可理解为物质,“理”则为功能。即生命的功能依一定的物质基础向下一代传递。《现代汉语词典》释禀赋为:“人的体魄、智力等方面的素质。”《中医大辞典》则把“禀赋”解释为“先天赋予的体质因素”。

中医禀赋理论的起源可以追溯到战国至西汉时代的《内经》,其《灵枢・天年》篇曰:“黄帝问于岐伯曰:愿闻人之始生,何气筑为基?何立而为?何失而死?何得而生?岐伯曰:以母为基,以父为,失神者死,得神者生也。……血气已和,荣卫已通,五脏已成,神气舍心,魂魄毕具,乃为成人。”张景岳《类经》云:“夫禀赋为胎元之本,精气之受于父母者是也。”明・石寿棠《医原》曰:“人身囫囵一个形躯,禀父母之精血凝结而成。”可见,禀赋来自于父母,即是先天人所禀受的“精”与“气”等物质基础,而且还有“神”、“理”等生命功能。然而中医学中禀赋概念尚待研究,应用现代诠释学的原则与方法做初步的探讨,具有一定的现实意义。

1 禀赋以遗传信息为主

禀赋之源便是生命之源,生命之源来自父母之精,《素问・金匮真言论》曰:“夫精者,生之本也。”《灵枢・本神》篇说:“生之来,谓之精。”《灵枢・决气》篇也说:“两神相搏,合而成形,常先身生,是谓精。”可见禀赋受于父母,在未生之前,亦即是先天。既生之后的生长发育,则为后天。先天与后天共同构筑机体,影响人的生老病死。至于父母之精是什么样的物质?有称“元气”者,如清・徐灵胎《医学源流论》曰:“当其受生之时,已有定分焉。所谓定分者,元气也。视之不见,求之不得,附于气血之内,宰乎气血之先。其形成之时,已有定数。”

当今研究资料表明,父母之精承载着遗传信息,遗传信息的物质基础是染色体和基因,并且只有起源于染色体和基因的变异才能遗传,单纯由环境条件所直接引起的变异则不能遗传。遗传是人们观察到的由亲代将其特征传给子代的一种现象,且表现为垂直传递。现代遗传学提出一个人从他的双亲那里继承下来的全部物质及遗传信息都包含在卵子和里面。人类一切遗传性状都是在遗传信息的控制下,在发育过程中,于环境的影响下从受精卵开始直到死亡,经过一系列的演变而形成的。现在证明生殖细胞中的染色体载负着遗传信息。染色体是细胞核里的“线性”结构,并载有直线排列能自我复制的基因,因而有储存和传递遗传信息及控制细胞分化发育的作用。基因的化学本质是具有一定功能的一段DNA(脱氧核糖核酸)序列,其生物学本质就是遗传信息的基本单位,其功能就是决定性状。所以,遗传信息即是受孕以前和卵子所携带的信息,遗传信息的传递是时空流、信息流、物质流的结合。

对于万物化生的原理和规律,中国古代《周易》有“一阴一阳之谓道”的著名论断。周敦颐《太极图说》记述:“无极而太极,太极动而生阳,动极而静;静而生阴,静极复动。一动一静,互为其根,分阴分阳,两仪立焉。阳变阴合,而生水火木金土,五气顺布,四时行焉。五行一阴阳也,阴阳一太极也。太极本无极也,五行之生也,各一其性。无极之真,二五之精,妙合而凝……二气交感,化生万物。万物生生,而变化无穷焉。惟人也,得其秀而最灵,形既生矣。”由无极至太极,至两仪,至五行四时,至化生万物,这不仅是对整体生命起源演化的推衍,也是对个体生命孕育生成的阐释。继承先贤学说与现代遗传学原理链接,对生命科学研究具有重要的指导意义。

遗传密码的破译,中心法则的确定,蛋白质和核酸的人工合成,是近代分子遗传学发展的三大成就。研究表明,DNA、RNA(核糖核酸)的复制、转录、翻译和表达有一套严密的信息编码排序原则和体系,决定着遗传信息的传递。中国古代的贤哲用阴阳五行、太极从宏观的角度揭示了遗传的本质和规律,与现代遗传学微观的细胞、分子、基因学说看似相距遥远,但二者都是对生命现象的探索,将宏观与微观研究逆向对接,双方是可以互为借鉴的。有学者用《易经》六十四卦圆图说明生物遗传的三联体六十四密码排列。认为在中医学中,六十四卦图是最早的人体结构与生理功能模型,是自然界大宇宙和人身小宇宙间,物质流、信息流、能量流相互交流、循环、转化的系统理论模型,还是一副用严密数理逻辑语言和遗传密码的生命语言描绘书写出来的美丽画卷[1]。

任继学教授曾指出:禀赋内植“其精甚真,其中有信”,参和阴阳水火生克之调,“水火木金土之序”以及五行生克即易中消息之能,可知禀赋是生命在时间上和空间上形成调控――排序――编码――信息――表达,而表达于内外者即是象,象是宏观与微观皆可见的,如气血、脏腑、津液等[2]。可见开展对禀赋的深入研究,针对禀赋特征与基因表达的内在联系,则是探索人类生命奥秘的重大课题。

2 禀赋与胎传信息相关

胎传信息是指受孕以后至出生期间胎儿所获得的信息,因其在出生以前已赋予胎儿,并大多将在胎儿出生后伴随其生长发育于一生,所以归属于先天禀赋。胎传信息由母体传给胎儿,但不会再向下一代遗传,所以具有类似传染病水平传递的某些特点。

孕妇及其生存的生态环境是胎传信息的来源,所以母体的内外环境因素对于胎儿先天禀赋的形成具有重要影响。身心健康的母亲加上和谐的生态环境能够赋予子代良好的胎传信息。明《幼科类萃・论小儿受胎禀赋厚薄不同》云:“大抵禀赋得中道为纯粹,阴阳得所,刚柔兼济,气血相和,百脉相顺,精备神全,脏腑充实,形体壮健。其未周之时,颅囟坚合,睛黑神清,口方背厚,骨粗臂满,脐深肚软,茎小卵大,齿细发润,声洪稳睡,此皆受胎气之得中和者也。”反之,孕妇身体虚弱或身心有疾则会向胎儿传递不良信息,甚至导致各种疾病的产生。陈复正《幼幼集成》云:“如禀肺气为皮毛,肺气不足,则皮薄怯寒,毛发不生;禀心气为血脉,心气不足,则血不华色,面无光彩;禀脾气为肉,脾气不足,则肌肉不生,手足如削;禀肝气为筋,肝气不足,则筋不束骨,机关不利;禀肾气为骨,肾气不足,则骨节软弱,久不能行。此皆胎禀之病。”《景岳全书・小儿则》也有论述:“如母多火者,子必有火病;母多寒者,子必有寒病;母之脾肾不足者,子亦如之。凡骨软行迟、齿迟语迟、囱门开大、疳热脾泄之类,多有由于母气者。”该类病症中医称之为“五迟”、“五软”、“五硬”、“胎怯”、“胎毒”等。西医学也发现孕妇在头3个月感染风疹病毒、巨细胞病毒、弓形虫或接触致畸物质则可能导致胎儿先天性心脏病、先天性白内障等各种先天畸形或出生缺陷等。

关于孕母心理情绪变化对胎儿禀赋的影响,明・万全《妇人秘科》曰:“受胎之后,喜怒哀乐,莫敢不慎。盖过喜则伤心而气散,怒则伤肝而气上,思则伤脾而气郁,忧则伤肺而气结,恐则伤肾而气下,母气既伤,子气应之,未有不伤者也。其母伤则胎易堕,其子伤则脏气不和,病斯多矣。盲聋音哑,痴呆癫痫,皆禀受不正之故也。”《素问・奇病论》亦曰:“人生而有病颠疾者,病名曰何?安所得之?岐伯曰:病名为胎病,此得之在母腹中时,其母有所大惊,气上而不下,精气并居,故令子发为颠疾也。”

3 结语

总之,禀赋概念源远流长,论述纷繁,但对其实质研究还缺乏深度。笔者认为,从现代生物学和遗传学的角度来认识,中医禀赋的概念当有狭义和广义之分,狭义的禀赋即遗传信息,广义的禀赋则指所有从先天获得的信息,包括遗传信息和胎传信息。在中医学中,应用更多的是禀赋的广义概念。遗传信息的表达有其物质基础,即染色体和基因,胎传信息的表达则是由胎孕期间各种内外环境因素造成的。所以,禀赋的概念可否厘定为:禀赋是个体在先天遗传的基础上及胎孕期间内外环境的影响下,所表现出的形态结构、生理功能、心理状态和代谢方面综合的、相对稳定的特征。其形成于出生之前,但受后天环境影响。

21世纪人类正力求在遗传基因的层面认识生命,并且已从基因组时代、后基因组时代、蛋白质组学时代步入系统生物学与分子生物学相结合的生物信息学时代,然而这对于生命的认识还只是冰山一角。生命信息的获得除与遗传信息有关外,还与禀赋不足、气血不充、营养、情绪、生活方式、地域、气候等各种内外环境因素所造成的胎传信息密不可分,而这可能是中医禀赋学说的优势所在。

禀赋学说是中医学理论的重要组成部分,充分认识其本质含义,并进一步从生理、病理、诊断、治疗等各个层面深入研究禀赋和人体健康与疾病的关联,关注生殖健康、母婴保健,预防出生缺陷、远离遗传性疾病,还有既病防变,重视后天调养。总之,完善中医禀赋学说框架,复习古代医家关于禀赋的论述,联系当今科研成果,运用现代诠释学的原则与方法,从中医基础理论层面继承与创新,对于探索人类的生命奥秘和有效指导临床实践具有一定的理论意义和重大的实用价值。

4 参考文献

1 杨力.周易与中医学.第3版.北京:北京科学技术出版社,2005.1235.

分子遗传学中心法则范文3

[关键词]数据挖掘 遗传算法 关联规则

[中图分类号]TP18[文献标识码]A[文章编号]1007-9416(2010)02-0109-02

1 引言

近年来,随着科技的进步,特别是信息产业的发展,把我们带入了一个崭新的信息时代。随着数据库技术的迅速发展以及数据库管理系统的广泛应用,同时条形码和信用卡的普及和使用,进一步加速了商业、金融、保险等领域的信息化进程。如此多领域的数据各自存放在相应的数据库中,致使数据库的规模日益扩大,已经达到数十兆字节,有的甚至更大。数据挖掘就是从大型数据库中的数据中提取人们感兴趣的知识。这些知识是隐含的、事先未知的潜在的有用的信息。提取的知识表示为概念(Concepts)、规则(Rule)、规律(Regularities)、模式(Patterns)等形式。

目前应用于数据挖掘的算法有很多种,如统计方法、机器学习方法、神经计算方法等。遗传算法由于其解决问题以混饨、随机和非线性为典型特征,它为其它科学技术无法解诀或难以解决的复杂问题提供了新的计算模型。这里,我们将遗传算法应用于数据挖掘领域,主要是因为:数据挖掘的目的就是要从大的数据库中提取信息与知识。为了达到这一目的,我们可以将整个数据库看作一个大搜索空间,而把挖掘算法看成一种搜索策略。显然,当数据库容量极其巨大时,进行穷举搜索是不可行的,必须采取一种有效的搜索策略。而与其它的启发式算法比较,遗传算法不仅具有很好的全局搜索能力,同时将其用于数据库领域时它能较好的处理数据库中不同属性之间的相互关系。正是因为遗传算法的这些特点,我们尝试将遗传算法用于数据库领域,实验证明算法是可靠的,可以得到数据库中具有较强预测能力的规则。本文提出用遗传算法挖掘关联规则,希望能在关联规则的提取方法上提出一种新的尝试。

2 关联规则挖掘

关联规则挖掘就是从大量的数据中挖掘出有价值的、描述数据项之间相互关系的有关知识。有效的发现、理解、运用关联规则,是完成数据挖掘任务的一个重要手段。Agrawal等人于1993年首先提出了挖掘顾客事务数据库中项集间的关联规则问题,其核心方法是基于频繁项集理论的递推方法。目前,数据挖掘的关联规则方法有多种,其中Apriori算法是一种找频繁项集的典型算法。这种算法简单易理解, 就是使用了不断通过连接产生候选集,并对侯选项集加以剪枝的方式来得到频繁集,再由频繁项集产生强关联规则的过程。关联规则是识别一组给定数据集的各特征值之间和各项之间的相互依赖及相互转化关系。关联规则是如下形式的一种规则:“在无力偿还贷款的人当中,60%的人的月收入在3000元以下。”关联规则的主要任务就是要挖掘出数据库D中所有的有用规则,在这个挖掘过程中,选择高效的关联规则算法进行数据挖掘是非常重要的。

设I={i1,i2,…im}为所有项目的集合,项目集,D为事务数据库,其中每个事务T是一个项目子集()。每一个事务具有惟一的事务标识Tid。我们说事务T包含项目集X,当且仅当。如果项集A中包含k个项目,则称其为k项集。项集A在事务数据库D中出现的次数占D中总事务的百分比叫做项集的支持度。如果项集的支持度超过用户给定的最小支持度阈值,就称该项集是频繁项集(或大项集)。关联规则是形如X=>Y的逻辑蕴含式,其中,XT,YT,并且X∩Y=φ。X称作是前提,Y称作是结果。一般用两个参数描述关联规则的属性:

*支持度(support):如果事务数据库中有s%的事务包含X U Y,那么我们就说关联规则X=>Y的支持度support为s,Support(X=>Y)=P(X U Y)。

*信任度(support):如果事务数据库里包含X的事务中有c%的事务同时也包含Y,那么我们说关联规则X=>Y的信任度Confidence为c,Confidence(X=>Y)= P(Y|X)。

关联规则就是支持度和信任度分别满足用户给定阈值的规则。为了提高Apriori算法的有效性,可以使用基于散列的技术压缩侯选k-项集;而基于划分的方法是将大型事务数据库划分成多块数据,以便将每块数据放入内存求其频繁项集,这种方法只需要两次数据库的扫描;基于采样的方法,是在给定数据的一个子集上挖掘;通过事务压缩减少扫描的事务个数;基于hash的方法,可以提高找侯选项集的效率。另一种不需产生侯选项集的频繁模式增长算法,也是一种高效的关联挖掘算法。 国内外在关联规则挖掘方面的研究已经取得了较大的进展,但关联规则挖掘技术在有些方面仍然存在着不足。需要进一步研究和提出更好的解决方案。

3 遗传算法的基本思想

遗传算法是基于生物学进化原理的全局搜索算法,通过计算机模拟生物进化过程,对群体不断优化,最终找出最优解。到目前为止,遗传算法已经在模式识别、图象处理、人工智能、经济管理、商业和金融等多个领域中获得了较成功的应用。构成遗传算法的要素主要有:染色体编码,个体适应度评价,遗传算子(选择算子,交叉算子,变异算子)以及遗传参数设置等。基本遗传算法一般要包含以下几个处理步骤:

(1)选择编码策略,把参数集合X和域转换为位串结构空间S;

(2)定义适应值函数f(x);

(3)确定遗传策略,包括选择群体大小n,选择、交叉、变异方法;

(4)随机初始化生成群体P;

(5)计算群体中个串解码后的适应值f(x);

(6)按照遗传策略,运用选择、交叉和变异算子作用于群体,形成下一代群体;

(7)判断群体性能是否满足某一指标,或者已完成预定迭代次数,不满足返回步骤(6),或者修改遗传策略再返回步骤(6)。

4 基于遗传算法的关联规则研究

遗传算法(Genetic Algorithm-GA)是一种高效的启发式快速搜索算法,为了从海量数据中提取有用的信息与知识,我们可以将整个数据库看作一个大搜索空间,而把挖掘关联规则的算法看成一种搜索策略。当数据库容量极其巨大时,进行穷举搜索是不可行的,必须采取一种有效的搜索策略。针对传统的遗传算法容易导致算法的过早收敛而陷于局部最优困境,或收敛时间过长而消耗大量的搜索时间的缺陷,我们提出了一种改进的遗传算法,该算法采用一种自适应变异率和改进的个体选择方法,并且将这种改进遗传算法应用于web关联规则的挖掘,实验结果证明这种算法是有效的。

与其它的启发式算法比较,遗传算法不仅具有很好的全局搜索能力,同时将其用于数据库领域时它能较好的处理数据库中不同属性之间的相互关系。应用遗传算法进行关联规则发现,首先要对解决的实际问题进行编码,编码方法一般采用二进制编码,也可以采用十进制编码。关联规则挖掘的任务就是要发现能够反映记录属性之间的关系,通过遗传算法的适应度函数的定义,根据适应度函数的值进行搜索得到一组规则。利用交叉、变异运算对该组规则进行进化,再利用选择运算产生下一代规则,这样经过若干次迭代后,遗传算法满足终止条件,从而得到一组理想规则。接下来,利用这些规则对数据库中的数据进行加工,删除规则覆盖的例子,对剩余的数据继续采用以上遗传算法,去挖掘第二组规则。重复以上步骤,直至数据库中的所有例子都被覆盖或满足事先约定的终止条件。最后应用规则优化算法对所得规则进行优化,使之得到最简规则。基于遗传算法的关联规则挖掘技术可以应用在销售分析、金融信贷风险分析,物流货源分析等领域,具有较好的研究和应用价值。

[参考文献]

[1] 叶传奇,张涛.遗传算法在数据挖掘中的应用研究[J].洛阳工业高等专科学校学报,2003.

[2] 彭建.一种基于遗传算法的关联规则挖掘方法[J].计算技术与自动化,2005.

[3] 张志立,张鹏,齐德昱: 一种基于遗传算法的知识规则挖掘算法[J].郑州大学学报(理学版) ,2004.

[4] 周涛,岳振才.基于改进遗传算法的关联规则挖掘[J].陕西工学院学报,2004.

[作者简介]

周大镯(1971-),女,河北文安人,河北经贸大学计算机中心副教授,天津大学管理学院在读博士研究生。研究方向:数据挖掘。

分子遗传学中心法则范文4

关键词:思维进化算法 遗传算法 交叉 变异

中图分类号:TP183 文献标识码:A 文章编号:1007-9416(2015)12-0000-00

Abstract:This paper discussed the advantage and weakness of the Genetic Algorithm and Mind Evolution Algorithm tentatively, expatiate the main mind and test step, point out the problem and the improve,combined genetic operator with Mind Evolution Algorithm, and made Mind Evolution Algorithm improved, provided the concreting step, use the cross and variation; And using this algorithm for solving the extreme value of function, it obtained the satisfied experimental result, apply for the compute area.

Key words:Mind Evolution Algorithm; Genetic Algorithm; crossover; mutation

1 引言

自然界是人类获得灵感的重要源泉,近几十年来,将生物界提供的答案用于实际问题的求解已经被证明是一个成功的方法。进化计算正是在这种背景下产生的,它主要包括:遗传算法、进化规划和进化策略。而在这中间应用最为广泛的是遗传算法。遗传算法是一种以达尔文的进化论和门德尔的遗传理论为基础的求解全局优化问题的仿生型算法。它是由Michigan大学的Holland教授提出的,它简单、通用、鲁棒性强。近年来,遗传算法的研究取得了长足的进步,并且在函数优化、组合优化、生产调度问题、人工生命及机器学习等众多领域里得到了广泛的应用。但是遗传算法的缺点也日益明显:交叉与变异两个重要算子都是在一定的概率条件下,随机、盲目的搜索,容易产生退化早熟现象;另外,它缺乏行之有效的强制记忆功能并且计算时间过长。正因为如此,有许多科学家试图从各个方面来改进遗传算法。而思维进化算法(MEA)就是针对遗传算法所出现的问题而提出的一种行之有效的解决方法。本文将遗传操作与思维进化算法有机的结合在一起,把变异与交叉算子融于思维进化中,对思维进化作了一定的改进。

2 基本思维进化算法

2.1 思维进化的主要思想

众所周知,自然界中的生物通过遗传和自然选择而进化了上亿年,这个过程非常缓慢。相比之下,人类思维进化的速度却远远高与生物的进化。其原因在于:向前人和优胜者学习;不断的进行探索和创新。人类在这两种思维方式的影响下使自身得到了快速的发展,推动了科技的进步。思维进化算法正是基于以上分析而得出的。其主要构成如下:

(1)群体和子群体。所有个体的集合称为一个群体。一个群体分为若干个子群体,子群体有两类:优胜子群体和临时子群体。(2)公告板。公告板为个体间和子群体间提供信息交流的机会。公告板上的信息包含了3 部分:个体或子群体的序号、动作、得分。行为的表达是与区域相关的,即行为的表达因区域而异。得分是标量,取自于环境中的行为。个体关于环境的知识就是信息。(3)趋同和异化是思维进化中的重要概念。在学习初期,个体在解空间中随机散布,计算每个个体的得分。一些得分高的个体成为胜者,并以它们为中心形成子群体。

趋同:每个子群体的个体在子群体内向其胜者(子群体内得分最高的个体) 学习,并相互竞争,直到一个新的胜者出现。胜者的得分就是子群体的得分。子群体的成熟:一个子群体诞生后,开始时,子群体的得分增长很快,以后得分增长逐步减慢,当子群体的得分不再增长时,称该子群体成熟。异化:一些个体在整个解空间中搜索,,产生若干个临时子群体。当临时子群体的得分高于任何一个成熟优胜子群体的得分时,用前者取代后者成为新的优胜子群体。从竞争的角度看,趋同进行局部竞争,异化进行全局竞争;从另一个角度看,异化进行探测,趋同进行开发利用。

2.2 实现步骤

(1)群体初始化,根据得分产生优胜子群体和临时子群体。并将其得分记录到公告板中。(2)趋同学习发生在每个子群体(优胜和临时子群体)的内部,在局部竞争中寻找局部最优点。在每次趋同操作中都是以胜者为中心,按正态分布散布新一代的个体,其中得分最高的个体是该子群新的胜者。(3)异化是子群体为成为优胜子群体而与其它子群体所进行的一种全局竞争。若某一临时子群体的得分大于任一成熟优胜子群体的得分,则优胜子群体被临时子群体替代;同样,若某一成熟临时子群体得分小于任意优胜子群体的得分,则该临时子群体被放弃。(4)被替代与放弃的子群体中的个体在解空间重新均匀散布产生新的个体,以形成新的临时子群体,参加新一轮的趋同与异化。反复进行趋同与异化,当优胜子群体得分增长趋近于零时,认为算法收敛。此时优胜子群体的优胜者,即为全局最优解。

2.3 存在的问题及改进措施

在实际使用中,思维进化算法也存在缺点。例如,对于单调函数或单峰函数,MEA在最优值附近收敛较慢;而对于多峰函数的优化问题,它往往会出现“早熟”,即收敛于局部最优。主要原因有:常规的趋同操作可能由于“学习”的作用,某些群体放弃了本身比较好的特征;再者是异化算子的设计是在已有的初始群体里重新组合以产生新的优胜子群体,并没有对初始群体中的每个个体进行实质上的变化。借鉴遗传算法中的交叉与变异操作,可以对思维进化算法作进一步的补充计算。交叉是把两个父个体的部分结构加以替换重组而生成新的个体,交叉的目的是为了能够在下一代产生新的个体,通过交叉操作,算法的搜索能力得到飞跃地提高,是获取新的优良个体的重要手段;变异是个体变量以很小的概率或步长产生转变,它本身是一种局部随机搜索,与交叉算子结合在一起,保证了算法的有效性,使种群也保持了多样性,防止了非成熟收敛。于是通过交叉与变异操作,思维进化算法的搜索性能会得到大幅度的提高。

3 改进后的思维进化算法

3.1 编码方式

从精度及使用方便的角度来看,在涉及多参数优化的问题中,通常采用浮点数编码。浮点数编码的变异操作可以任意小。采用浮点数编码,可以避免数制的转换、提高精度,其效率要比二进制编码高。在浮点数编码的思维进化算法中,必须保证个体的值在给定的区间限制范围内,而其中的交叉、变异等算子也必须保证其运算结果所产生的新个体的基因值也在这个区间限制范围内。

3.2 算法的具体实现步骤

经过改进后的思维进化算法的的实现步骤如下:

(1)初始化。在解空间随机产生S个个体,并计算每一个体的得分,从中选择M+T个最好个体,即优胜者;(2)产生初始群体。以每一优胜者为中心,以δd=(Hd-Ld)/10为方差(其中Hd、Ld分别为第n 维变量的上下限),以正态分布产生Nj个个体,构成M个一般子群体、T个临时子群体;(3)趋同操作。在每一子群体内,首先计算每一个体的得分,得分最高者为优胜者,其余个体以一定的方式向优胜者学习,产生新的子群体。重复上述步骤,直到子群体成熟,即新的优胜者的得分得到进一步改善。在此将优胜者的得分定义为子群体的得分;(4)异化操作。若某一临时子群体的得分高于任一成熟一般子群体的得分,则认为该一般子群体在全局竞争失败,用此临时子群体替代该一般子群体,该一般子群体被放弃,被放弃一般子群体的个数记Mr。当一个临时子群体成熟,且它的得分小于任意一般子群体的得分时,它将不可能对全局优化有所贡献因而被放弃,被放弃临时子群体的个数记为Tw;(5)在进行信息(即所抽取的特征和全局公告板信息)指导下,在解空间中重新产生Mr+Tw个临时子群体;(6)对于在步骤(5)产生的Mr+Tw个子群体的每一个群体进行如下操作:

交叉操作 把其中的个体随机两两配对,按一指定概率Pc进行如下的交叉操作:

(1)

其中0

变异操作 对每一个个体中的每一个参数,按一定概率Pm进行如下的的变异操作:

(2)

其中α为(0,1)之间的随机数,Cmin、Cmax分别为个体参数C的上下界;

(7)把上述步骤(6)中产生的新临时子群体重新参于趋同操作;(8)重复上面的步骤(3)至步骤(7),直到满足收敛条件为止,一般收敛性判据是,全局公告板记录着每一子群体的优胜者及得分,当优胜者的得分得不到进一步的改善时,则认为收敛。利用算法初始种群的集合构筑一个状态空间,将算法视为一个压缩映射,那么算法的每一次迭代相当于对由初始个体组成的状态空间实施一次压缩映射。利用Banach不动点原理,可以证明算法渐进收敛到全局最优点。

4 实验结果及结论

为了测试算法的性能,分别用算法MEA,加入遗传算子的MEA对下面几种典型测试函数进行寻优:

该函数用于测试收敛速度,全局最小值为(0,0)。

该函数的极小值点(1,1)位于一狭长的抛物面形的平坦的处,较难找到,用于测试未成熟收敛。

该函数的极小值为(0,0)。在(0,0)附近范围内隆起部有无限多的次全局极大点,它的强烈震荡性质及它的全局最优点被次最优点所包围的特性,使得很难找到最优解。

在实验中,两种算法的种群规模设为100,每种算法各运行100次。每次运行过程中若得分值小于阈值(0.0001)则视为成功,否则视为失败。所有成功的迭代代数除以成功次数即位平均成功迭代代数,实验数据如表1所示。

表1 实验结果

评价

函数 算法 阈值 成功

次数 失败

次数 平均成功

迭代代数 最优评价值

fit1 基本MEA 0.0001 100 0 20.24 5.252053e-5

加入遗传算子的MEA 100 0 19.27 2.225179e-14

fit2 基本MEA 84 16 79.37 1.864154e-4

加入遗传算子的MEA 100 0 8.11 1.272805e-7

fit3 基本MEA 4 96 77 9.172560e-5

加入遗传算子的MEA 100 0 11.86 2.947642e-14

从实验结果可以看出,加入遗传算子的MEA较基本MEA的搜索能力有明显的改善。特别是当极值点被局部次优的圈脊包围时,更能体现出加入遗传算子的MEA的优越性。从函数fit3的寻优结果可知,100次运算中基本MEA仅成功4次,但是改进后的MEA成功率为100%,而且其寻优结果比基本MEA更加精确。所以加入遗传算子的MEA的寻优的精度和速度是显而易见的。

参考文献

[1] Sun chen-yi,et al.Mind-Evolution-Based Machine Learning:Framework and Implementation of Optimization[A].In:Proc IEEE Int Conf on Intelligent Engineering Systems[C].1998:355-359.

[2] Holland J H.Adaptation in natural and artificial systems[M].MI:University of Michigan Press,1975.

[3] 戴晓晖,李敏强,寇纪淞.遗传算法理论研究综述[J].控制与决策,2000(3):263-268.

[4] 陈文清.遗传算法综述[J].沈阳工业高等专科学校学报,2003(1):1-2.

[5] 雷德明.多维实数编码遗传算法[J].控制与决策,2002(2):239.

[6] 孙承意,谢克明,程明琦.基于思维进化机器学习的框架及新发展[J].太原理工大学学报,1999(5):453-457.

[7] 曾建潮,孙承意.具有二进制编码的思维进化方法[J].航空计算技术,1999(4):42-45.

[8] 吉根林.遗传算法研究综述[J].计算机应用与软件,2004(2):69-73.

[9] 赵宗淦,李红俊.MEBML在优化排样中的趋同与异化策略[J].机械科学与技术,2002(2):340-342.

[10] 介靖,曾建潮.基于遗传算法与思维进化计算的一种广义进化模型[J].小型微型计算机系统,2004(3):395-398.

[11] 曾建潮,介靖.基于思维进化计算的一种广义进化模型[J].太原重型机械学院学报,2002(3):181-186.

分子遗传学中心法则范文5

关键词:遗传算法;易算算法;数术记遗;历法推步术;内算;外算

calculation in genetics and that in image-number school of yi 

li shu-qing

(earthquake publishing house, beijing 100081, china)

abstract: the paper at first pointed out that the ideology basing on human life and emphasizing life development in i ching learningis consistent with the spirit of the rising western genetics calculation methods. secondly, the paper introduced late expert in scientific i ching learning, mr. pan yu-ting's understanding on genetic code, and then introduced the content and structure of the western genetic calculation, regarding dna-in-itself as the hardware for calculation, the numbers in yi the soft ware. at last, the paper made a contrast between the image-number thinking of i ching learning and that of genetic calculation, and put forward the concept of space illustrated by the 8 tri-grams.

key words: genetic calculation; calculation by yi numbers; calculation in calendar; internal calendar; external calculation

一、引 言

从伏羲画卦到《连山》易的出现,即有象的观念,数已开始萌芽,数与筮联系即有筮数,主要用于占卜。WWw.133229.cOm春秋时期,“象”和“数”同时出现在《管子·七法》篇中:“则,象,法,化,决塞,心术,计数。”但象数在春秋初期仍是两个松散联系的概念。到春秋末期,象与数的概念联系比较密切,在《周易·系辞传》中提到“极数定象”,已初步出现象数理论。这时,《系辞传》中只初步论及象数的内在联系,并未详细谈到象数理论的程序。孔子在教书时六艺教学大纲“礼乐射御书数”中的数,是当时日常用的实用数。到孟子时代,即到战国末期,象数理论乃大备,历法推步术也成熟。当时的不少学者会推步术,而星命学为孟、荀二位大儒所不齿。孟子所说的“苟求其故,千岁之日至可坐而致也”,是谈的历法推步术;荀子说:“善为易者不占”。这时,在古算经算法和历法推步术之外,已有经典术数如“三式”等的出现和应用。这两类数的算法,在后汉徐岳《数术记遗》中有提要式的概括总结。对其中提出的14种算法,没有明确指出何者为历法推步术算法,何者为术数算法程序。亦可能是综合的、浑元一体的算法程序。总的看来,有数必有算,有算必有法。形成古算经算法和术数算法是很自然的。在古代可能有互补的趋势。《周易》大衍之数很可能与古六历所用的算法程序有关。唐代张遂的大衍历以及宋秦九韶《数书九章》均涉及大衍算法,而秦汉时期的《九章数学》中则对大衍算法避而不谈。这可能是由于古代大儒亦是视大衍之数带有神秘内容,不敢与正规的应用数学算法相提并论。实际上,大衍之数只是一种现代所说的“不定分析”而已!阮元论曰:“推步之法至大衍备矣,……后来算造者未能及也。然推本易象,终为傅合,昔人谓一行窜入于《易》以眩众,是乃千古定论也”。[1]由此可知,就算法而论,推步术自为推步术,数术自为数术,各成系统,不相涉也。然而,这并不意味着数术算法程序中无合理内容。英人李约瑟常提到术数“内算”很有用。[2]但未作深入探究。宋秦九韶《数书九章》序中论内外算,涉及经典术数三式,其论颇正:“今数术之书尚三十余家,天象历度,谓之缀术。太乙壬甲谓之三式,皆曰内算,言其秘也。九章所载即周官九数,系于方圆者为镚术,皆曰外算,对内而言也。其用相通,不可歧二”。[3]以上所论均涉及数字信息。

21世纪已成为信息时代,信息与象数息息相通。故《系辞传》象数思维应当在今后大放光芒,与西方计算机文化成就携手并进,逐渐融汇成一体。《周易·系辞传》“天地之大德曰生”,“生生之谓《易》”,强调生命演化思想;卦爻的设置上采取乾坤六子的形式,这都与西方新近兴起的遗传算法的精神与具体计算步骤内容相近。

二、遗传密码与象数

近些年来,国内外对于科学易感兴趣的学者,无不重视生物遗传密码的研究成果,并展开《周易》象数与遗传密码细部结构对比的探讨。这方面,尤以已故著名科学易学家潘雨廷教授的研究具有代表性。潘先生博古通今,既深钻过象数理论,又熟悉分子生物学和遗传密码的生物化学含义,他在“科学易”一文中以dna(脱氧核糖核酸)和rna(核糖核酸)为例,来考察其分子结构的变化情况,及其化学键的“象数”。[4]讨论结果如下表所示(暂略):

为了使读者深入理解象数与生物遗传学及遗传密码的对应关系,有必要将有关科学名词加以扼要的解释:

1、遗传密码: dna(脱氧核糖核酸)中核苷酸顺序和蛋白质中的氨基酸顺序之间的关系称为遗传密码。遗传密码是由碱基的三联体(相当于《易经》八卦的三爻),可在dna分子上顺序读出,且互不重迭)。dna是一切生命形式的普遍遗传物质。dna有四种不同的碱基:两种嘌呤,即腺嘌呤和鸟嘌呤,以及两种嘧啶,即胸腺嘧啶和胞嘧啶。dna的结构呈双螺旋结构形式。

由三联体密码重迭,可形成与六十四卦相对应的符号系统。这并非出自偶然,而是自然物的发生和演化合乎易数的自组织作用造成的。潘雨廷教授在《周易纵横录》论文中已作了详细的象数论述,可以参看。

2、核苷酸:上述四种碱基之一与脱氧核糖结合,叫作核苷。核苷的磷酸酯衍生物称之为核苷酸。dna分子是由核苷酸构成的,许多单元接在一起就形成了多核苷酸长链。

3、核糖核酸(rna):rna和dna一样,都是长链分子,亦是由重复的核苷酸单元组成。rna的构成单元有两点与dna不同。首先,rna的糖组分不是脱氧核糖,而是核糖。其次,四种碱基中虽然有三种,即腺嘌呤、鸟嘌呤和胞嘧啶,在rna和dna中都一样。但第四种,即胸腺嘧啶,在rna中为尿嘧啶所代替,它少了一个甲基。在三种rna类型的一种类型中,还偶尔出现别的碱基。

4、信使核糖核酸(mrna):〖htss〗mrna在把密码翻译成专一性蛋白质时起模板作用,并且能把遗传密码的信息从细胞核的dna运送到细胞质,以便促进合成蛋白质的作用。携带着所需要的信息,以决定一个蛋白质分子的整个多肽链的mrna的长度,称为作用子。某些mrna分子携带着不仅合成一个蛋白质分子的信息,这样的mrna称为多作用子。在合成过程中,当密码由dna转录到mrna上时,后者即离开细胞核,通过核膜进到细胞质中。在细胞质中它移动到蛋白质合成的场所,即转移到核糖核蛋白体处。核糖核蛋白体由dna和蛋白质组成。

5、转移核糖核酸(trna):〖htss〗其作用是把细胞质中的氨基酸转移到核糖核蛋白体上蛋白质合成的场所。因此,trna是在特定氨基酸与对它编码的mrna三联体之间起媒介物或转接分子的作用。每个氨基酸都有其互不相同的、专一的trna分子。每种trna含有大约80个核苷酸。

6、反密码子:trna分子上与mrna连接的一定部位是一个由三个碱基组成的顺序,与mrna上的密码子互补,称为反密码子。

7、简并密码:试验表明,虽然任何特定氨基酸密码子的开始两个字母总是不变,然而第三个字母有时却不同。例如,编码丝氨酸的不仅是agu,也有agc。因此,crick 1966年提出“摇摆”假设,这种摇摆在于第三对碱基之间的配合与前两对碱基的精确要求相比多少有些松弛。凡是同一个氨基酸有不同的密码者,这种密码称为简并密码。

三、遗传算法概要

在遗传算法中,可以将模型的一个参数表示为一个二进制数码,全部参数用许多串联在一起的二进制数码组成的字符串(类似一个染色体)代表。从一组初始模型,即一些具有不同染色体的个体组成的种群开始。[5]

遗传算法的基本思想正是基于模仿生物界的遗传过程。它把问题的参数用基因代表,把问题的解用染色体代表(在计算机里为字符串),从而得到一个由具有不同染色体的个体组成的群体。这个群体在问题特定的环境里生存竞争,适者有最好的机会生存和产生后代。后代随机化地继承了父代的最好特征,并也在生存环境的控制支配下继续这一过程。群体的染色体都将逐渐适应环境,不断进化,最后收敛到一族最适应环境的类似个体,即得到问题最优的解。值得注意的一点是,现在的遗传算法是受生物进化论学说的启发提出的,这种学说对我们用计算机解决复杂问题很有用,而它本身是否完全正确并不重要(目前生物界对此学说尚有争议)。

遗传算法的基础思想是在本世纪50年代初,由于一些生物学家尝试用计算机模拟生物系统演化时而提出的。

遗传算法是模拟生物通过基因的遗传和变异,有效地达到一种稳定的优化状态的繁殖和选择的过程,从而建立的一种简单而又有效的搜索方法。它运用随机而非确定性的规则对一族而非一个点进行全局而非局部地搜索,它仅利用目标函数而不要求其导数或其它附加限制,它虽然在特定问题上效率也许不是最高,但效率远高于传统随机算法,是一种普遍适用于各种问题的有效方法。遗传算法的主要思路有:

1、繁殖(reproduction):繁殖是根据现有各个体的目标函数值,确定其生存概率,模拟生物界的自然选择,劣者淘汰,适者生存。在遗传算法中,我们人为地保持种群包含的个体总数不变。比较优秀的个体(模型)有较大的生存概率,并可能繁衍,比较差的个体(模型)可能会淘汰。这样产生的下一代的个体,一般都具有较大目标函数值,因而有较大的生存概率。

2、交配(crossover):从种群中随机地选择两两一组的双亲,分别随机地交换部分染色体,各自产生两个新染色体。

3、变异(mutation):染色体按一定概率(一般很小)可随机地产生变异。

遗传算法能够解决的问题不仅限于最优化问题,但无论哪种问题,都要解决两个关键问题:(1)必须能将问题的解答用一组二进制数码表示,即建立解答与二进制数码间的映射(mapping)关系。(2)定义一种对最佳解的定量量度,即适度函数。

四、自然dna“计算机”的“硬件”与软件——象、数

算盘由木框、竹棍、算珠构成,其各类珠算口诀和规则是计算程序。算盘建立了一个珠算空间;易算卦爻,杭辛斋称之为卦材、爻材,相当于易算硬件,《系辞传》所论“八卦成列,象在其中矣”,是八卦空间。《序卦》所论相当于宏观程序。“蓍之德圆而神,卦之德方以智”等有关卦爻功能的论述,相当于基因染色体数的作用。

遗传算法所取法的自然dna的“硬件”(象)经生物化学家多年进行的dna结构分析的研究,相当 图1 dna四种碱基糖环系统及其原子标准指数(暂略)于高分子结构式所表示的原子结构。[6]具体化到dna,则是双链螺旋结构的形象。dna的参数有化学边界距离(以旋转角度表示),边界角(两相邻化学边界间的夹角),扭力角(dna螺旋的扭转角度,0~360°)。然而,前二者是常量。只有扭力角是时常变动的变量。遗传算法主要利用扭力角变量。今将遗传算法所取法的象数——碱基结构式及dna中轴(只表示一个核苷酸单位)扭力角分布等叙述如下:

图1表示dna四个碱基系统及其原子标准指数,图2(暂略)上部表示基本环,其扭力角为χi,其下表示糖环,其扭力角为p(i),γn(i),碱基系统的全过程是自由的,原则上沿单个化学边界“摆动”,就这样与dna糖环连接起来。意即基本环与糖环沿公共边界而“摆动”。这种摆动可能是在传递信息。沿化学界面在糖环上的内循环扭力角χ在空间上受到制约,因为糖环需要闭合。已发现每一核苷酸单位都有八个主要结构参数:χ,νm,p,α,β,γ,ε,ζ(2),〖jp〗这八个参数都限制在一个有限的距离内,原则上,扭力角α,β,γ,ε,ζ(2)及χ位于0~360°之间;δ是中轴和糖环的一部分,这里把δ叫做ν3,δ是一种冗余信息。p,νm距离可以推导出。典型的距离分别是150°~225°,25.0°~50.0°(距离用扭力角变化值表示)。如果dna的8个结构参数已知,则排列位置已知的dna,包括其中所含的n个核苷酸即可完全确定。

dna探针:这种探针(图3)(暂略)在探测环境信息方面,从最原始的单细胞生物变形虫原生质中就存在其原始形态。这种探针机构随宇宙和生物演化而逐渐变得复杂起来。瑞士学者方迪《微精神分析学》一书把这种探针式的尝试作用叫做“伊德”。[7]“伊德”在心理学界受到重视。dna的探针是一种复杂的综合体,在生物分子结构研究方面享有广泛的盛名,称之为dna探针级的研究。探针综合体一部分是由于其核苷酸自补偿作用而出名的。dna探针由一个双链杆和一个环组成。探针最重要的部分是这个环。探针在演化过程中非常守恒(稳定),因此具有重要的生物功能。探针形成于细菌噬菌体最原始的重复功能。dna染色体组存在有复杂的相互作用。这种作用能被其他生物分子所识别、利用,亦可由原生质来识别。

dna相当于一个微观世界,其细部结构和功能远未认识到。可以预料,它作为遗传算法的自然样板,其有用信息,取之不尽,用之不竭。要想改进遗传算法,一定要先取得自然dna的新探索成就。最近对dna的假结点的观测,对dna三叉结构的观测就属于这方面的新探索。dna双链结构相当于太极生两仪,两仪生四象,一分为二的浑沌二分叉结构。将来对dna三叉结构的认识可能引导到对《太玄经》一分为三,中医“三阴三阳”的认识。这并非遥远的呓想,可能是不久的事情了。

五、易算程序问题

易学象数理论自战国形成后,由于社会制度与士大夫意识形态的原因,易数不能走西方公理化的道路。徐岳《数术记遗》积算、太乙算、九宫算都有比较独立的算法。其余不一定有独立的算法。其中提出的14种算法是:积算,太一算,两仪算,三才算,五行算,八卦算,九宫算、运筹算,了知算,成数算,把头算,龟算,珠算,计算(心算)。对每种算法的叙述,只有三言两语,看不出所以然。迄今尚未有人作深入研究。原因是“文献不足故也”。要想恢复14种算法的原样,只有走到基层农民和隐居型的知识分子那里作调查。可惜多少年来无人问津,所以困惑一直未解。我认为调查重点主要是山东半岛蓬莱,镠罘沿海一带山区农村。

《九章数学》“寓理于术”,文中的“术曰”会有算法理论和程序背景。[8]现在唯一可了解的就是珠算算法,此已有全国珠算学会在研究。其中不少口诀规则,堪称算法。可从此入手以及从历代历法推步术的演化中追索易算算法。古有《缀术》,为南北朝祖冲之所创,用于五星的推步(宋秦九韶《数书九章》第三卷天时类有“缀术推星”章)。《缀术》在《算经十书》中有名无书,书已失传。

总之,恢复古代易算程序的研究是一大课题。南京大学天文系朱灿生教授曾拟研究恢复缀术。究竟古代易算详细内容如何,尚待考证恢复。秦汉前后出现的三式(太乙、六壬、奇门)经典术数的推演中可能有易算算法程序的影子。其中既含科学因素,又有不少神秘内容,今后应作开发研究。

六、象数思维与遗传算法的比较

本人研究科学易多年,研究遗传算法已有七、八年,迄今已初步得出易的象数思维基本上等价于遗传算法的性质与功能的初步看法。所谓象数思维主要是包含在孔子及其弟子所作的《易传》中,且主要是《系辞传》。经对比发现,无论用自然遗传过程,生物演化观念,整体观或根据实际观测来认识自然,在问题优化,生物遗传基因交配、变异,以及在溯往和预测问题上都表现了象数思维与遗传算法的相似性。《诗经·小雅》说:“唯其有之,是以似之。”意即两种事物相似的根本原因是二者之间有共同的东西。这亦是《内经》“贤者察同,愚者察异”之意。今将二者比较如下:

1.遗传算法(以下用ga简写表示)和《易》都重视生命现象,特别是遗传过程。《系辞传》说“生生之谓易”,“天地之大德曰生”。

2.ga和《易》都重视演化,重视从混沌到有序的观念,而认为确定不变的存在是暂时的。实际上,ga和《易》都有逼近论思想。

3.二者都有整体观思想:ga用相当染色体的种群(population)数作为基础,用相当基因的二进制数串输入计算机运算。所用数的设计都是一个集合,而不是用单个数。易算用大衍之数50(虚一不用)作为演算基础,亦是整体观。

4.二者都是以实际观测为研究根据。ga是西方实测方法的继续,自不待言。伏羲氏是根据仰观俯察、远取近取进行比较后而画八卦的,不是凭空臆造。

5.ga以求得问题优化解见长。孔子谓《易》是寡过之书,趋吉避凶之书,从广义上看也是一种优化。元吉(大吉)为全局优化,吉或悔而后吉是局部优化。 特别是《易》有《既济》、《未济》二卦作为纲领卦。《既济》乃优化的结果,《未济》也设法使其转变,向《既济》发展,很多卦爻辞字里行间,多有此意。

6.二者重事物之间的相互作用和关系。ga用交配来表达此意,《易》则以“天地镮,万物化醇,男女构精,万物化生”;“天气下降,地气上腾”(《礼记·月令》)来表示。

7.二者均重视质变,ga谓之变异,《周易·系辞传》则说:“穷则变,变则通。”

8.二者均涉及数学空间的理论和应用。ga常用结构参数空间,《易》则有八卦空间:“八卦成列,象在其中矣”;“乾坤成列而易立乎其中矣”。

9.《系辞传》说:“神以知来,智以藏往”。ga既能探索已往解决问题,又能用于地震预报。

ga的作者提出算法的改进问题,主要是深入挖掘dna结构的潜力。而东方思维则有“巢居知风,穴居知雨”的说法,这种说法是科学的,即鸟类和昆虫类(如蚂蚁)均有预测天气变化的功能。如能开发鸟类和蚂蚁体内信息大分子结构奥秘,可以用以改进ga算法的功能。

附注:已故学者刘绍光一元数理论的研究是根据易学象数发展出的一种易算数学分支。这一分支后继乏人或无人。关于一元数理论已出版《一元数理论初探》[9]一书,其中不少与ga有相通之处,如其中提出的位元、序元、结元三个计算程序理论概念,以及磁子、电子、声子、光子、热子、引子、张子等开阖角的问题。均可与ga相互作用,而创造新的算法。

参考文献: [1] (汉)徐岳.数术记遗[m].阮元.畴人传[z].光绪海盐常惺斋刊本.[2] (英)李约瑟.中国科学技术史:第三卷(数学)[m].北京:科学出版社,1978.《中国科学技术史》翻译小组译.

[3] 秦九韶.数书九章[m].宜稼堂丛书[z].民国商务印书馆《丛书集成》本.

[4] 潘雨廷.科学易[a].唐明邦.周易纵横录[c].武汉:湖北人民出版社,1986.

[5] d.e.goldberg genetic algorithms in search, optimization, and machine learning. addison-wesley publishing company. inc.new york.

[6] van nostrand reinhold 1991.haudbook of genetic algorithms p251~280.(1

8. a genetic algorithm for conformational analysis of dna, written by c.b.lucasius.etc.) published by van nostrand reinbold, new york.

分子遗传学中心法则范文6

关键字:频率分配遗传算法GECP组合优化

1.通信网频率分配问题的背景

无线通信设备之间通过相互发射电磁波达成信息沟通。相互通信的设备之间使用特定的频率(信道)构成无线通信链路。由于电磁波的自然特性,无线通信设备发射的电磁波可能对位于附近、满足一定功率和频率条件的其它设备形成干扰。频率分配(FAP)的目的就是给工作在一定地域内的无线通信设备指定使用的工作频率(或信道),使所有设备都以尽量小的概率扰,从而使整个网络的可用性得到优化。FAP可以描述为:对N个给定的待分配工作频率的链路,设G={S1,S2,…Sn}为所有状态构成的解空间,C(si)为状态si对应的目标函数值,寻找最优解s*,使任意si∈G,C(s*)=minC(si)。因此FAP是一种组合优化问题。

具体设备频率分配方法虽然会随着设备的工作方式(单工、双工)、工作频段、天线类型、信号的调制解调方式的不同而有所区别,但是大部分频率分配算法都可以转换为等价的图的边着色问题。从图论算法理论上讲,图的广义边着色问题是NPC问题[7],也就是说无法在多项式时间内求得问题的最优解。例如对于存在n条边的无向图,使用c种颜色对其着色,在没有其它约束条件下,其解空间是cn。即使在不考虑颜色重复使用(c>n)的情况下,其解空间也达到n!。这两者都是超越数,在c和n的值较大的情况下想利用穷举搜索的方法求得问题的最优解在时间上是不可行的。

在工程实践中许多NPC问题使用一些使用的近似算法得到问题的可行解。这些方法包括[]:只对问题的特殊实例求解;动态规划(DP)或者分支界限算法(BC);概率算法;求近似解;启发式算法(HeufisticAlgorithms)等。这些方法的和核心是分割问题的解空间,按照特定规则搜索典型解作为次最优解。

对于FAP问题国内外许多学者进行了深入的研究,提出许多解决问题的方法。文献[4]在对FAP进行理论分析的基础上给出了几种常用算法的框架,这些算法包括:最小-最后次序查找算法,贪心T着色算法、模拟退火算法(SA)、列表寻优算法(TS)、遗传算法(GA)、神经网络(NN)多面体算法等,并指出各种算法有各自的适用范围;文献[2]提出了利用启发式的蚂蚁算法,并对解决CELAR、GRAPH、PHILADELPHIA上的几类问题同TS和SA算法进行了比较;文献[1]比较了SA、TS、GA、VDS(variable–depthsearch)、BC等算法的性能。文献[7]利用GECP理论对存在禁用频率的异频双工设备的频率分配给出工程上的实用算法;文献[9]则采用了BC方法频率分配的全排列算法进行了优化。本文将探讨如何遗传算法解决FAP问题。

2.遗传算法在频率分配问题中的适用性

2.1遗传算法的原理

遗传算法(GeneticAlgorithmsGA)是根据生物学上的染色体基因因子构成机制而产生的。1975年Holland教授首次提出了GA的思想,从而吸引了大批的研究者,迅速推广到优化、搜索、机器学习等方面。遗传算法是一种全局优化算法,其仅以目标函数值为搜索依据,通过群体优化搜索和随机执行基本遗传运算,实现遗传群体的不断进化,适合解决组合优化问题和复杂非线性问题[6]。

利用遗传算法解最优化问题,首先应对可行域中的点进行编码(一般采用二进制编码),然后在可行域中随机挑选一些编码组成作为进化起点的第一代编码组,并计算每个解的目标函数值,也就是编码的适应度。接着就像自然界中一样,利用选择机制从编码组中随机挑选编码作为繁殖过程前的编码样本。选择机制应保证适应度较高的解能够保留较多的样本;而适应度较低的解则保留较少的样本,甚至被淘汰。在接下去的繁殖过程中,遗传算法提供了交叉和变异两种算子对挑选后的样本进行交换。交叉算子交换随机挑选的两个编码的某些位,变异算子则直接对一个编码中的随机挑选的某一位进行反转。这样通过选择和繁殖就产生了下一代编码组。重复上述选择和繁殖过程,直到结束条件得到满足为止。进化过程最后一代中的最优解就是用遗传算法解最优化问题所得到的最终结果。

实践表明,遗传算法解最优化问题的计算效率比较高、适用范围相当广。为了解释这一现象,Holland给出了模式定理。所谓模式,就是某些码位取相同值的编码的集合。模式定理说明在进化过程的各代码中,属于适应度高、阶数低且长度短的图式的编码数量将随代数以指数形式增长[6]。最近的研究则表明,上述遗传算法经适当改进后对任意优化问题以概率1收敛于全局最优解[5]。

2.2遗传算法的基本结构

在遗传算法中,将问题的求解的过程,看成一个在候选解空间寻找满足问题要求的解或近似解的搜索过程。遗传算法的重点在适应规划和适应度量方面。遗传算法的适应规划用于指导算法怎么样在空间进行搜索,一般采用遗传算子(或称遗传操作)诸如(Crossover)和变异(Mutation)等,以及模拟自然过程的选择机制,采用计算适应值的方法来评估一个候选解的优劣。

遗传算法求解问题的基本步骤可以描述如下:

1.首先生成一组初始的候选解群体(假设为N个候选解个体),称为第0代;

2.计算群体中各个候选解的适应值;

3.如果有候选解满足算法终止条件,算法终止,否则继续4;

4.根据概率,将候选解群体中的个体随机两两配对,进行操作以生成新的候选解;

5.根据变异概率,对4中生成的候选解群中的每个个体进行变异操作;

6.使用选择机制形成新一代候选解;转2。

GA算法具有下述特点:GA是对问题参数的编码组进行,而不是直接对参数本身;GA的搜索是从问题解的编码组开始搜索,而不是从单个解开始;GA使用目标函数值(适应度)这一信息进行搜索,而不需导数等其他信息;GA算法使用的选择、交叉、变异这三个算子都是随机操作,而不是确定规则。

遗传算法通过编码和遗传操作,达到了处理的并行性,可以同时处理群体中的多个个体,即同时对搜索空间内的多个解进行评估,具有较好的全局搜索性能,减少了限于局部最优解的风险。

3.遗传算法用于频率分配

3.1算法的基本流程

采用遗传算法的FAP基本流程

3.2遗传算子的选择

3.2.1选择算子

选择算子在父代群体中选出父体和母体。生物界中,父母亲素质比较高的其后代素质高的概率也大。模拟这种现象,在FAP中选择算子采用轮赌算法实现。

轮赌算法流程如下:

sum=0;i=0;

wheelpos=rand()*sumfitness;

for(sum<wheelpos&&i<pop-size)

i++;

if(i≥pop-size)

sum=0;i=0

wheelpos=rand()*sumfitness;

j=rand()*pop-size;

sum+=fitness[j];

returnj;

3.2.2交叉算子

交叉算子让父体和母体互相交换某部分基因而产生下一代个体的雏形,起全局搜索的作用。交叉算子通常有单点交叉、双点交叉、多点交叉等等。在频率自动分配的算法中,为了不破坏基因段内部频点间的关系,采用单点交叉和双点交叉比较合适。此外,在生物界中并不是两个个体相遇了就一定会结合,模拟此现象,引入交叉因子pc。

其基本流程如下:

//flip函数中,产生一个0到1的随机数,若小于pc,则返回1,否则返回0

if(flip(pc))

crossover1(mother,father);

elseif(flip(pc))

crossover2(mother,father);

else

copy(mother);

copy(father);

3.2.3变异算子

变异算子对后代个体的某些基因进行变异,起局部搜索的作用.生物界中,父母的染色体交叉后产生后代个体的染色体雏形,这个雏形在成长过程中会发生基因的变异,正是这种变异使得下一代的群体中会出现各种特征的个体.另外,生物界中并非每个基因都会变异,模拟此现象,引入变异因子pm,使用方法与交叉因子类似。

其基本流程如下:

while(allfrequentpoint)

{

if(flip(pm))mutate(frequentpoint);}

4.工程上需要注意的问题

4.1初始候选种群

由于遗传算法和其它启发式算法一样,不对全部解空间进行穷举搜索,因此初始的候选解群体的选择会对得到最终解的速度和质量有影响。初始的候选解群体在解空间内分布得越均匀,它们拥有的遗传基因就越有代表性。实践中采用文献[7]的GECP得到以各个顶点为主顶点的可行解作为初始候选种群。

4.2编码方案

编码就是用一种数字排列方案来表示问题的解的方法,利用编码将问题的解空间映射到GA算法的编码空间。编码方案的选择依赖于问题的性质,并影响到算法内操作的设计,是影响算法性能的重要因素。常见的编码方案有二进制编码、十进制编码、实数编码等。频率分配问题适合采用十进制编码方案,每个码表示一条通信链路,码值表示分配的信道编号。

4.3适配值函数

适配值函数对个体(频率分配方案)进行评价,也是优化过程发展的依据。可以采用如下方式来计算适应度:

fitness=1000/Σ(pri×seperate(Freq))。

其中:

pri是节点的加权值;

函数seperate(Freq)是节点中各条链路发频率同其它链路的收频率间隔的和;

参考文献:

[1]RobertA.Murphey,PanosM.Pardalosetc,FrequencyAssignmentProblems,Handbookofcombinatorialoptimization,KluwerAcademicPublishers,1999

[2]VittorioM.,AntonellaC.,AnANTSHeuristicfortheFrequencyAssignmentProblem,csr.unibo.it

[3]JoeBater,PeterJeavons,DavidCohen,ArethereoptimalreusedistanceconstraintsforFAPswithrandomTxplacement?,CSD-TR-98-01,CSRoyalHollowayUni.OfLondon,1998

[4]K.IAardal,C.A.J.Hurkens,J.K.etc.AlgorithmsforFreequencyAssignmentProblems,CWIQuarterly,Vol9(1&2),1996

[5]王凌:《智能优化算法及其应用》清华大学出版社2001

[6]陈国良等:《遗传算法及其应用》人民邮电出版社1996

[7]孙俊柏:禁用频点、频段下野战通信网的频率分配中国科学技术大学硕士学位论文1998