您好,欢迎访问三七文档
分子进化分析与相关进化模式例子分子进化分析介绍系统发育树重建方法相关进化模式例子从物种的一些分子特性出发,从而了解物种之间的生物系统发生的关系。蛋白和核酸序列通过序列同源性的比较进而了解基因的进化以及生物系统发生的内在规律。分子进化研究的目的系统发育树是什么?对一组实际对象的世系关系的描述(如基因,物种等)。一个系统发育树末端物种顶端中间节点中间枝条根末端分支叶子节点ABCDE†FG树只代表分支的拓扑结构FGCDE†AB分子进化研究的基础(假设)核苷酸和氨基酸序列中含有生物进化历史的全部信息。在各种不同的发育谱系及足够大的进化时间尺度中,许多序列的进化速率几乎是恒定不变的。(分子钟理论,1965)分子进化研究的基础(理论)虽然很多时候仍然存在争议,但是分子进化确实能阐述一些生物系统发生的内在规律。分子进化研究的基础(实际)从一个分歧数据可以推测其他序列分歧度分歧时间xy分子钟理论直系同源(orthologs):同源的基因是由于共同的祖先基因进化而产生的.旁系同源(paralogs):同源的基因是由于基因复制产生的.(以上定义源自Fitch,W.M.(1970)Distinguishinghomologousfromanalogousproteins.Syst.Zool.19,99–113)直系同源与旁系同源paralogsorthologsparalogsorthologsErikL.L.SonnhammerOrthology,paralogyandproposedclassificationforparalogsubtypesTRENDSinGeneticsVol.18No.12December2002–seefrontmatter©2002ElsevierScienceLtd.Allrightsreserved.以上两个概念代表了两个不同的进化事件用于分子进化分析中的序列必须是直系同源的,才能真实反映进化过程。趋同进化的基因(geneshaveconvergedfunctionbyseparateevolutionarypaths)异源基因或水平转移基因(xenologousorhorizontallytransferredgenes)Bacterium1Bacterium3Bacterium2Eukaryote1Eukaryote4Eukaryote3Eukaryote2Bacterium1Bacterium3Bacterium2Eukaryote1Eukaryote4Eukaryote3Eukaryote2Phylogramsshowbranchorderandbranchlengths进化树,有分支和支长信息2.进化分支图,进化树Cladogramsshowbranchingorder-branchlengthsaremeaningless进化分支图,只用分支信息,无支长信息。Rootedbyoutgrouparchaeaarchaeaarchaeaeukaryoteeukaryoteeukaryoteeukaryotebacteriaoutgrouprooteukaryoteeukaryoteeukaryoteeukaryote无根树archaeaarchaeaarchaeaMonophyleticgroup(单源群)Monophyleticgroup3.有根树,无根树,外围群有根树外围群4.基因树,物种树WeoftenassumethatgenetreesgiveusspeciestreesabcABDGenetreeSpeciestree系统发育树重建分析步骤多序列比对(自动比对,手工比对)建立取代模型(建树方法)建立进化树进化树评估系统发育树重建的基本方法最大简约法(maximumparsimony,MP)距离法(distance)最大似然法(maximumlikelihood,ML)Bayes法最大简约法(MP)最大简约法(maximumparsimony,MP)最早源于形态性状研究,现在已经推广到分子序列的进化分析中。最大简约法的理论基础是奥卡姆(Ockham)哲学原则,这个原则认为:解释一个过程的最好理论是所需假设数目最少的那一个。对所有可能的拓扑结构进行计算,并计算出所需替代数最小的那个拓扑结构,作为最优树。序列个数与树的个数的关系优点:最大简约法不需要在处理核苷酸或者氨基酸替代的时候引入假设(替代模型)。此外,最大简约法对于分析某些特殊的分子数据如插入、缺失等序列有用。最大简约法(MP)缺点:在分析的序列位点上没有回复突变或平行突变,且被检验的序列位点数很大的时候,最大简约法能够推导获得一个很好的进化树。然而在分析序列上存在较多的回复突变或平行突变,而被检验的序列位点数又比较少的时候,最大简约法可能会给出一个不合理的或者错误的进化树推导结果。最大简约法(MP)距离法距离法又称距离矩阵法,首先通过各个物种之间的比较,根据一定的假设(进化距离模型)推导得出分类群之间的进化距离,构建一个进化距离矩阵。进化树的构建则是基于这个矩阵中的进化距离关系。计算序列的距离,建立距离矩阵通过距离矩阵建进化树一种简单的距离矩阵由进化距离构建进化树的方法有很多,常见有:1.Fitch-MargoliashMethod(FM法)2.Neighbor-JoiningMethod(NJ法/邻接法)3.NeighborsRelatonMethod(邻居关系法)4.UnweightedPairGroupMethod(UPGMA法)通过矩阵建树的方法最大似然法(ML)最大似然法(maximumlikelihood,ML)最早应用于系统发育分析是在对基因频率数据的分析上,后来基于分子序列的分析中也已经引入了最大似然法的分析方法。最大似然法分析中,选取一个特定的替代模型来分析给定的一组序列数据,使得获得的每一个拓扑结构的似然率都为最大值,然后再挑出其中似然率最大的拓扑结构作为最优树。在最大似然法的分析中,所考虑的参数并不是拓扑结构而是每个拓扑结构的枝长,并对似然率球最大值来估计枝长。最大似然法(ML)最大似然法的建树过程是个很费时的过程,因为在分析过程中有很大的计算量,每个步骤都要考虑内部节点的所有可能性。最大似然法是一个比较成熟的参数估计的统计学方法,具有很好的统计学理论基础,在当样本量很大的时候,似然法可以获得参数统计的最小方差。只要使用了一个合理的、正确的替代模型,最大似然法可以推导出一个很好的进化树结果。最大似然法(ML)碱基变化的通用模型由于最大似然法的分析过程需要耗费较多的时间,针对这种情况,发展出了许多优化的可以加快最大似然法寻找最优树的搜索方法,如启发式搜索,分枝交换搜索等。最大似然法具有坚实的统计学理论基础,充分的使用了分析序列中的信息资源,只要采用了合理的替代模型,可以得出很好的进化树分析结果。最大似然法(ML)选择外类群(Outgroup)选择一个或多个已知与分析序列关系较远的序列作为外类群外类群可以辅助定位树根外类群序列必须与剩余序列关系较近,但外类群序列与其他序列间的差异必须比其他序列之间的差异更显著。bacteriaoutgroupeukaryoteeukaryoteeukaryoteeukaryotearchaeaarchaeaarchaea外围群进化树的可靠性分析自展法(BootstrapMethod)从排列的多序列中随机有放回的抽取某一列,构成相同长度的新的排列序列重复上面的过程,得到多组新的序列对这些新的序列进行建树,再观察这些树与原始树是否有差异,以此评价建树的可靠性原始排列AlphaAACAACBetaAACCCCGammaACCAACDeltaCCACCAEpsilonCCAAACBootstrap1AlphaACAAACBetaACCCCCGammaACAAACDeltaCACCCAEpsilonCAAAACBootstrap2AlphaAAAACCBetaAACCCCGammaCCAACCDeltaCCCCAAEpsilonCCAACCBootstrap3AlphaACAAACBetaACCCCCGammaCCAAACDeltaCACCCAEpsilonCAAAAC分子进化模式1、专性胞内菌Rickettsia核心基因进化机制2、蓝藻二元信号转导中的环化酶进化机制3、蓝藻限制性修复系统进化机制4、苏云金芽孢杆菌杀虫蛋白进化机制5、SARS进化机制1、专性胞内菌Rickettsia核心基因进化机制2、蓝藻二元信号转导中的环化酶进化机制3、蓝藻限制性修复系统进化机制4、苏云金芽孢杆菌杀虫蛋白进化机制5、SARS进化机制此部分供同学们自学常见的分子进化分析程序1.Phylip由华盛顿大学遗传学系开发,是一个免费的系统发育分析软件包,可以通过以下地址下载。*最早是在苹果机上开发的具有菜单界面的进化分析软件,早先版本只有MP法,后续版本已经包括距离法和ML法,现今有mac,win,linux等多种版本,该软件不是免费软件,使用者需要向开发者购买。Phylip软件包介绍Phylip是一个免费的系统发生(phylogenetics)分析软件包。以下链接可以下载:由华盛顿大学遗传学系开发,1980年首次公布,目前的版本是3.6(2000年6月)。Phylip软件包介绍Phylip包含了35个独立的程序,这些独立的程序都实现特定的功能,这些程序基本上包括了系统发生分析的所有方面。Phylip有多种不同平台的版本(包括windows,Macintosh,DOS,Linux,Unix和OpenVMX)。Phylip是目前最广泛使用的系统发生分析程序,主要包括一下几个程序组:分子序列组,距离矩阵组,基因频率组,离散字符组,进化树绘制组。Phylip软件包介绍分子序列组:1.蛋白质序列:protpars,proml,promlk,protdist2.核酸序列:dnapenny,dnapars,dnamove,dnaml,dnamlk,dnainvar,dnadist,dnacompPhylip软件包分组介绍距离矩阵组:Fitch,kitsch,neighbor基因频率组:Gendist,contml离散字符组Pars,mix,move,penny,dollop,dolmove,dolpenny,clique,factorPhylip软件包分组介绍进化树绘制组:drawtree,drawgram其他:restdist,restml,seqboot,contrasttreedist,consense,retreePhylip软件包分组介绍Phylip软件包的文档是非常详细的,对于每个独立的程序,都有一个独立的文档,详细的介绍了该程序的使用及其说明。此外,Phylip软件包还包括程序的源代码(c语言)。Phylip软件包的文档Phylip软件包的应用1,根据你的分析数据,选择适当的程序如,你分析的是DNA数据,就在核酸序列分析类中选择程序(dnapenny,dnapars,dnamove,dnaml,dnamlk,dnainvar,dnadist,dnacomp)如果分析的是离散数据,如突变位点数据,就在离散字符组里面选择程序。2.选择适当的分析方法如你分析的是DNA数据,可以选择简约法(DNAPARS),似然法(DNAML,DNAMLK),距离法等(DNADIST)。。。Phylip软件包的应用3.进行分析选择好程序后,执行,读入分析数据,选择适当的参数,进行分析,结果自动保存为outfile,outtree。Phylip软件包的应用Outfile是一个记录文件,记录了分析的
本文标题:分子进化分析
链接地址:https://www.777doc.com/doc-4350870 .html