您好,欢迎访问三七文档
第三章基因及基因组结构一、基因(gene)(一)定义生物学定义:——具有遗传功能的DNA片段。分子生物学定义:——DNA分子中含有特定遗传信息的核苷酸序列,是遗传物质的最小功能单位。合成有功能的多肽链或RNA所必需的全部核酸序列(通常是DNA序列)。(二)基因的组成一个基因应包含不仅是编码蛋白质肽链或RNA的核酸序列,还包括为保证转录所必需的调控序列、5′非翻译序列、内含子以及3′非翻译序列等所有的核酸序列(蛋白质基因和RNA基因)。(三)基因分类第一类是编码蛋白质的基因,它具有转录和翻译功能,包括编码酶和结构蛋白的结构基因以及编码阻遏蛋白的调节基因第二类是只有转录功能而没有翻译功能的基因,包括tRNA基因和rRNA基因第三类是不转录的基因,它对基因表达起调节控制作用,包括启动基因和操纵基因二、基因组(genome)(一)定义生物学定义:——细胞内所携带的全部遗传信息DNA的总和;对多倍体生物指单倍体DNA的总和。分子生物学定义:——携带生物体全部遗传信息的核酸量。编码蛋白的结构基因基因组DNA复制转录的调控序列功能尚不清楚的区域不同生物体中具有不同的基因组大小对人类而言:22+X+Y+mtDNA。virusesplasmidsbacteriafungiplantsalgaeinsectsmollusksreptilesbirdsmammalsGenomesizesinnucleotidepairs(base-pairs)10410810510610710111010109Thesizeofthehumangenomeis~3X109bp;almostallofitscomplexityisinsingle-copyDNA.Thehumangenomeisthoughttocontain~30,000to40,000genes.bonyfishamphibians(二)遗传物质组成病毒基因组核基因组原核生物基因组真核生物基因组线粒体DNA核外遗传物质叶粒体DNA质粒DNA非独立的基因组:转位因子----能在基因组DNA中移动的DNA序列,不能独立存在,需插入核或核外DNA中。(三)基因组结构与进化的关系:1.基因组的物质组成从多样→单一;DNA、RNA分工明确单链、双链,线状、环状→双链线状2.基因组由小→大;3.DNA的利用率越来越低;(多拷贝、非编码区、基因不连续)4.调控序列增多,调控方式更复杂。第一节病毒基因组的结构(一)病毒的基本结构外壳蛋白:识别、侵袭特定的宿主细胞,并保护基因组不被核酸酶破坏;DNA(RNA):编码结构蛋白和少量调控蛋白。不能独立复制,必需进入宿主细胞,借助细胞内一些酶类和细胞器才能得以复制。(二)病毒基因组的结构特点:1.基因组较小,大小差异较大;CAVDNA2.3kb,编码3种蛋白质乙肝病毒RNA3kb,编码4种蛋白质痘病毒DNA300kb,编码几百种蛋白基因组越小,编码蛋白越少,对寄主依赖性越大。2.化学组成多样DNA病毒、RNA病毒单链、双链线状、环状分节段、不分节段单链环状DNA,基因组共5386个核苷酸,构成3个转录单元,共编码11个蛋白质,总分子量为25万左右,相当于6078个核苷酸所容纳的信息量。其中非编码序列只有217/5386,不足5%。3.基因重叠现象普遍存在重叠基因定义:核苷酸序列彼此重叠的2个基因为重叠基因overlappinggenes,或称嵌套基因nestedgenes。类型:①一个基因的核苷酸序列完全包含在另一个基因中;②两个基因的核苷酸序列部分重叠;③两个基因只有一个碱基重叠。一个基因终止密码子的最后一个碱基是另一个基因起始密码子的第一个碱基。5’…GCTGGTGGAAAATGAGGAAATTCAAT…3’DNA序列LeuValGluAsnGluGluIleGlnK蛋白AlaGlyGlyLysTerA蛋白FMetArgLysPheAsnC蛋白噬菌体G4一段DNA序列内A、C、K基因三重重叠基因读框相同,只是起始部位不同重叠基因实质:两个基因虽共用一段核苷酸序列,但其读码结构互不相同,编码不同的蛋白质。意义:使DNA的利用率提高,是基因表达调控的方式之一。目前,在少数原核生物(大肠杆菌、病毒)中发现,在少数真核生物中也发现了类似的基因重叠现象(果蝇)。4.结构简练大部分可编码蛋白质,只有非常小的一部份不编码蛋白质(通常是基因表达的控制序列)(非编码序列较少);ΦX174DNA中不翻译的部份只占217/5375G4DNA中不翻译的部份占282/5577乳头瘤病毒基因组中不翻译的部份占1.0/8.0Kb5.基因组中功能基因丛集成一个或几个特定区域,形成一个功能单位或转录单元,即形成多顺反子结构(polycistronie)。多顺反子mRNA:可编码两条或两条以上蛋白质分子的mRNA的分子。6.除反转录病毒外,病毒基因组只有一个拷贝;7.有的病毒基因组中具有宿主细胞基因组的结构特点;比如:某些病毒基因组中的原癌基因与宿主细胞具有类似结构。第二节原核生物基因组结构(一)细菌基因组的结构特点:1.拟核(类核)结构;2.存在多顺反子结构;3.除RNA基因外,基本是单拷贝的;利于核糖体的快速组装,短时间内合成大量核糖体。4.非编码序列相对较少;(相对于真核生物)5.基因多是连续的;6.存在不同的功能识别区复制起始区、复制终止区等大肠杆菌的类核结构核中央由支架蛋白和RNA组成,环状双链DNA绕在支架蛋白的外围,只有一个复制起点,DNA与细胞膜粘在一起DNA上有结合蛋白。(二)大肠杆菌基因组结构:1.基因组DNA在4000kb,估计有3500个基因,已确定的基因有900个,已确定有260个基因具有操纵子结构(75个操纵子中),每个基因平均长度1000bp;2.已确定的基因中,多数是与代谢有关的酶、核糖体蛋白;3.大多数基因是随机分布的,两条单链作为模板的概率基本相等;4.多数基因都是单拷贝。第三节真核生物核基因组(一)真核生物核基因组特点1.基因组较大;低等真核生物:107-108bp,较原核生物大10倍;高等真核生物:5X108-1010bp,某些植物和两栖生物可达1011bp;哺乳类生物大于2X109它们可编码100万个基因。NucleosomestructureNucleosomecore(left)•146bpDNA;13/4turnsofDNA•DNAisnegativelysupercoiled•twoeach:H2A,H2B,H3,H4(histoneoctomer)Nucleosome(right)•~200bpDNA;2turnsofDNAplusspacer•alsoincludesH1histone2.真核生物核DNA与蛋白质结合,形成核小体,再缠绕成染色质(染色体);Nucleofilamentstructure3.基因组一般为双倍体(diploid);4.基因为单顺反子。单顺反子:一个基因单独转录,一个基因一条mRNA,翻译成一条多肽链;5.存在大量重复序列,重复次数可高达百万倍;6.基因组中非编码序列多于编码序列,有大量的冗余DNA;7.大部分基因有内含子,因此基因不连续;8.具有多个复制起点,而每个复制子的长度较小。真核生物基因组的突出特点:重复性、基因家族、不连续性。PropertiesofthehumangenomeNuclear•thehaploidhumangenomehas~3X109bpofDNA•single-copyDNAcomprises~75%ofthehumangenome•thehumangenomecontains~30,000to40,000genes•mostgenesaresingle-copyinthehaploidgenome•genesarecomposedoffrom1to75exons•genesvaryinlengthfrom100to2,300,000bp•AlusequencesarepresentthroughoutthegenomeMitochondrial•circulargenomeof~17,000bp•contains40genesTypeofDNA%ofGenomeFeaturesSingle-copy(unique)~75%Includesmostgenes1RepetitiveInterspersed~15%Interspersedthroughoutgenomebetweenandwithingenes;includesAlusequences2andVNTRsormini(micro)satellitesSatellite(tandem)~10%Highlyrepeated,lowcomplexitysequencesusuallylocatedincentromeresandtelomeres1Somegenesarerepeatedafewtimestothousands-foldandthuswouldbeintherepetitiveDNAfraction。2Alusequencesareabout300bpinlengthandarerepeatedabout300,000timesinthegenome.Theycanbefoundadjacenttoorwithingenesinintronsornontranslatedregions.501000IIIIIIIIIfast~10%intermediate~15%slow(single-copy)~75%ClassesofrepetitiveDNAInterspersed(dispersed)repeats(e.g.,Alusequences)TTAGGGTTAGGGTTAGGGTTAGGGTandemrepeats(e.g.,microsatellites)GCTGAGGGCTGAGGGCTGAGG间隔重复序列串联重复序列(二)重复性(重复序列)复杂度(X)是指在基因组DNA分子中无重复核苷酸序列的最大长度。例如,(ATAT)n的复杂度为2,(ATGC)n的复杂度为4,噬菌体T4是由2×105不重复核苷酸对的DNA分子组成,其复杂度为2×105。C0t1/2值是复性反应进行到一半时,单链DNA初始浓度和所需时间的乘积,C0t1/2值越大表明复性反应越慢,重复序列少,所以C0t与DNA中非重复序列的核苷酸数量成正比。来自不同生物的DNA,如果反应条件和DNA片段大小相同,则复杂度越大,复性速度就越慢,而C0t1/2值就越大。也就是说,基因组的复杂度与其C0t1/2值成正比,即:x=ɑC0t1/2基因的重复次数=实际长度/DNA复杂度真核生物DNA复性的各项参数序列种类占基因组DNA的比例C0t1/2值复杂度(X)重复频率(f)高度重复25%0.0013340bp500000中度重复30%1.96.0×105bp350单一序列45%6303.0×108bp1据基因组重复次数高低:单拷贝序列轻度重复序列2~101重复序列中度重复序列10~102高度重复序列102~1061.单拷贝序列:只有一个拷贝,占基因组的40-70%.主要是功能基因。单拷贝序列又称为非重复序列,在一个基因组中只有一个拷贝,在DNA复性曲线中,它是最慢速复性的部分。大多数结构基因都属于这一类型,但单拷贝序列并不都执行遗传功能。真核生物的单拷贝基因是分散分布于整条染色体或不同染色体之中的。一个蛋白质基因也常分成几段相隔排列。由几个肽段的基因组成一个蛋白质的全部基因,有些肽段的基因仅由内含子隔开,而另一些肽段的基因则分布于几条染色体上。例如,珠蛋白有2条α链和2条β链,在人类中,α链基因位于16号染色体上,β链基因则位于11号染色体上。在β链基因中,又由几个内含子隔开
本文标题:基因及基因组结构
链接地址:https://www.777doc.com/doc-3946513 .html