科学家的观点：人类基因少是因为使用效率高-范文科普网

科学家的观点：人类基因少是因为使用效率高

更新时间：2024-04-19 11:06:34

人类基因组(英语：Humangenome)又译人类基因体。是智慧人种(Homosapiens)的基因组。共组成24个染色体，分别是22个体染色体、X染色体与Y染色体。含有约30亿个DNA碱基对。碱基对是以氢键相结合的两个含氮碱基，以A、T、C、G四种碱基排列成碱基序列。其中一部分的碱基对组成了大约20000到25000个基因。

全世界的生物学与医学界在人类基因组计划中，调查人类基因组中的真染色质基因序列。发现人类的基因数量比原先预期的更少，其中的外显子，也就是能够制造蛋白质的编码序列，只占总长度的1.5%。

现代遗传学家认为，基因是DNA(脱氧核糖核酸)分子上具有遗传效应的特定核苷酸序列的总称，是具有遗传效应的DNA分子片段。基因位于染色体上，并在染色体上呈线性排列。基因不仅可以通过复制把遗传信息传递给下一代，还可以使遗传信息得到表达。不同人种之间头发、肤色、眼睛、鼻子等不同，是基因差异所致。

人类只有一个基因组，大约有5-10万个基因。人类基因组计划是美国科学家于1985年率先提出的，旨在阐明人类基因组30亿个碱基对的序列，发现所有人类基因并搞清其在染色体上的位置，破译人类全部遗传信息，使人类第一次在分子水平上全面地认识自我。计划于1990年正式启动，这一价值30亿美元的计划的目标是，为30亿个碱基对构成的人类基因组精确测序，从而最终弄清楚每种基因制造的蛋白质及其作用。打个比方，这一过程就好像以步行的方式画出从北京到上海的路线图，并标明沿途的每一座山峰与山谷。虽然很慢，但非常精确。

随着人类基因组逐渐被破译，一张生命之图将被绘就，人们的生活也将发生巨大变化。基因药物已经走进人们的生活，利用基因治疗更多的疾病不再是一个奢望。因为随着我们对人类本身的了解迈上新的台阶，很多疾病的病因将被揭开，药物就会设计得更好些，治疗方案就能“对因下药”，生活起居、饮食习惯有可能根据基因情况进行调整，人类的整体健康状况将会提高，二十一世纪的医学基础将由此奠定。

利用基因，人们可以改良果蔬品种，提高农作物的品质，更多的转基因植物和动物、食品将问世，人类可能在新世纪里培育出超级物作。通过控制人体的生化特性，人类将能够恢复或修复人体细胞和器官的功能，甚至改变人类的进化过程。

人类基因组计划的目的

测出人类基因组DNA的30亿个碱基对的序列,发现所有的人类基因,找出它们在染色体上的位置,破译人类全部遗传信息.

【组成】

染色体

人类基因组是由23对染色体(共46个)所构成，每一个染色体皆含有数百个基因，在基因与基因之间，会有一段可能含有调控序列和非编码DNA的基因间区段。人类拥有24种不同的染色体，其中有22个属于体染色体，另外还有两个能够决定性别的性染色体，分别是X染色体与Y染色体。1号到22号染色体的编号顺序，大致符合他们由大到小的尺寸排列。最大的染色体约含有2亿5千万个碱基对，最小的则约有3800万个碱基对。这些染色体通常以细丝状存于细胞核内，若将单一细胞内的染色体拉成直线，那麼将大约有6英尺长(1英尺=30.48公分)。

在人类个体的体细胞中，通常含有来自亲代的1到22对体染色体，再加上来自母亲的X染色体，以及来自父亲的X或Y染色体，总共是46个(23对)染色体。科学家将这些染色体分为6组：1号到3号是A组;4号与5号是B组;X染色体以及6号到12号是C组;13号到15号是D组;16号到18号是E组;19号与20号是F组;21号、22号与Y染色体是G组[4]。对于一般人类来说，每个细胞核内只有两套染色体。

基因

人类与其他物种的基因组比较(大约)

物种碱基对数量基因数量

Mycoplasmagenitalium黴浆菌(生殖器支原体)580,000500

Streptococcuspneumoniae肺炎双球菌2,200,0002,300

Haemophilusinfluenzae流感嗜血杆菌4,600,0001,700

Escherichiacoli大肠杆菌4,600,0004,400

Saccharomycescerevisiae酿酒酵母12,000,0005,538

Caenorhabditiselegans秀丽隐杆线虫97,000,00018,250

Arabidopsisthaliana阿拉伯芥(拟南芥)125,000,00025,500

Drosophilamelanogaster黑腹果蝇180,000,00013,350

Oryzasativa亚洲稻466,000,00045,000-55,000

Musmusculus家鼠2,500,000,00029,000

Homosapiens人类2,900,000,00027000

人体内估计约有20000到25000个蛋白质编码基因。原本这个估计的数目超过100000，在更好的基因组序列品质与基因识别技术出现之後，才逐渐向下修正为现在的数字。虽然人类的基因数量比起某些较为原始的生物更少，但是在人类细胞中使用了大量的选择性剪接(alternativesplicing;将穿插在内含子中的外显子以选择性的方式进行转录)，这使得一个基因能够制造出多种不同的蛋白质，且人类的蛋白质组规模也较前述的两个物种更庞大。也就是说，长期的进化，使得基因的编码效率更高了。

大多数人类基因拥有许多的外显子，且人类的内含子比位在其两端的外显子更长。这些基因参差不齐地分布在染色体中，每一个染色体皆含有一些基因较多的区段与基因较少的区段。这些区段的差异，则与染色体带(chromosomebands)及GC含量相关。基因密度所显现的非随机模式之涵义与重要性尚未明了。

除了蛋白质编码基因之外，人类的基因组还包含了数千个RNA基因(由RNA组成)，其中包括用来转录转运RNA(tRNA)、核糖体RNA(rRNA)与信使RNA(mRNA)的基因。其中转录rRNA的基因称为rDNA，分布在许多不同的染色体上。

调控序列

人类基因组含有许多不同的调控序列，并以此来控制基因表现。这些序列是典型的短序列，会出现在靠近基因的位置。由于高通量表达(high-throughputexpression;指利用电脑与机器辅助以进行大量的序列分析)技术与比较基因组学研究的出现，人们开始系统性地了解这些调控序列，以及它们共同构成的基因调控网路(generegulatorynetwork)。

人们之所以能够出辨认哪些基因序列是调控序列，是因为生物在演化过程中对基因的保留。以大约7千万年前到9千万年前分支的人类与老鼠为例：若以电脑比较两者的基因序列，并且将两者皆保有的非编码序列辨识出来，就可以知道哪些基因序列可能对于基因调控来说相当重要。

人类所拥有的调控序列所在位置，可以利用河豚的基因定位出来。因为河豚与人类拥有相同的基因，同时也拥有和人类相同的调控序列，但是「垃圾」基因比人类更少。如此较为简洁的DNA序列，使得调控基因的位置较容易定位。

其他DNA

蛋白质编码序列(也就是外显子)在人类基因组中少于1.5%。在基因与调控序列之外，仍然有许多功能未知的广大区域。科学家估计这些区域在人类基因组中约占有97%，其中许多是属于重复序列(repeatedsequence)、转位子(transposon)与伪基因(pseudogene)。除此之外，还有大量序列不属于上述的已知分类。

这些序列大多数可能是演化的产物，现在已经没有作用，也因此有时会被称作是「垃圾DNA」(junkDNA)[9]。不过有一些迹象显示，这些序列可能会经由某些仍然未知的方式产生作用。最近一些使用微阵列技术所作的实验发现，大量非基因DNA事实上会被转录成为RNA[10]，这显示转录作用背後可能还存在一些未知的机制。此外，不同种类的哺乳动物在演化的过程中共同保留了这些序列，也显示基因组中还有很多作用未知的部分。人类基因组内大量功能未知的序列，是目前科学研究的重点之一。

变异

大多数对于人类遗传变异的研究集中在单一核苷酸多型性(singlenucleotidepolymorphisms;SNPs)，也就是DNA中的个别碱基变换。科学家分析估计，在人类的真染色质(富含基因的染色质)中，平均每100到1000个碱基会出现1个SNPs，不过密度并不均匀。由于SNPs的存在，如「所有人类的基因有99%都是相同的」一的说法并不精确。国际人类基因组单体型图计划(InternationalHapMapProject)，便是为了要将人类基因组中的SNP变异作编录，而组成的一个大规模合作计划。

基因组中有一些小型的重复序列，它们所拥有的基因座与基因长度，在不同的人类个体之间有很大的变异性。这也是DNA指纹(DNAfingerprinting)与亲子鉴定(paternitytesting)技术得以应用的基础。异染色质(heterochromatin)是人类基因组的一些部分，总共包括有数百万个碱基对，这些碱基对在人类族群之中的变异性也相当大。而且由于异染色质的重复性很高而且长度很长，因此目前的技术仍然无法精确地解出它们的序列。此外异染色质不含基因，对于表现型也没有显著的作用。

配子细胞中大多数的基因组突变，可能会造成胚胎不正常发育，而人类的一些疾病也与大尺度的基因组异常有关。例如唐氏症、透纳氏症(TurnerSyndrome)，以及许多其他疾病，是染色体的不分离(nondisjunction)现象所造成。在癌细胞中的染色体，则是频繁地出现非整倍性(aneuploidy)现象，不过这种现象与癌症之间的关系仍然不明。

2006年一篇发表在《自然》的研究报告中，研究人员发现在人类与其他哺乳类DNA序列中的拷贝数变异(copynumbervariation;CDV)，可能非常重要。拷贝数变异又称为拷贝数多型性(copynumberpolymorphisms;CNPs)，是删除、插入(insertion)、复写(duplication)，以及复杂多位置变异(complexmulti-sitevariants)的合称，在所有人类以及其他已测试的哺乳动物中皆可发现。

粒线体基因组

大多数的基因是存在细胞核中，但是细胞中一个称为粒线体的胞器，也拥有自己的基因组。粒线体基因组在粒线体疾病(mitochondrialdisease)中具有一定的重要性。而且这些基因也可以用来研究人类的演化，举例而言，若分析人类粒线体基因组的变异情况，将能够使科学家描绘出人类的共同祖先，称为「粒线体夏娃」(MitochondrialEve)。之所以称为夏娃，是因为粒线体是位于细胞质中，而人类的精子与卵子结合时，源自母亲(女性)的卵子提供了绝大多数的细胞质，因此人类细胞中的粒线体基因皆是来自母亲。

由于粒线体缺乏用来检查复制错误的能力，因此粒线体DNA(mDNA)的变异速率比细胞核DNA(一般所指的DNA)更快。粒线体的突变速率快了20倍，这使mDNA能够用来较为精确地追溯出母系祖先。研究族群中的mDNA，也能使人们得知此族群过去的迁移路径，例如来自西伯利亚的美洲原住民;以及来自东南亚的波里尼西亚人。更有甚者，mDNA研究显示在欧洲人的基因中并无参杂尼安德塔人的DNA。

与每个细胞核皆只有两套染色体组成的核基因组不同，粒线体基因组在每个粒线体当中，皆有大约10个以环状DNA，整个细胞里则约有8000个。每个环DNA上有16569个碱基对，共组成37个基因，其中13个是蛋白质编码，22个是RNA基因。这些基因大多与呼吸作用有关。

【遗传疾病】

当一个或多个基因发生不正常表现时，便可能会使某个相对应的表型产生一些症状。遗传异常的原因包括了基因突变、染色体数目异常，或是三联体扩张重复突变(tripletexpansionrepeatmutations)。如果受损的基因会从亲代遗传到子代，那就会成为一种遗传性疾病。目前已知有大约4000种遗传疾病，囊肿性纤维化是其中最普遍的疾病之一。

科学家通常会以群体遗传学的方法进行遗传疾病的研究，对于疾病的治疗，则是由一些经过临床遗传学训练，且同时也是遗传学家的医生来进行。人类基因组计划的成果，使遗传检测技术能够更有效地检查出一些与基因有关的疾病，并且改进治疗方法。父母能够透过遗传咨询来侦询一些遗传症状的严重性、遗传的机率，以及如何避免或是改善这些症状。

基因剂量(Genedosage)会对人类的表现型产生庞大的影响，对于染色体中造成疾病的复写、省略与分裂等现象的形成拥有一定的角色。例如唐氏症患者(21号染色体为三体)有较高的比率得到阿兹海默症，可能是因为与阿兹海默症有关的类淀粉前趋蛋白基因(位在21号染色体上)的过度表现所致。而且相对而言，唐氏症患者中则有较低的比率得到乳癌，可能是因为肿瘤抑制基因(tumor-suppressorgene)的过度表现。

【演化】

比较基因组学(Comparativegenomics)对于哺乳类基因组的研究显示，人类与大约两亿年前就已经分化的各物种相比，有大约5%的比例在人类基因组中保留了下来，其中包含许多的基因与调控序列。而且人类与大多数已知的脊椎动物间，也享有了一些相同的基因。

黑猩猩的基因组与人类的基因组之间，有98.77%是相似的。而平均每一个属于人类的标准蛋白质编码基因，只与属于黑猩猩的同源基因相差两个氨基酸;并且有将近三分之一的人类基因与黑猩猩的同源基因，能够转译出相同的蛋白质。人类的2号染色体，是人类与黑猩猩基因组之间的主要差异，这一条染色体是由黑猩猩的染色体12号与13号融合而成。

人类在晚近的演化过程中失去了嗅觉受器基因，这解释了为何人类比起其他的哺乳动物来说，拥有较差的嗅觉。演化上的证据显示，人类与某些灵长类所拥有的彩色视觉，降低了这些物种对于嗅觉能力的需求。

【研究】

人类基因组计划

罗纳德·杜尔贝科(RenatoDulbecco;主要研究基因与肿瘤的关系)是最早提出人类基因组定序的科学家之一。他认为如果能够知道所有人类基因的序列，对于癌症的研究将会很有帮助。不过以1986年的技术而言，若要将所有人类的DNA都定序完成，需要花上1500年。美国能源部(DOE)与美国国家卫生研究院(NIH)，分别在1986年与1987年加入人类基因组计划。除了美国之外，日本在1981年就已经开始研究相关问题，但是并没有美国那样积极。

到了1988年，詹姆士·华生(JamesD.Watson;DNA双螺旋结构发现者之一)成为NIH的基因组部门主管。1990年开始国际合作。1996年，多个国家招开百慕大会议，以2005年完成定序为目标，分配了各国负责的工作，并且宣布研究结果将会即时公布，并完全免费。

1998年，克莱格·凡特的(CraigVenter)塞雷拉基因组公司成立，而且宣布将在2001年完成定序工作。随後国际团队也将完成工作的期限提前。2000年6月26日，塞雷拉公司的代表凡特，以及国际合作团队的代表法兰西斯·柯林斯(FrancisCollins)，在美国总统柯林顿的陪同下发表演说，宣布人类基因组的概要已经完成。2001年2月，国际团队与塞雷拉公司，分别将研究成果发表于《自然》(Nature)与《科学》(Science)两份期刊。

在基因组计划的研究过程中，塞雷拉基因组使用的是霰弹枪定序法(shotgunsequencing)，这种方法较为迅速，但是仍需以传统定序来分析细节。

范文网专稿内容，转载请注明出处

来源链接:http://www.fanwen7.com/kepu_2816/

不够精彩？

再来一篇

上一篇 : 十亿年前每一年至少有500天

下一篇 : 抗传染病史话：人类有能力征服各种传染病

网友关注科普知识