开云·Kaiyun「网页版」官方网站开云·Kaiyun「网页版」官方网站

中文

### 基因组大小与遗传信息

基因组,作为生物体内遗传信息的载体,其大小与复杂程度一直是生物学研究的热点话题。本文将从基因组大小与物种进化、基因组的结构组成、以及最新研究热点三个方面,探讨基因组大小与遗传信息之间的关系。

基因组大小与物种进化

生物的进化过程中,基因组作为遗传信息的载体,其大小在一定程度上反映了物种的复杂程度。已有的数据显示,基因组的大小同物种的进化程度之间存在一定的正相关关系。例如,NCBI基因组数据库已收录了16092个物种的基因组,按病毒、原核生物和真核生物三大类分别统计,虽然各类的极值多有重叠,但就均值和中值而言,病毒<原核生物<真核生物,基因组大小峰值分属3个不同的区域。这表明,在大尺度分类下,基因组大小和物种复杂程度在总的趋势上是呈正相关性的。然而,这并不意味着基因组越大,生物进化就越高等,因为存在所谓的“C值悖论”,即一些物种的基因组大小差异远远大于其进化程度的差异。例如,河豚的基因组大约为340Mb,而同为硬骨鱼类的非洲肺鱼,其基因组长度为130Gb,大380倍以上,也是人类的基因组(3.2Gb)的40倍。

基因组的结构组成

基因组的大小变化包括基因大小和数目的变化以及基因间区数量的变化。基因是细胞行使生理功能的主要分子基础,它决定了物种的基本特性。而基因间区,即非编码DNA序列,虽然不直接编码蛋白质,但近年来的研究表明,其中有相当一部分可以转录成具有生物学功能的RNA,对物种的进化和适应环境具有重要作用。以人类为例,人类核基因组大小约为3200Mb,含有2万~2.5万个基因,但直接编码基因的外显子只占总基因组序列的1.5%,基因相关序列占总基因组的36%,主要包括假基因、基因片段、内含子以及非翻译区;人类核基因组50%以上由重复序列构成。这些数据表明,基因组中非编码区的比例远大于编码区,非编码区的存在增强了物种对环境的适应潜力。

最新研究热点:T2T基因组与泛基因组

随着测序技术的飞速发展,尤其是长读长测序技术的出现,基因组测序的准确性和完整性得到了极大提升。T2T(Telomere-to-Telomere)基因组是指结合多种测序技术,实现一条或多条染色体端粒到端粒水平组装的0 gap基因组。实现完美基因组的组装,有利于对基因组中高度重复序列区域进行深入研究,有利于解析着丝粒和端粒等复杂结构的变异特征和进化模式。例如,2025年研究者以日本晴为材料,结合高深度HiFi测序和ONT测序,完成了水稻基因组的完整组装,其基因组大小为385.7Mb,新增了12.5Mb的基因组序列,主要解锁了水稻基因组中结构最为复杂的rDNA序列、着丝粒区域、复杂TE序列和端粒区域等。

另一方面,泛基因组的研究也日益受到重视。泛基因组是指整合同一种内多个个体的基因组信息,建立能够尽可能多囊括该物种基因组序列和信息的完整集合。这有助于全面理解关键物种中重要性状的形成机制。例如,2025年的一项研究采用PacBio和Hi-C等测序技术完成了18个代表性茶树品种的高质量基因组组装,并对4个已发表的茶树基因组进行重新注释,构建了茶树泛基因组,并基于茶树泛基因组对155个重测序样本的芽期性状进行全基因组关联分析,揭示了pan-GWAS在识别茶树性状相关遗传变异方面的效率。

综上所述,基因组大小与遗传信息之间的关系是一个复杂而有趣的话题。随着测序技术的不断进步和研究的深入,我们对基因组的认知将更加全面和深入。这不仅有助于揭示生命的奥秘,更为人类的健康、农业育种等领域带来了广阔的应用前景。未来,我们可以期待更多关于基因组大小与遗传信息的精彩发现。

基因组大小与遗传信息


返回列表