澳门新葡8455最新网站-点击进入

与蛋白编码基因相比,长非编码RNA的生物学功能是后基因组时代的热门话题。日前,澳门新葡8455最新网站基因组医学研究室和非人灵长类研究中心采用新一代测序技术,创建了恒河猴“一站式”基因组知识库RhesusBase,发现了长非编码RNA参与基因起源的新机制,首次提出长非编码RNA可能是孕育蛋白编码基因过程中的“半成品”(semi-product)。相关论文于近日发表于和。

人类基因组计划揭示, 占基因组95%以上的区域并不编码蛋白质, 长期以来被认为是没有功能的垃圾序列(Junk DNA)。然而,最新研究表明,某些非编码区域可以转录形成长非编码RNA,解读其生物学功能迅速成为该领域的前沿热点问题。而从比较基因组学角度,系统追溯基因及长非编码RNA起源过程,可为解开长非编码RNA之谜提供启迪。

恒河猴与人类分歧时间大约为2500万年,从进化距离上是研究这一问题的最佳模型。研究组对恒河猴全身组织进行了转录组测序,总测序片段数达到12亿条,对全转录组的覆盖度达到97%,在全基因组尺度上实现了对两万多个恒河猴基因的精细结构修正。论文的通讯作者李川昀博士指出,“正如我们猜想的那样,通过对数以亿计的恒河猴表达片段进行拼接和进一步的实验验证,我们发现现有数据库中近三分之一的基因结构注释存在错误”。研究组采用纠错修正后的精细基因组框架图,对近百个数据来源的基因功能信息进行整合,构建了一个集基因结构、表达、调控、遗传变异、疾病、功能及药物开发等信息于一体的、拥有56亿条独立注释信息的恒河猴“一站式”基因组知识库RhesusBase(),力争打造整合恒河猴研究的“一家店”()。

恒河猴基因组信息的完善,为认识人类基因的起源和调控提供了独特的视角。进一步的研究捕捉到了从长非编码RNA转变为蛋白编码基因的精彩过程:研究首次发现24个类人猿物种特有的蛋白编码基因(Hominoid-specific, 包括人类和黑猩猩),而在与人类近缘的恒河猴基因组中,这些基因绝大多数(83%)以长非编码RNA形式存在。更有意思的是,它们已具有与人类同源基因相似的转录结构和基因表达模式。研究者提出,部分长非编码RNA是蛋白编码基因的前体,处于向蛋白编码基因转化的过渡阶段。简言之,非编码RNA是新基因诞生的温床()。

上述发现对于完善基因起源理论、并从整体上理解长非编码RNA的生物学功能具有重要意义。我所二年级硕博连读研究生张仕坚和刘楚珺同学为RhesusBase论文的共同第一作者,三年级研究生陈加余同学为基因起源论文的共同第一作者之一。该研究项目由www.8455.com与澳门新葡8455最新网站-点击进入生命科学学院、中国科学院动物所等单位合作完成。


Ann, a five-year young female macaque, plays with a magic cube and has nearly completed the front side. Some hominoid-specific protein-coding genes may have originated from non-coding RNAs in the recent ancestor of rhesus macaque and human, given the similar transcript structure and expression profiles of orthologous coding or non-coding loci across species. These ancestral non-coding RNA transcripts then further gained coding potential through mutations in human evolution ().