近日,中国科学院昆明动物研究所研究员张国捷及其团队,联合深圳华大生命科学研究院、丹麦哥本哈根大学等多家单位,在《自然》以封面形式同期发表了两篇文章,报道了万种鸟类基因组计划第二阶段(科级别)的研究结果。该研究团队发表了363种鸟类基因组数据,同时通过这一数据建立了无参考序列下多基因组比对和分析的新方法,并基于这一新方法阐明了高密度物种取样对生物多样性研究的重要性。

万种鸟类基因组计划旨在构建约10500种鸟类的基因组图谱。研究团队从现存鸟类的科阶元中选取一个代表性鸟类物种,共计获得363种鸟类的全基因组数据,覆盖92%的科阶元,其中267个物种的基因组数据为首次发布。

区别于传统的比较基因组学分析依赖于某个基因组作为参考序列建立全基因组比对,研究团队建立了全新的无参考序列下多基因组比对和分析方法,实现了获取更真实且全面的序列同源关系,用于后续系统发生关系的解析和比较基因组学相关分析。该方法极大地提高了跨物种的比对效率,减少了由于与参考物种遗传距离差异引起的比对偏好和序列丢失。

研究人员表示,无参的全基因组比对数据集为全面解析鸟类遗传多样性特征的演化历程和分子遗传机制提供了全新的切入点。该研究团队借助这一算法的优势建立了更加完善的同源基因集合,并开发了一套鉴定任意演化分支特异获得和丢失序列的方法,从而完整描绘出鸟类物种谱系基因组动态演化图谱。研究发现,这些动态变化的基因组区域往往存在一些分支特异基因或调控元件,可能与物种特异性状的起源和演化有关。

此外,研究发现基于高覆盖度的物种取样的基因组比较分析显著提高了对基因组序列保守性的检验效力,实现了在单碱基分辨度下的自然选择压力分析。相比于53个物种的比较分析,363个物种计算得到的单碱基保守位点从2.1%上升到13.2%。(柯讯)