Trends Plant Sci│植物基因组测序20周年回顾与展望
2021年11月12日,国际著名期刊Trends in Plant science 发表题为“Twenty years of plant genome sequencing: achievements and challenges”的综述论文,系统总结了20年来植物基因组测序的研究进展,全面分析了已完成的788个植物物种参考基因组,并讨论了未来植物基因组研究面临的挑战。
2000年12月 Nature 杂志首次报道并发表了第一个开花植物——拟南芥的完整基因组序列,标志着植物基因组时代的开始。由此20年间(截止到2020年12月),788个植物物种基因组已被测序,先后发表了1031个参考基因组。788个植物物种中,被子植物占88%,其中双子叶植物572种,单子叶植物110种,裸子植物13种,蕨类植物3种,石松植物4种,苔藓植物12种,轮藻纲植物7种,绿藻纲植物54种。已发表的植物基因组大小跨度很大,中位数为575.5Mb,最大的31Gb(Pinus lambertiana,糖松)。除了测序基因组数量的增加,植物基因组的质量也在不断提高。53个植物基因组至少被改进过一次,其中47个基因组已达到了染色体组装水平。中国在植物基因组测序与分析中发挥了重要,是国际上最重要的研究力量之一。1031个参考基因组中,中国、美国、德国、日本和英国五国科学家贡献最大,完成了其中72%的基因组。从第二个植物基因组水稻开始,中国从跟跑到领跑植物基因组研究,20年间中国角色发生了根本转变。
图1 植物基因组测序20周年回顾——测序物种数量与分布
植物基因组测序最近10年发展迅速,测序物种数量呈现指数增长趋势。其重要原因是高通量测序技术、基因组组装算法等进步,特别是第三代测序技术的出现,极大促进了基因组拼装质量和复杂基因组的拼接。同时,通过基因组图谱技术(Hi-C等)和材料创新(自交纯合、分离染色体、单倍体等方法),也极大促进了植物基因组测序与拼装质量的提升。
图2 第一篇拟南芥和水稻基因组文章的引用树
通过构建第一篇拟南芥(2000)和水稻(包括籼稻和粳稻)(2002)基因组文章的引用树(citation tree),可以发现20年来基因组学的发展推动了植物生物学所有学科的范式转变,特别是在植物科学、分子生物学、生物技术、遗传学、农学和进化生物学领域。水稻基因组学的发展,极大推进了农学领域(agronomy),特别是作物遗传育种领域的发展。
文章最后对未来植物基因组学发展进行了展望,指出目前构建完整植物基因组(gapless reference genome)、复杂基因组和泛基因组方面仍具有挑战。目前植物多倍化、杂合度、大基因组仍是植物基因组测序的主要障碍。认为平均读长更长(>10Mb)的测序技术、优化的组装算法和泛基因组分析工具(储存、比较、注释及可视化)等,是未来的植物基因组测序需重点突破的方向。
浙江大学作物科学研究所博士生孙砚青和中国农科院深圳农业基因组所商连光副研究员为本文共同第一作者,浙江大学樊龙江教授和中国水稻所郭龙彪研究员为通讯作者。澳大利亚CSIRO朱乾浩研究员参与了本研究。该研究得到浙江省科技厅重点专项的资助。