《生物信息学》(即网络电子备课笔记《生物信息学札记》第四版)自 2017 年出版以来,受到广大读者的喜爱,反响热烈,编者深感欣慰。华中科技大学一位同行告诉我,《生物信息学札 记》当年对他影响很大,其中动态规划算法就是读了札记后才看懂的。本书被不少院校和研究机构作为教学用书,例如,中国科学院遗传发育研究所将本书列为研究生课程的主要参考书,华中农业大学信息学院将本书作为生物信息学专业本科生的主要教材等。这使我倍感压力,也给了我更大的动力来修订好这本教材。生物信息学是一个快速发展的学科,技术变革很快,加之书中存在一些错误和不足(感谢许多同行和读者给我的来信),深感有些内容已惨不忍睹,亟待更新。
第二版的修订工作自 2019 年 5 月启动。在此之前,我们刚刚完成了《植物基因组学》的编写。因此我们可以合理安排《生物信息学》(第二版)和《植物基因学》的有关内容,使它们相辅相成,便于读者阅读和学习。在第二版中,我对有关算法原理的描述过程给予了更多关注。入门教材不应写得太简略,否则卡在某处可能许多年都无法理解。经过近两年的努力,总算拿出了目前的版本。其间经历 2020 年春节前后新型冠状病毒肺炎疫情暴发,全民居家隔离,使我有了充足时间修改和完善教材。
第二版主要在以下4个方面进行了修改和完善:①调整了全书组织框架,全书现共 15 章、3 个附录。由于高通量测序数据已成为常态数据,是目前生物信息学分析的主体,已没有必要将高通量数据分析单独成篇进行介绍。同时,第一版“生物信息学外延与交叉篇”中,应将有关交叉学科整合到生物信息学学科中的部分纳入到整个生物信息学框架内集中介绍更为合适;第一版“生物信息学资源与实践篇”各章内容在第二版中均列为附录内容。这样的调整使全书逻辑更加清楚,内容更加紧凑,便于阅读。②增设“生物信息学统计与算法基础”一章,强化了贝叶斯统计和机器学习在生物信息学中的应用相关内容;其中,相关统计和算法内容都结合具体生物信息学应用案例进行讲述;第一版中原有的统计和算法内容,部分整合到该章内。该章与“生物信息学计算机基础”一章构成了本书两大基础支撑。③为了紧跟生物信息学应用前沿领域,增设“新类型组学数据分析”一章,专门介绍三维基因组、单细胞基因组等新领域中的生物信息学分析方法前沿。④为了增强学科发展历史学习和教材趣味性,第二版补充了生物信息学学科相关人物和重要历史事件介绍。每章最后都增加了一篇以代表性人物为主线的“历史与人物”趣味短文。历史有利于读者理解学科发展脉络,大师会为学生树立榜样,激励他们更好地学习相关知识。
有关专家对本书相应章节进行了审阅和修改(按姓氏笔画排序):王向峰、王希胤、王秀杰、左光宏、吴为人、陈玲玲、罗静初、周琦、高歌、章元明、章张和葛颂。特别感谢罗静初先生通过视频方式给予了许多具体指导,王秀杰研究员提供中国生物信息学终身成就奖颁奖词,陈国波博士帮助撰写了一篇“历史与人物”短文(“群体遗传分析”一章)等等。本书的完成,离不开编写团队的共同努力,他们虽然学科背景或研究领域不同,但都在生物信息学分析一线工作,具有丰富的研究经历和实践经验。杜天宇、董晨风、姚洁、李田、刘芳杰、尹新新、丁昱雯、蒋博文、翁溪坊、谢玲娟、沈子杰、钱青宏等参与有关材料收集和撰写,特此致谢。本书的出版得到浙江大学本科生院和农业与生物技术学院的联合资助。
2018 年 3 月,郝柏林院士不幸离世。他为本书第一版撰写的序言就此成为绝唱。在他去世的第二天,我撰写了一篇追忆文章“郝柏林院士在浙大的那三年——我眼中的郝先生”。为了纪念郝先生——我国生物信息学学科开创者之一、我的生物信息学启蒙导师,特将此文作为本书后记,寄予哀思。
最后,囿于编者学识,本书一定存在不少错误和偏颇,望同行和读者批评指正。
樊龙江
2021年2月6日
于浙江大学紫金港校区启真湖畔