目录

第二版前言

第一版序

第一版前言

本书使用说明

致敬经典

第 1 章 绪论

第一节 生物信息与生物信息学

一、迅速增长的生物信息

二、生物信息学概念

第二节 生物信息学历史与展望

一、发展简史

二、应用领域

三、学科展望

习题

历史与人物 “Bioinformatics”之名由来

第 2 章 生物信息类型及其产生途径

第一节 生物信息类型与测序技术

一、生物信息的类型

二、第一代测序技术

三、第二代测序技术

四、第三代测序技术

第二节 组学数据及其测定

一、基因组

二、转录组

三、其他组学数据

第三节 蛋白质序列及其结构测定

一、蛋白质序列与蛋白质互作测定

二、蛋白质结构测定

习题

历史与人物 第一台高通量测序仪与罗斯伯格

第 3 章 分子数据库

第一节 分子序列数据库概述

一、分子数据库及其记录格式

二、数据库序列递交与检索

第二节 核苷酸序列相关数据库

一、核苷酸初级数据库

二、核苷酸二级数据库

第三节 蛋白质相关数据库

一、蛋白质序列与结构数据库

二、蛋白质功能域等其他数据库

习题

历史与人物 分子数据库与戴霍夫和戈德

第 4 章 两条序列联配及其算法

第一节 序列联配与计分矩阵

一、序列联配

二、计分矩阵析

第二节 两条序列联配算法

一、Needleman-Wunsch 算法

二、Smith-Waterman 算法

第三节 BLAST 算法及数据库搜索

一、BLAST 算法

二、利用 BLAST 进行数据库序列搜索

三、序列相似性的统计推断

习题

历史与人物 序列联配算法与三个“man”

第 5 章 多序列联配及功能域分析

第一节 多序列联配算法

一、多序列全局联配算法

二、多序列局部联配算法

第二节 蛋白质序列功能域

一、功能域概念

二、功能域模型

第三节 熵与信息量

一、熵与不确定性

二、多序列联配结果的信息量估计

习题

历史与人物 基序、ClustalW 与杜立特

第 6 章 系统发生树构建

第一节 系统发生树概述

一、系统发生树概念

二、遗传模型

第二节 距离法

一、UPGMA 法

二、Fitch-Margoliash 法

三、邻接法

四、最小进化法

第三节 最大似然法

一、DNA 序列的似然模型

二、基于最大似然法建树

第四节 其他方法

一、最大简约法

二、贝叶斯法

三、基因组组分矢量法

习题

历史与人物 邻接法、MEGA 与根井正利

第 7 章 基因组调查、拼装与分析

第一节 基于字符串的基因组调查分析

一、基因组大小估计

二、基因组复杂度估计

第二节 基因组序列拼接与组装

一、基因组测序策略与步骤

二、基因组序列拼接算法

三、基因组染色体水平组装

第三节 基因组序列分析与比较

一、基因组序列构成分析

二、基因组可视化

三、比较基因组学分析

第四节 基因组重测序数据

一、分析流程与变异鉴定方法

二、泛基因组分析

习题

历史与人物 文特尔和帕夫纳的神来之笔

第 8 章 基因预测及其功能与结构注释

第一节 蛋白质编码基因预测

一、基因预测方法及其流程

二、隐马尔可夫模型预测方法

第二节 基因功能注释

一、基于已知基因和功能域数据

二、基于功能分类和代谢途径

第三节 蛋白质结构预测

一、蛋白质结构概述

二、蛋白质二级和三级结构预测

三、基因突变与蛋白质三维结构功能分析

习题

历史与人物 HMM、马尔可夫及其他

第 9 章 非编码 RNA 鉴定与功能预测

第一节 小 RNA 计算识别与靶基因预测

一、miRNA 主要特征及计算识别

二、siRNA 主要特征及计算识别

三、小 RNA 靶基因预测

第二节 长非编码 RNA 鉴定与功能预测

一、lncRNA 鉴定与功能预测

二、circRNA 鉴定与功能预测

习题

历史与人物 首届中国生物信息学终身成就奖

第 10 章 基因转录与调控网络

第一节 转录组数据分析

一、转录组序列比对和拼接

二、基因表达分析

三、基因可变剪接与融合

四、基因簇鉴定

第二节 甲基化分析

一、DNA 甲基化

二、RNA 甲基化

第三节 基因调控网络分析

一、生物网络

二、基因调控网络

习题

历史与人物 DNA 自动测序仪、系统生物学与胡德

第 11 章 宏基因组分析

第一节 16S rRNA 等基因序列数据

一、质控与分析流程

二、物种多样性估计

三、群落结构分析

第二节 全基因组序列数据

一、分析流程及其主要工具

二、宏基因组拼接与物种注释

习题

历史与人物 16S rRNA、“生命之树”与乌斯

第 12 章 新类型组学数据分析与利用

第一节 三维基因组

一、三维基因组数据标准化

二、染色质三维多级结构鉴定

三、三维基因组组装与可视化

第二节 单细胞组学数据

一、单细胞组学技术概况

二、单细胞基因组分析

三、单细胞转录组分析

第三节 基因组预测与选择

一、基因组数据与动植物育种

二、复杂性状的基因组预测与选择

第四节 其他

一、表型组之图像识别

二、合成生物学之基因组设计

三、翻译组

习题

历史与人物 深度学习“三剑客”

第 13 章 群体遗传分析

第一节 群体遗传多态性与结构分析

一、遗传多态性及其估计

二、群体遗传结构分析

第二节 自然选择的统计检验

一、基于种内多态性的检验方法

二、基于种间分歧度的检测方法

第三节 种群历史的溯祖模拟分析

一、溯祖理论与溯祖模拟

二、种群进化模型的溯祖测验

三、有效群体大小的溯祖估计

第四节 数量遗传学分析

一、QTL 定位

二、全基因组关联分析

三、混池分离分析

习题

历史与人物 马莱科特和科克汉姆的“神器”

第 14 章 生物信息学统计与算法基础

第一节 贝叶斯统计

一、贝叶斯统计概述

二、贝叶斯统计与生物信息学

三、图论与概率图模型

第二节 概率图模型

一、隐马尔可夫模型

二、贝叶斯网络

三、神经网络

第三节 机器学习算法

一、最大期望算法

二、马尔可夫链蒙特卡罗方法

三、动态规划

四、遗传算法

习题

历史与人物 贝叶斯之谜

第 15 章 生物信息学计算机基础

第一节 Unix/Linux 操作系统

一、Unix/Linux 操作系统及其结构

二、Linux Shell 常用命令

第二节 计算机编程语言

一、计算机编程语言概述

二、Python 语言与 Biopython 简介

三、R 语言与 Bioconductor 简介

四、MySQL 语言

第三节 其他

一、并行化

二、算法与画图

习题

历史与人物 Python 语言与范罗苏姆

参考文献



附录 1 生物信息学常用代码和关键词

一、核苷酸 / 氨基酸代码和遗传密码

二、序列记录特征关键词

附录 2 生物信息学主要数据库与分析工具

一、重要门户网站和分子数据库

二、生物信息学主要在线和开源分析工具

附录 3 生物信息学常用英文术语及释义

中文索引

英文索引

《生物信息学》(第二版)彩图原图