第二版前言
第一版序
第一版前言
本书使用说明
致敬经典
第 1 章 绪论
第一节 生物信息与生物信息学
一、迅速增长的生物信息
二、生物信息学概念
第二节 生物信息学历史与展望
一、发展简史
二、应用领域
三、学科展望
习题
历史与人物 “Bioinformatics”之名由来
第 2 章 生物信息类型及其产生途径
第一节 生物信息类型与测序技术
一、生物信息的类型
二、第一代测序技术
三、第二代测序技术
四、第三代测序技术
第二节 组学数据及其测定
一、基因组
二、转录组
三、其他组学数据
第三节 蛋白质序列及其结构测定
一、蛋白质序列与蛋白质互作测定
二、蛋白质结构测定
习题
历史与人物 第一台高通量测序仪与罗斯伯格
第 3 章 分子数据库
第一节 分子序列数据库概述
一、分子数据库及其记录格式
二、数据库序列递交与检索
第二节 核苷酸序列相关数据库
一、核苷酸初级数据库
二、核苷酸二级数据库
第三节 蛋白质相关数据库
一、蛋白质序列与结构数据库
二、蛋白质功能域等其他数据库
习题
历史与人物 分子数据库与戴霍夫和戈德
第 4 章 两条序列联配及其算法
第一节 序列联配与计分矩阵
一、序列联配
二、计分矩阵析
第二节 两条序列联配算法
一、Needleman-Wunsch 算法
二、Smith-Waterman 算法
第三节 BLAST 算法及数据库搜索
一、BLAST 算法
二、利用 BLAST 进行数据库序列搜索
三、序列相似性的统计推断
习题
历史与人物 序列联配算法与三个“man”
第 5 章 多序列联配及功能域分析
第一节 多序列联配算法
一、多序列全局联配算法
二、多序列局部联配算法
第二节 蛋白质序列功能域
一、功能域概念
二、功能域模型
第三节 熵与信息量
一、熵与不确定性
二、多序列联配结果的信息量估计
习题
历史与人物 基序、ClustalW 与杜立特
第 6 章 系统发生树构建
第一节 系统发生树概述
一、系统发生树概念
二、遗传模型
第二节 距离法
一、UPGMA 法
二、Fitch-Margoliash 法
三、邻接法
四、最小进化法
第三节 最大似然法
一、DNA 序列的似然模型
二、基于最大似然法建树
第四节 其他方法
一、最大简约法
二、贝叶斯法
三、基因组组分矢量法
习题
历史与人物 邻接法、MEGA 与根井正利
第 7 章 基因组调查、拼装与分析
第一节 基于字符串的基因组调查分析
一、基因组大小估计
二、基因组复杂度估计
第二节 基因组序列拼接与组装
一、基因组测序策略与步骤
二、基因组序列拼接算法
三、基因组染色体水平组装
第三节 基因组序列分析与比较
一、基因组序列构成分析
二、基因组可视化
三、比较基因组学分析
第四节 基因组重测序数据
一、分析流程与变异鉴定方法
二、泛基因组分析
习题
历史与人物 文特尔和帕夫纳的神来之笔
第 8 章 基因预测及其功能与结构注释
第一节 蛋白质编码基因预测
一、基因预测方法及其流程
二、隐马尔可夫模型预测方法
第二节 基因功能注释
一、基于已知基因和功能域数据
二、基于功能分类和代谢途径
第三节 蛋白质结构预测
一、蛋白质结构概述
二、蛋白质二级和三级结构预测
三、基因突变与蛋白质三维结构功能分析
习题
历史与人物 HMM、马尔可夫及其他
第 9 章 非编码 RNA 鉴定与功能预测
第一节 小 RNA 计算识别与靶基因预测
一、miRNA 主要特征及计算识别
二、siRNA 主要特征及计算识别
三、小 RNA 靶基因预测
第二节 长非编码 RNA 鉴定与功能预测
一、lncRNA 鉴定与功能预测
二、circRNA 鉴定与功能预测
习题
历史与人物 首届中国生物信息学终身成就奖
第 10 章 基因转录与调控网络
第一节 转录组数据分析
一、转录组序列比对和拼接
二、基因表达分析
三、基因可变剪接与融合
四、基因簇鉴定
第二节 甲基化分析
一、DNA 甲基化
二、RNA 甲基化
第三节 基因调控网络分析
一、生物网络
二、基因调控网络
习题
历史与人物 DNA 自动测序仪、系统生物学与胡德
第 11 章 宏基因组分析
第一节 16S rRNA 等基因序列数据
一、质控与分析流程
二、物种多样性估计
三、群落结构分析
第二节 全基因组序列数据
一、分析流程及其主要工具
二、宏基因组拼接与物种注释
习题
历史与人物 16S rRNA、“生命之树”与乌斯
第 12 章 新类型组学数据分析与利用
第一节 三维基因组
一、三维基因组数据标准化
二、染色质三维多级结构鉴定
三、三维基因组组装与可视化
第二节 单细胞组学数据
一、单细胞组学技术概况
二、单细胞基因组分析
三、单细胞转录组分析
第三节 基因组预测与选择
一、基因组数据与动植物育种
二、复杂性状的基因组预测与选择
第四节 其他
一、表型组之图像识别
二、合成生物学之基因组设计
三、翻译组
习题
历史与人物 深度学习“三剑客”
第 13 章 群体遗传分析
第一节 群体遗传多态性与结构分析
一、遗传多态性及其估计
二、群体遗传结构分析
第二节 自然选择的统计检验
一、基于种内多态性的检验方法
二、基于种间分歧度的检测方法
第三节 种群历史的溯祖模拟分析
一、溯祖理论与溯祖模拟
二、种群进化模型的溯祖测验
三、有效群体大小的溯祖估计
第四节 数量遗传学分析
一、QTL 定位
二、全基因组关联分析
三、混池分离分析
习题
历史与人物 马莱科特和科克汉姆的“神器”
第 14 章 生物信息学统计与算法基础
第一节 贝叶斯统计
一、贝叶斯统计概述
二、贝叶斯统计与生物信息学
三、图论与概率图模型
第二节 概率图模型
一、隐马尔可夫模型
二、贝叶斯网络
三、神经网络
第三节 机器学习算法
一、最大期望算法
二、马尔可夫链蒙特卡罗方法
三、动态规划
四、遗传算法
习题
历史与人物 贝叶斯之谜
第 15 章 生物信息学计算机基础
第一节 Unix/Linux 操作系统
一、Unix/Linux 操作系统及其结构
二、Linux Shell 常用命令
第二节 计算机编程语言
一、计算机编程语言概述
二、Python 语言与 Biopython 简介
三、R 语言与 Bioconductor 简介
四、MySQL 语言
第三节 其他
一、并行化
二、算法与画图
习题
历史与人物 Python 语言与范罗苏姆
参考文献
附录 1 生物信息学常用代码和关键词
一、核苷酸 / 氨基酸代码和遗传密码
二、序列记录特征关键词
附录 2 生物信息学主要数据库与分析工具
一、重要门户网站和分子数据库
二、生物信息学主要在线和开源分析工具
附录 3 生物信息学常用英文术语及释义
中文索引
英文索引