Bioinplant Lab of Zhejiang University  

生物信息学札记(第四版):


1-13-2

 

主编:樊龙江

 

浙江大学作物科学研究所

浙江大学生物信息学研究所

浙江大学IBM生物计算实验室

 


详细目录

 

郝柏林院士

 

前言

 

 

 

 

 

绪论

 

 

第一节

生物信息与生物信息学

 

第二节

生物信息学简史与展望

 

第三节

本书的组织和使用

 

 

 

 

 

第一篇:生物信息学基础

 

第1-1章

生物信息类型及其产生途径

 

第一节

生物信息的类型

 

第二节

DNA测序技术

 

 

一、第一代测序技术

二、第二代测序技术

三、第三代测序技术

 

第三节

高通量测序技术的应用

 

 

一、DNA/RNA相关测序

二、蛋白质-DNA/RNA互作

三、甲基化/宏基因组

 

第四节

蛋白质序列及其结构测定

 

 

一、蛋白质序列与蛋白质互作测定

二、蛋白质结构测定

 

第1-2章

分子数据库和常见记录格式

 

第一节

分子序列数据库概述

 

 

一、分子数据库概念

二、数据库记录格式

三、数据库冗余、序列递交和检索

 

第二节

核苷酸及其相关数据库

 

 

一、DNA/RNA序列数据库

二、基因组数据库

三、非编码RNA数据库

 

第三节

蛋白质及其相关数据库

 

第四节

代谢途径等专业数据库

 

 

一、代谢途径数据库

二、代谢组学等数据库

 

第1-3章

两条序列联配及其算法

 

第一节

序列联配基本概念

 

第二节

计分矩阵

 

 

一、计分矩阵的一般原理

二、氨基酸替换矩阵

三、位置特异性计分矩阵(PSSM)

 

第三节

两条序列联配算法

 

 

一、Needleman-Wunsch算法

二、Smith-Waterman算法

 

第四节

BLAST算法及数据库搜索

 

 

一、BLAST算法

二、利用BLAST进行数据库序列搜索

三、序列相似性的统计推断

 

第1-4章

多条序列联配及功能域分析

 

第一节

多序列联配概念及其算法

 

 

一、多序列联配概念

二、多序列全局联配算法

三、多序列局部联配算法

 

第二节

蛋白质序列功能域分析与模型

 

 

一、功能域概念

二、功能域模型

 

第三节

熵及矩阵信息量

 

 

一、不确定性与信息量

二、信息熵的应用

 

第1-5章

基因预测与功能注释

 

第一节

基因组序列构成与基因预测

 

 

一、基因组序列的基本构成

二、基因预测及其基本方法

三、基因注释流程

 

第二节

从头预测——隐马尔可夫模型(HMM)方法

 

 

一、马尔可夫和隐马尔可夫模型

二、隐马尔可夫模型问题及其算法

三、HMM基因预测模型及其应用

 

第三节

贝叶斯统计及其基因预测应用

 

 

一、贝叶斯统计与生物信息学

二、利用贝叶斯统计进行基因预测

 

第四节

基因功能注释

 

 

一、利用序列和结构域数据库进行注释

 

 

二、利用功能分类和代谢途径信息进行注释

 

第五节

基因序列构成分析

 

 

一、碱基构成与分布

二、DNA行走与Z曲线

三、同向重复序列分析

四、蛋白质序列跨膜等特征分析

 

第1-6章

系统发生树构建

 

第一节

系统发生树与遗传模型

 

 

一、系统发生树概述

二、遗传模型

 

第二节

距离法

 

 

一、非加权平均连接聚类法(UPGMA法)

二、Fitch-Margoliash算法

三、邻接法

 

第三节

简约法

 

第四节

似然法

 

 

一、DNA序列的似然模型

二、两条序列系统发生树

三、三条及多条序列系统发生树

 

第五节

基因组组分矢量方法

 

 

一、组分矢量方法(CVTree算法)

二、基因组关联“距离”与系统发生树构建

 

第1-7章

蛋白质结构预测与药物设计

 

第一节

蛋白质结构概述

 

 

一、蛋白质结构及其预测

二、蛋白质结构数据库

三、蛋白质结构主要预测工具

 

第二节

蛋白质二级结构预测

 

 

一、二级结构预测方法

二、结构预测实例

 

第三节

蛋白质三级结构预测

 

 

一、同源建模法

二、折叠识别法

 

第四节

计算机辅助药物设计

 

 

一、间接药物设计

二、直接药物设计

 

第1-8章

生物信息学计算机基础

 

第一节

使用Unix/Linux操作平台

 

 

一、Unix/Linux操作系统及其结构

二、Linux Shell常用命令

 

第二节

掌握一门计算机编程语言

 

 

一、计算机编程语言

二、Python语言简介

三、R语言

四、MySQL语言

 

第三节

并行与自动化

 

 

一、并行式计算

二、并行化模型及其实例

 

第四节

其他

 

 

一、算法

 

 

二、可视化与画图

 

 

 

 

 

第二篇:高通量测序数据分析

 

第2-1章

基因组拼接与分析

 

第一节

基因组序列拼接概念

 

 

一、基因组短序列拼接问题

二、基因组从头拼接主要方法

三、利用遗传图谱等进行基因组组装

 

第二节

图论及基于德布鲁因图拼接算法

 

 

一、图论

二、基于德布鲁因图的拼接算法

 

第三节

第三代测序数据拼接方法

 

第四节

基于字符串(K-mer)的基因组调查与分析

 

 

一、基因组大小估计

二、基因组复杂度估计

三、基因组“肖像”及缺失字符串分析

 

第2-2章

基因组变异与分析

 

第一节

基因组变异类型与检测方法

 

 

一、基因组变异类型

二、基因组变异检测方法

 

第二节

基因组重测序及其应用

 

 

一、基因组重测序应用领域

二、基因组重测序数据分析

 

第2-3章

转录组分析

 

第一节

转录组测序与拼接

 

 

一、转录组及其技术平台

二、转录组序列拼接

 

第二节

基因表达分析

 

 

一、差异表达基因的鉴定

二、差异表达基因富集分析

 

第三节

可变剪切和基因融合分析

 

 

一、基因可变剪切

二、融合基因

 

第2-4章

非编码RNA分析

 

第一节

非编码RNA简介

 

 

一、非编码RNA类型与功能

二、非编码RNA进化

三、样品采集及其测序方法

四、非编码RNA主要数据库

 

第二节

小RNA计算识别与靶基因预测

 

 

一、miRNA主要特征及计算识别

二、siRNA主要特征及计算识别

三、miRNA和siRNA靶基因预测

 

第三节

长非编码RNA鉴定与功能分析

 

 

一、线性lncRNA鉴定

二、环化RNA鉴定

三、lncRNA功能预测

 

第2-5章

甲基化与组蛋白修饰

 

第一节

表观遗传机制

 

第二节

甲基化测序与分析

 

 

一、甲基化测序原理

二、生物信息学分析方法

 

第三节

组蛋白修饰测定与分析

 

 

一、组蛋白的样品制备

二、组蛋白修饰分析方法

 

第2-6章

宏基因组分析

 

第一节

宏基因组及其分析方法

 

 

一、宏基因组概述

二、宏基因组学技术应用

 

第二节

16S rDNA序列分析

 

 

一、技术方法与分析流程

二、物种多样性分析

三、物种丰富度估计

四、群落结构分析

 

第三节

全基因组序列数据分析

 

 

一、分析流程与内容

二、基因预测及功能注释

 

第2-7章

蛋白质组分析

 

第一节

蛋白质组学概述

 

 

一、蛋白质组及其分析

二、高通量分离和鉴定技术

 

第二节

双向电泳图像与质谱组合分析

 

 

一、胶图获取与分析

二、利用指纹图谱鉴定蛋白质

 

第三节

质谱数据采集与分析

 

 

一、质谱数据采集策略

二、肽段数据库搜索与质量控制

 

第四节

定量蛋白质组分析

 

 

一、同位素标记定量分析

二、非同位素标记定量分析

 

 

 

 

 

第三篇:生物信息学外延与交叉

 

第3-1章

系统生物学

 

第一节

系统生物学概述

 

第二节

网络与生物网络

 

 

一、无标度和阶层网络

二、生物网络模块及其算法工具

 

第三节

基因调控网络

 

 

一、布尔网络模型

二、贝叶斯网络模型

 

第3-2章

群体遗传学

 

第一节

群体遗传多态性与结构

 

 

一、遗传多态性及其估计

二、群体结构

 

第二节

正向选择的统计检验

 

 

一、自然选择与中性检验

二、基于种内多态性的检验方法

三、基于种内多态和种间分歧度的检测方法

 

第三节

群体进化的溯祖测验

 

 

一、溯祖理论

二、溯祖测验应用

 

第四节

统计测验分析问题与策略

 

第3-3章

数量遗传学

 

第一节

数量性状遗传基本概念

 

第二节

连锁分析

 

 

一、连锁分析原理

二、试验群体的连锁分析

三、常用连锁分析软件

 

第三节

关联分析

 

 

一、关联分析基本原理

二、常用关联分析软件

 

第3-4章

合成生物学

 

第一节

什么是合成生物学?

 

 

一、合成生物学定义和研究内容

二、合成生物学引发的争议

 

第二节

从“基因线路”开始:模块化工程化

 

 

一、基因线路的基本概念

二、几个经典基因线路设计

 

第三节

从最小基因组开始:基因组人工合成

 

 

一、基因组的人工合成和重构

二、噬菌体基因组人工合成与重构

三、细菌基因组人工合成与重构

 

 

 

 

 

第四篇:生物信息学资源与实践

 

第4-1章

生物信息学常用代码和关键词

 

第一节

核苷酸和氨基酸代码

 

第二节

遗传密码

 

第三节

核苷酸和蛋白质序列记录特征关键词

 

第4-2章

生物信息学常用英语术语及释义

 

第4-3章

生物信息学主要数据库与工具

 

第一节

重要门户网站和分子数据库

 

第二节

主要在线分析工具

 

第三节

主要开放分析软件

 

第4-4章

生物信息学实验

 

实验1

生物序列数据库记录格式与检索

 

实验2

数据库搜索与未知序列功能预测

 

实验3

抗性基因多序列联配及其功能域预测

 

实验4

蛋白质编码基因预测与功能注释

 

实验5

非编码miRNA二级结构及其靶基因预测

 

实验6

基因组浏览器GBrowser及其应用

 

实验7

系统发生树构建

 

实验8

蛋白质结构与功能预测

 

 

 

 

参考文献