生物信息学绪论.ppt
文本预览下载声明
生物信息学概论 已测序的重要模式生物: 基因芯片——基因微阵列或DNA芯片(gene microarray 或DNA chips)的原理是将几万个寡核苷酸或DNA作为探针,密集排列于硅片等固相支持物上,将研究样品标记后与微点阵杂交并进行检测。根据杂交信号强弱及探针位置和序列,可以确定靶DNA的表达情况以及突变和多态性存在与否。 生物信息学的发展过程 大致经历了3个阶段: 前基因组时代--生物数据库的建立、检索工具的开发、DNA和蛋白质序列分析、全局和局部的序列对位排列; 基因组时代--基因寻找和识别、网络数据库系统的建立、交互界面的开发; 后基因组时代--大规模基因组分析、蛋白质组分析。 生物信息学的研究内容 1、 生物分子数据的收集与管理 2、 数据库搜索及序列比较 3、 基因组序列分析 4、基因表达数据的分析与处理 5、蛋白质结构与功能预测 6、基因-蛋白相互作用网络 7、整个系统调控网络 基因组 数据库 蛋白质 序列 数据库 蛋白质 结构 数据库 DDBJ EMBL GenBank SWISS-PROT PDB PIR 生物分子数据的收集与管理 数据库搜索及序列比较 搜索同源序列在一定程度上就是通过序列比较寻找相似序列 序列比较的一个基本操作就是比对(Alignment),即将两个序列的各个字符(代表核苷酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,其结果是两个序列共有的排列顺序,这是序列相似程度的一种定性描述 多重序列比对研究的是多个序列的共性。序列的多重比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。 基因组序列分析 遗传语言分析——天书 基因组结构分析 基因识别 基因功能注释 基因调控信息分析 基因组比较 基因表达数据的分析与处理 基因表达数据分析是目前生物信息学研究的热 点和重点 目前对基因表达数据的处理主要是进行聚类分 析,将表达模式相似的基因聚为一类,在此基 础上寻找相关基因,分析基因的功能 所用方法主要有:相关分析方法、模式识别技术中的层次式聚类方法、人工智能中的自组织映射神经网络、主元分析方法 等 表达数据缺点:仅反映mRNA丰度,噪声,… DNA 微阵列(基因芯片) 基因表达的层次聚类分析 * 生物信息学 说文解字:生物 + 信息 + 学 (bioinformatics) biology + information + theory 广义 应用信息科学的方法和技术,研究生物体系和生物过程中信息的存贮、信息的内涵和信息的传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种生物信息,或者也可以说成是生命科学中的信息科学。 狭义 应用信息科学的理论、方法和技术,管理、分析和利用生物分子数据。 A marriage of … Biology Information technology 生物信息学研究分类 算法开发 生物学研究应用 Blast Blast 收集、整理、储存、加工、发布和分析生物学数据 3、生物信息学的研究内容 发展新的数理和信息科学的技术和方法用于管理和分析生物数据 (生物工作者) (数理和信息科学工作者) 2、生物信息学基本方法和技术 建立生物数据库 各种公共数据库 本地化数据库 数据库检索 各种数据检索工具的开发和使用 Entrez检索体系 BLAST检索体系 生物大分子序列分析 Homologous sequence analysis(同源序列分析) Multiple sequence alignment(多序列对位(对齐)排列) Evolution analysis(进化分析) Phylogenetic prediction(系统发育预测) 进化方式分析 进化位点分析 基因组分析 序列拼接 序列注释 基因功能、结构分析 蛋白质功能、结构分析 蛋白质三维结构预测 蛋白质修饰 Electronic PCR 统计模型 Hidden Markov model(HMM,隐马尔可夫模型) 基因识别和药物设计 Maximum likelihood model(最大似然模型) 序列进化分析 数学算法 自动序列拼接 外显子预测 同源序列比较 人类基因组: 3.2×109 bp H.inf全基因组 Saccharomyces cerevisiae 酿酒酵母 Caenorhabditis elegans 秀丽线虫 大肠杆菌及其全基因组 水稻基因组计划 Drosophila melanogaster 果蝇 Arabidopsis thaliana 拟南芥 基因组演化与物种演化 (生命之树) 怎样利用数据库? 寻找基因序列信息
显示全部