生物信息学中的数据挖掘.ppt
文本预览下载声明
一、生物信息学-由来 1956年,“生物学中的信息理论讨论会” (美国田纳西州); Symposium on information theory in biology, Gatlinburg, Tennessee, October 29-31,1956. 一、生物信息学-发展(1) 随着计算机技术的发展而发展 美国:1979年建立起GenBank数据库;1988年成立了国家生物技术信息中心(NCBI)。 欧洲:欧洲分子生物学网络组织(EMBNet) 1982年就已经提供核酸序列数据库(EMBL)的服务;1993年建立欧洲生物信息学研究所(EBI)。 日本:1984年日本国家遗传学研究所着手建立国家级的核酸序列数据库DDBJ并于1987年开始提供服务;1995年4月组建信息生物学中心(CIB)。 中国:1997年3月北京大学成立了生物信息学中心。 一、生物信息学-发展(2) 随着人类基因组计划(Human Genome Project, HGP)的实施和生物科学技术的迅猛发展而发展 基因组、基因 基因组(genomes ):一个细胞中的全部基因序列及其间隔序列。 基因:染色体上具有特定功能的一个片断,一个基因只编码一个蛋白质。 染色体、细胞核、细胞 DNA的双螺旋结构 碱基互补 基因组测序 确定一条染色体片断上的碱基顺序。 还没有完!拼接!!! 原因:整个基因组太长,而每次只能测得一个500bp的小片断(read) 问题:如何根据read恢复原始顺序? 一、生物信息学-发展(3) 21世纪,研究生物信息学成为历史的必然选择。 计算机科学技术(以数据处理分析为本质)和网络技术的突飞猛进。 生物科学的重点和突破点的转移。 一、生物信息学-定义 生物信息学名词的来由:八十年代末,林华安博士(佛罗里达州立大学超型计算机计算研究所)主办一系列生物信息学会议 “CompBio” “bioinformatique” “bio-informatics(bio/informatics)” “bioinformatics” “生物信息学” Bioinformatics – a Definition--Oxford English Dictionary (Molecular) bio – informatics: bioinformatics is conceptualising biology in terms of molecules (in the sense of Physical chemistry) and applying “informatics techniques” (derived from disciplines such as applied maths, computer science and statistics) to understand and organise the information associated with these molecules, on a large scale. In short, bioinformatics is a management information system for molecular biology and has many practical applications. 从重要性看 一门前沿的科学学科:研究生物和生物相关系统中信息内容物和信息流向,帮助人们详细和系统地理解生命运行机制。 一种重要的研发工具:今后进行几乎所有生物(医药)研究开发所必需。 只有基于生物信息学对大量已有数据资料的分析处理所提供的理论指导和分析,才能选择正确的研发方向; 只有选择正确的生物信息学分析方法和手段,才能正确处理和评价新的观测数据并得到准确的结论。 二、生物信息学研究-最终目的 从各生物学科中众多分散的观测资料中获得对生物学系统和生物学过程的运作机制的理解,最终达到自由应用于相关实践。 疾病诊治:系统地理解导致机体功能异常的生物机制并得出科学的治疗方案。 生物演化:系统地解释生物界演化(从微观分子水平到宏观形体功能水平)的根本原则,更好地认识人类在自然界中的地位,科学地认识和改造人类的未来。 二、生物信息学研究-当前主要任务 1. 基因组 2. 蛋白质组 3. 蛋白质结构 4. 新药设计 1. 基因组-新基因的发现 通过计算分析从EST序列库中拼接出完整的新基因编码区-“电子克隆” 通过计算分析从基因组DNA序列中确定新基因编码区 方法:根据编码区具有的独特序列特征;根据编码区与非编码区在碱基组成上的差异;根据高维分布的统计方法、神经网络方法、分形方法、密码学方法 1. 基因组-非蛋白编码区生物学意义的分析 非蛋白编码区:约占人类基因组
显示全部