文档详情

生物信息学数据库包其郁.ppt

发布:2017-06-02约6.42千字共72页下载文档
文本预览下载声明
第五节 数据库 1. 分子生物信息数据库发展简史 2.分子生物信息数据库分类 3.核酸序列数据库 4.蛋白质序列数据库 5.疾病相关基因数据库 一、分子生物信息数据库发展简史 60年代初, Dr. Margaret Oakley Dayhoff和她的同事们收集了所有当时已知的氨基酸序列,发表了《蛋白质序列及结构图谱》,建立了第一个生物信息数据库--这一蛋白质数据库后来成为蛋白质信息资源PIR。 EMBL :1982年,第一个DNA序列数据库在欧洲分子生物学实验室(EMBL)诞生。 GenBank:美国洛斯阿拉莫斯(Los Alamos)国家实验室建立了GenBank。1988年,美国组建了国家生物技术信息中心(National Center for Biotechnology Information,NCBI。 DDBJ:日本的DNA数据库( DDBJ )于1984年在三岛市建成。 二、分子生物信息数据库分类 基于数据类型: 储存DNA、RNA、EST和蛋白质等 如NCBI中的UniGene数据库为DNA序列数据库。 根据物种类型: 储存该物种基因组中有关结构和功能基因组信息 人类基因组数据库(The GDB Human Genome Database) 水稻数据库 、果蝇数据库 、酵母数据库 从数据库的数据来源: 可以分为一级数据库和二级数据库 (1) 基 于 数 据 类 型 储存DNA、RNA、EST、蛋白质等: 如 NCBI中的UniGene数据库为DNA序列数据库。 (2) 根据物种类型 基因组数据库,如: 人类基因组数据库 水稻数据库 果蝇数据库 酵母数据库 等等 (3) 从数据库的数据来源 -- 分为一级数据库和二级数据库 一级数据库:数据都直接来源于实验获得的原始数据,只经过简单的归类整理和注释。 如:序列数据库来自序列测定; 基因组数据库来自基因组作图; 结构数据库来自X射线衍射和 核磁共振等结构测定。 二级数据库: 是在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来, 是对核酸和蛋白质序列、基因组图谱、蛋白质结构及文献等数据进行进一步分析、整理、归纳、注释, 而构建成的具有特殊生物学意义和专门用途的次级数据库,如GeneCard。 三、核酸序列数据库 Genbank EMBL:欧洲分子生物学实验室(The European Molecular Biology Laboratory) DDBJ:日本的DNA数据库(DNA Data Bank of Japan) 1. Genbank GenBank? is the NIH genetic sequence database, an annotated collection of all publicly available DNA sequences Genetic Sequence Data Bank February 15, 2008 NCBI-GenBank Flat File Release 164.0 Distribution Release Notesloci, 85,759,586,764 bases, from 82,853,685 reported sequences There are approximately 106,533,156,756 bases in 108,431,692 sequence records in the traditional GenBank divisions and 148,165,117,763 bases in 48,443,067 sequence records in the WGS division as of August 2009. GenBank由美国国立生物技术信息中心(National Center for Biotechnology Information,NCBI)维护 内容:汇集了所有公开的核酸和蛋白质序列的数据库,并提供相 关的文献目录和生物学注释 数据来源:测序工作者直接提交、测序中心成批发送或与 其它数据机构协作交换数据而来 GenBank、EMBL-Bank、D
显示全部
相似文档