基因工程课件-第三章 生物信息的获取.pptx
文本预览下载声明
第三章 生物信息的获取;世界三大核酸序列数据库
(公共序列数据库,Public Sequence Database)
GenBank(美国)
EMBL(欧洲)
DDBJ(日本)
序列信息等同
;GenBank(美国国家生物技术信息中心,NCBI)
美国的核酸数据库从1979年开始建设,1982年正式运行;它是由美国国立生物技术信息中心(NCBI)建立和维护的。
;GenBank网址 /Genbank/;GDB网址 / ; AceDB
线虫基因组数据库。既是一个数据库,又是一个数据库管理系统。
提供很好的图形界面,用户能够从大到整个基因组小到序列的各个层次观察和分析基因组数据。
数据内容:
限制性图谱,基因结构信息,质粒图谱,序列数据,参考文献…
;2 数据库格式简介;不同数据库的序列格式;
GenBank数据库的主要内容和格式
序列名称、长度、日期
序列说明、编号、版本号
物种来源、学名、分类学位置
相关文献作者、题目、刊物、日期
序列特征表
碱基组成
序列(每行60个碱基)
;LOCUS U00096 4639221 bp DNA circular BCT 18-NOV-1998
DEFINITION Escherichia coli K-12 MG1655 complete genome.
ACCESSION U00096
KEYWORDS .
SOURCE Escherichia coli.
ORGANISM Escherichia coli
Bacteria; Proteobacteria; gamma subdivision; Enterobacteriaceae;
Escherichia.埃希氏菌属
REFERENCE 1 (bases 1 to 4639221)
AUTHORS Blattner,F.R., Plunkett,G. III, Bloch,C.A., Perna,N.T., Burland,V.,
…
TITLE The complete genome sequence of Escherichia coli K-12(菌株)
JOURNAL Science 277 (5331), 1453-1474 (1997)
MEDLINE …
COMMENT This sequence was determined by the E. coli Genome Project at the
University of Wisconsin-Madison (Frederick R. Blattner, director).
Supported by NIH grants HG00301 and HG01428 (from Human Genome
Project and NCHGR). The entire sequence was independently
determined from E. coli K-12 strain MG1655. Predicted open reading
frames were determined using GeneMark software, kindly supplied by
…;FEATURES Location/Qualifiers
source 1..4639221
/organism=Escherichia coli
/strain=K-12“
/sub_strain=MG1655
/db_x
显示全部