第三讲:Uniprot蛋白数据库与其他蛋白质分析工具.pdf
文本预览下载声明
第三讲
Uniprot蛋白数据库及其他蛋白质
分析工具
2013/03/19
Uniprot数据库
• Uniprot (Universal protein resource)是蛋白
质序列的联合数据库。
– SIB: Swiss Institute of Bioinformatics
– EBI: European Bioinformatics Institute
– PIR: Protein Information Resource
– 2002年三家联合形成了Uniprot
Swiss‐Prot
• 1986年建立
• 低冗余度
• 功能导向
• 由Swiss Institute of Bioinformatics 和EBI共同
建立并维护
TrEMBL
• TrEMBL=Translation from EMBL
• EBI建立并维护
• 是一个自动数据库
• 冗余度高,可信度低
UniprotKB
• 部分经过专家注释的数据库
• 具有很高的可信度
• 包括两部分UniprotKB/Swiss‐Prot和
UniprotKB/TrEMBL
• UniprotKB/Swiss‐Prot包括539,165条序列
• UniprotKB/TrEMBL包括29,769,971 条序列
• 具有非冗余性
Uniparc
• 非冗余性
• 给予序列的特异性,非同一物种的相同序
列被认为是同一个蛋白质
• 每一条序列被給予一个特异的编号
Uniparc
• INSDC EMBL‐Bank/DDBJ/GenBank nucleotide sequence databases
• Ensembl
• European Patent Office (EPO)
• FlyBase
• H‐Invitational Database (H‐Inv)
• International Protein Index (IPI)
• Japan Patent Office (JPO)
• Protein Information Resource (PIR‐PSD)
• Protein Data Bank (PDB)
• Protein Research Foundation (PRF) RefSeq
• Saccharomyces Genome Database (SGD)
• The Arabidopsis Information Resource (TAIR)
• TROME
• US Patent Office (USPTO)
• UniProtKB/Swiss‐Prot, UniProtKB/Swiss‐Prot protein isoforms, UniProtKB/TrEMBL
• Vertebrate and Genome Annotation Database (VEGA)
• WormBase
UniRef
• 包括UniRef100,UniRef90和UniRef50
• 分别包括了相似度为100%,90%和50%的序
列的总和
UniMES
• UniMES是metagenomics和环境生物学的序
列数据库
• 其中的数据可能是未知的
• UniMES提供UniRef类似的聚类功能
Uniprot的应用
• 在质谱领域有广泛的应用
– 因为其序列的非
显示全部