文档详情

用Entrez和SRS系统查找目标序列 .doc

发布:2015-08-18约7.94千字共12页下载文档
文本预览下载声明
实序列查询(ntrez/SRS) 实习目的: 会用Entrez和SRS系统查找目标序列 实习内容: 1. ENTREZ Entrez是一个由NCBI创建并维护的基于Web界面的综合生物信息数据库检索系统。Entrez提供了对GeneBank, EMBL, DDBJ, PIR-International, PRF, SWISS-PROT及PDB等数据库超过105000个物种的序列数据的整合访问。还可对PubMed上生物医学文献进行检索,同时还可以对NCBI网站及其FTP上的资源进行搜索。 网址: /Entrez/ Figure2.1 entrez search result 在搜索栏输入你要查找的关键词,点击“GO”即可开始ENTREZ探索。如果输入多个关键词,它们之间默认的是“与”(AND)的关系,可以在关键词短语上使用双括号“”,则只有完全符合的记录会被搜索到。 Tip:搜索的关键词必须明确,不能是“gene”, “protein”没有明确指向的词语。但“transcription factor”这样有一定范围的词是可以接受的。可以用你感兴趣的领域的专业术语,也可以是非专业术语,比如:sars, bird flu, h1n1,lung cancer。other examples:rypsin,subtilism,peroxidase,myoglobin,albinism. 输入关键词,点击“GO”之后,在entrez主界面上每个数据库图标前方出现了数字,代表的是在相对应的数据库里搜索到的条目数。点击进入对应的数据库,可以查看搜索到的条目。如果在数据库图标前面为灰色,显示“none”,说明在对应的数据库里没有搜索到任何结果(Figure 2.1)。 也可以直接通过NCBI任一页面上的搜索栏进行Entrez搜索。点击“search”后面的下拉菜单,选择数据库,在下面的文本框里输入关键词,点击“Search”即可(Figure 2.2)。 Figure 2.2 Entrez quick search Entrez的精华在于其提供的 “Limits”、“”工具,只有充分理解并熟练运用进行复杂的检索,才能充分发挥Entrez的强大功能。”,”Advanced Search”选项,首先,点击Limits进入限定页面。 Figure 2.3 search result A: Limits 可以对序列发布时间或修改时间进行限定,也可以对搜索关键词的领域(field,每条genbank序列记录中左侧大写的那列)进行限定,也可以对搜索数据库(RefSeq, GENBANK,EMBL,DDBJ,PDB)Figure 2.4 Limits page 以上的截图是选择核酸数据库时限定的内容,选择其它类型数据库,限定页面内容将略有不同。 我们可以根据自己的关键词进行领域(field)限定。 如果输入的是序列名称(如hemoglobin, trypsin, etc),点击Field下拉菜单,选择title; 如果输入的是物种的名称,field选择organism; Source database :一般选择RefSeq,建议大家在平时搜索时也使用这个选项。 限定完毕,点击“Search“,则出现根据你的限定得到的搜索结果,同时页面上显示“Limits Activated”,你可以点“change”修改限定,也可以点“remove”取消限定。 Figure 2.5 Limits Activated. 查询序列时,我们常常将搜索限定在RefSeq数据库,因为它的数据是非冗余的。 The Reference Sequence (RefSeq) database is a non-redundant collection of richly annotated DNA, RNA, and protein sequences from diverse taxa. The collection includes sequences from plasmids, organelles, viruses, archaea, bacteria, and eukaryotes. Each RefSeq represents a single, naturally occurring molecule from one organism. The goal is to provide a comprehensive, standard dataset that represents sequence information for a species. Table 2.1 Accession Number of partial RefSeq sequences ref
显示全部
相似文档