生物信息学第三章生物信息数据库及其信息检索.ppt
生物信息学数据库的检索检索方法概述检索实践和案例第28页,共61页,星期日,2025年,2月5日生物信息学数据库的检索主要检索系统和工具Entrez(NationalCenterforBiotechnologyInformation,NCBI)SRS(EuropeanBioinformaticsInstitute,EBI)ExPasyExpertProteinAnalysisSystem(SwissInstituteofBioinformatics,SIB)日本、欧洲、美国其他研究机构的工具平台……第29页,共61页,星期日,2025年,2月5日复杂检索1、限制字段类别常用的有:Author:BaoYM[au]Title:stress[ti]Tilte/Abstract:stress[title/abstract]Date:1999:2009[dp]2、布尔逻辑运算:AND、OR、NOT必须大写。逻辑符的运算次序是从左至右,括号内的检索式可作为一个单元,优先运行。布尔逻辑检索允许在检索词后面附加字段标识例如:rice[ti]ANDBaoYM[au]AND2008:2009[dp]第30页,共61页,星期日,2025年,2月5日同样存在限制字段:常用的有:Author:BaoYM[au]title:SNARE[ti]organism:rice[organism]或者直接输入:Accession:AY077725[Accession]GeneName:ZFP15[GeneName]ProteinName:ZFP15[ProteinName]如:BaoYM[au]ANDSNARE[ti]ANDrice[organism]如果没有限定,就是任意字段。如何获取GenBank中的序列?第31页,共61页,星期日,2025年,2月5日Entrez(NationalCenterforBiotechnologyInformation,NCBI)选择数据库当没有进入号时输入关键词(英文和拉丁文)当有进入号时输入进入号可编译第32页,共61页,星期日,2025年,2月5日NCBI主页最下面的区域,是NCBI的快捷连接区域第33页,共61页,星期日,2025年,2月5日举例:GAPDH或g3pdh是甘油醛-3-磷酸脱氢酶(glyceraldehyde-3-phosphatedehydrogenase)的英文缩写。该酶是糖酵解反应中的一个酶。该酶基因为管家(housekeeping)基因,几乎在所有组织中都高水平表达,在同种细胞或者组织中的蛋白质表达量一般是恒定的,且不受含有的部分识别位点、佛波脂等的诱导物质的影响而保持恒定,故被广泛用作抽提totalRNA,poly(A)+RNA,Westernblot等实验操作的标准化的内参。GAPDH一般是由4个相同亚基组成的四聚体,每个亚基均含有催化结构域和辅酶结合域。GAPDH与辅酶烟酰胺腺嘌呤二核苷酸(?NAD+)组成全酶才具有催化活性。第34页,共61页,星期日,2025年,2月5日基因序列搜索第35页,共61页,星期日,2025年,2月5日第36页,共61页,星期日,2025年,2月5日第37页,共61页,星期日,2025年,2月5日STS序列标签位点(sequence-taggedsite),是已知核苷酸序列的DNA片段,是基因组中任何单拷贝的短DNA序列,长度在100~500bp之间。任何DNA序列,只要知道它在基因组中的位置,都能被用作STS标签。作为基因组中的单拷贝序列,是新一代的遗传标记系统,其数目多,覆盖密度较大,达到平均每1kb一个STS或更密集。这种序列在染色体上只出现一次,其位置和碱基顺序都是已知的。在PCR反应中可以检测出STS来,STS适宜于作为人类基因组的一种地标,据此可以判定DNA的方向和特定序列的相对位置。第38页,共61页,星期日,2025年,2月5日不能用任何其它的特征关键词表述的具有生物学意义的区域;新的或少见的特征第39页,共61页,星期日,2025年,2月5日第40页,共61页,星期日,2025年,2月5日蛋白序列搜索第41页,共61页,星期日,2025年,2月5日第42页,共61页,星期日,2025年,2月5日第43页,共61页,星期日,2025年,2月5日生物信息学第三章生物信息数据库及其信息检索第1页,共