文档详情

蛋白质结构预测的原理与方法.ppt

发布:2024-01-13约8.44千字共79页下载文档
文本预览下载声明

*二、蛋白质二级结构预测的意义蛋白质二级结构预测不仅仅可以给出二级结构信息,在实际工作中有广泛的用途。①由蛋白质二级结构统计分析得到的规则可用于全新蛋白质设计或蛋白质突变体的设计。②当序列同源性较低时,二级结构的指认有助于确定蛋白质间结构与功能的关系。③在同源蛋白质模建中,二级结构预测有助于建立正确的序列比对关系。④在基于二级结构片段堆积的三级结构预测中正确的二级结构预测是第一步。⑤二级结构的预测有助于多维核磁共振中二级结构的指认,同时也有助于晶体结构的解析。第31页,讲稿共79页,2023年5月2日,星期三*三、蛋白质二级结构预测的主要方法二级结构预测的方法大体分为三代:第一代是基于单个氨基酸残基统计分析从有限的数据集中提取各种残基形成特定二级结构的倾向,以此作为二级结构预测的依据。第二代预测方法是基于氨基酸片段的统计分析统计的对象是氨基酸片段片段的长度通常为11-21片段体现了中心残基所处的环境在预测中心残基的二级结构时,以残基在特定环境形成特定二级结构的倾向作为预测依据第32页,讲稿共79页,2023年5月2日,星期三*第一代和第二代预测方法对三态预测的准确率都小于70%,而对?折叠预测的准确率仅为28?48%。其主要原因是只利用局部信息第三代方法:考虑多条序列的同源进化信息运用长程信息和蛋白质序列的进化信息准确度有了比较大的提高第33页,讲稿共79页,2023年5月2日,星期三*1Chou-Fasman方法Chou-Fasman方法曾经是、现在仍然是最为普遍应用的方法。其基本出发点在于对于蛋白质20种不同的氨基酸残基在不同的二级结构中出现的几率进行统计分析得出在不同二级结构中出现的倾向性。2GOR方法GOR(Garnier-Osguthorpe-Robson)方法基于信息论算法,是所有统计算法中理论基础最好的。3最近邻居方法在最近邻居方法(nearestneighbormethod)中新测定的序列被归类于与已知的最相近的序列具有相同的二级结构。第34页,讲稿共79页,2023年5月2日,星期三*4神经网络方法相对而言神经网络方法便于应用,有较高的预测准确度。最大的缺点是没有明确的物理化学意义。其中PHD方法是广泛应用的预测方法。5基于多重序列比对的二级结构预测基于单个序列的二级结构预测方法的预测准确度相对较低,大约在58%左右。而基于多重序列比对的二级结构预测方法PSI-PRED的预测准确度可达到77%。第35页,讲稿共79页,2023年5月2日,星期三*四、二级结构预测的准确度二级结构预测方法针对不同蛋白质所给出的准确度可能会有很大差别。1)单序列的预测准确度在60%左右。2)应用多重序列对比信息的二级结构预测准确度在65%~85%之间。第36页,讲稿共79页,2023年5月2日,星期三*五、二级结构在线预测许多蛋白质二级结构预测程序可以从因特网上免费下载至本地计算机进行蛋白二级结构预测。另外,还可以进行在线计算:可以通过送Email的方式,也可以在因特网上实时计算。可以进行二级结构在线预测两个网站为:1.PHD算法PredictProtein网站的地址为:/2.SSPro4.0(神经网络)/第37页,讲稿共79页,2023年5月2日,星期三*PredictProtein/可以获得功能预测、二级结构、基序、二硫键结构、结构域等许多蛋白质序列的结构信息该方法的平均准确率超过72%,最佳残基预测准确率达90%以上。因此,被视为蛋白质二级结构预测的标准。需要学术邮箱注册第38页,讲稿共79页,2023年5月2日,星期三*PredictProtein提交界面第39页,讲稿共79页,2023年5月2日,星期三*1D序列预测PROFsec(默认)是PHDsec的改进版本:基于轮廓(profile)的神经网络算法预测蛋白质二级结构PROFacc(默认)基于轮廓(profile)的神经网络算法预测残基溶剂可及性PHDhtm(默认)基于多序列比对预测跨膜区位置和拓扑结构ASP(默认)识别二级结构中构型变化的氨基酸COILS(默认)识别卷曲螺旋PROFtmb识别革兰氏阴性菌膜Beta桶蛋白结构序列基序识别ProSite(默认)搜索序列中保守基序SEG(默认)过滤序列中低复杂区域PredictNLS(默认)基于实验数据预测序列核定位区域二硫键识别DISULFIND(默认)识别序列中二硫键位置折叠子识别AGA

显示全部
相似文档