第8篇蛋白质结构模拟.ppt
文本预览下载声明
第八章 蛋白质结构模拟
蛋白质结构模拟
蛋白质结构的预测
反相折叠方法
从头折叠法
常用的网站
常用软件
一、蛋白质结构的预测
蛋白质三维结构很大程度决定了蛋白质的功能,因此现代生物学的一个大课题就是如何获取蛋白质的结构并对之进行分析。在药物设计中,大多数药物的靶酶(受体和酶)都是蛋白质,精确的蛋白质结构对于药物分子和靶点之间的相互作用研究以及基于结构的药物设计都很重要
目前,蛋白质结构的实验测定方法主要有两大类:
基于X射线晶体衍射图谱法(X-ray crystallography)和中子衍射法的蛋白质晶体结构的测定;
基于核磁共振法(NMR)、圆二色光谱法、激光拉曼光谱法、荧光光谱法、紫外差光谱法以及氢同位素交换法等的蛋白质溶液构象的测定。
其中利用X射线晶体衍射法测定出的蛋白质分子构象结果比较可靠。
但是,X射线方法的缺点在于:
和溶液中的构象相比,由于蛋白质构象在晶体中是静态的,所以蛋白质晶体不能测出不稳定的过渡态构象;
很多蛋白质很难结晶,或者很难得到足够大的单晶用于结构分析;
X射线晶体衍射的工作流程较长。
目前,蛋白质分子的结构预测主要采用同源蛋白预测的方法,但这非常依赖模板蛋白的序列同源性,如果序列同源性较差,那么预测结构一般较差。此外还有些蛋白质,比如生物膜上的蛋白质晶体结构还很少,因此这类蛋白质结构的理论预测还存在很大的困难。
但这几年出现了大量反相折叠的方法,它们对于序列同源性较差、但是结构同源性较好的蛋白质的结构预测提供了希望。
蛋白质结构的理论预测方法大致上可分为三类:同源模建、反相折叠和从头预测。
1.同源模建
同源模建(homology modeling)的基本假设是序列的同源性决定了三维结构的同源性,一个未知结构的蛋白质分子(目标蛋白)的结构是可以通过与之序列同源且结构已知的蛋白质(参考蛋白)来进行预测的。
一般情况下,如果模型蛋白的序列(目标序列)与参考蛋白的序列之间的序列同源性在50%以上,则通过参考蛋白准确搭建出来的蛋白具有很高的准确性;若序列同源性在30%~50%之间,则通过同源模建的方法很难得到好的结果
1、序列同源蛋白搜索
2、选择最适蛋白模板
3、蛋白同源建模
4、Loop、侧链重构,能量最优
5、蛋白结构评估
同源模建基本操作步骤
1.1同源蛋白的搜索
在搭建模型蛋白之前,需要找到和目标序列同源且已知晶体结构的蛋白质,即需要找出构建模型的参考蛋白。这个步骤可以通过搜索蛋白质结构数据库(例如Swiss-Prot,PDB,SCOP,CATH and DALI)来完成。
在同源蛋白的搜索中,FASTA是第一个广泛使用的数据库搜索程序(Lipman1985,Pearson 1988)。在FASTA的计算中,第一步找到高得分的局部区域,然后连接这些高得分的局部区域,连接时空位所引起的罚分需要减去。最后给出这个目标氨基酸的整体得分来评价它和参考蛋白质之间的序列同源性。
模板的首要条件是其蛋白质序列与未知结构蛋白质序列之间的一致性必须大于30%,假如可作为模板的结构很多,则从这些结构中选择更适当的作为模板,来提高新结构的准确性。
选择适当模板可参考以下方式:
经由多重序列排列或演化树的分析找出与未知结构蛋白质序列最接近的蛋白质结构,亦即一致性比较高的蛋白质结构
这些候选结构中,考虑它们的Resolution﹤3埃和R-factor越低越好
结构越完整越好,尤其是环状结构部分在较大的蛋白质因其残疾无法解析出来而容易被省略
选择与未知结构蛋白质作用最接近的蛋白质结构,例如配体受体(ligand-bound receptor)、酶的活性部位(active site of an enzyme)、蛋白质状态close-form/open form及其他
1.3序列比对
序列定位和排列时同源蛋白质预测的关键步骤,关系着最终模型结构的准确性。通过序列排列和定位可以确定序列保守区域,得到同源蛋白的结构排列,为下一步给SCRs赋坐标做好准备。如果一个蛋白质有多个同源蛋白质,建立模型时就要考虑到多余序列之间的比对序列。相比较双序列排列,多重序列排列可获得可信度较高的结构资讯。
显示全部