文档详情

生物信息学讲义——双序列比对.ppt

发布:2017-05-25约1.22万字共87页下载文档
文本预览下载声明
* No tree building in BLOSUM * This step is similar to BLOSUM * * * * Calculate scaled original residue?residue specific mutation rate. Rebuild mutation frequency matrix for 1 evolutionary period. * Add up to 1 at every row. Pr(mutate to j| was i) * * * * Introduce the names of the two sets of most commonly used scoring matrices for protein sequences * * BLAST软件包实际上是综合在一起的一组程序,不仅可用于直接对蛋白质序列数据库和核酸序列数据库进行搜索,而且可以将检测序列翻译成蛋白质或将数据库翻译成蛋白质后再进行搜索,以提高搜索结果的灵敏度。 BLAST程序检测序列和数据库类型 程序名 检测序列 数据库类型 方 法 Blastp 蛋白质 蛋白质 用检测序列蛋白质搜索蛋白质序列数据库 Blastn 核酸 核酸 用检测序列核酸搜索核酸序列数据库 Blastx 核酸 蛋白质 将核酸序列按6条链翻译成蛋白质序列后搜索蛋白质序列数据库 Tblastn 蛋白质 核酸 用检测序列蛋白质搜索由核酸序列数据库按6条链翻译成的蛋白质序列数据库 Tblastx 核酸 核酸 将核酸序列按6条链翻译成蛋白质序列后搜索由核酸序列数据库按6条链翻译成的蛋白质序列数据库 对一般用户来说,目前常用的办法是通过NCBI、EBI等国际著名生物信息中心的BLAST服务器进行搜索。需要说明的是,各生物信息中心BLAST用户界面有所不同,所提供的数据库也可能不完全相同,使用前最好先进行适当的选择。 BLAST 应用实例 多结构域蛋白 (H1N1) 脂质运载蛋白 多结构域蛋白 (H1N1) 的BLAST检索 gi|224983683|pdb|3GBN|B Chain B, Crystal Structure Of Fab Cr6261 In Complex With The 1918 H1n1 Influenza Virus Hemagglutinin GLFGAIAGFIEGGWTGMIDGWYGYHHQNEQGSGYAADQKSTQNAIDGITNKVNSVIEKMNTQFTAVGKEF NNLERRIENLNKKVDDGFLDIWTYNAELLVLLENERTLDFHDSNVRNLYEKVKSQLKNNAKEIGNGCFEF YHKCDDACMESVRNGTYDYPKYSEESKLNREEIDGVSGR 多结构域蛋白 (H1N1) 的BLAST检索 H1N1聚合酶序列 BLAST结果综述 BLAST结果表述 BLAST结果逐条显示 BLAST结果逐条显示 BLAST:改变打分矩阵的作用 脂质运载蛋白 序列 sp|P31025|LCN1_HUMAN Lipocalin-1 OS=Homo sapiens GN=LCN1 PE=1 SV=1 MKPLLLAVSLGLIAALQAHHLLASDEEIQDVSGTWYLKAMTVDREFPEMNLESVTPMTLT TLEGGNLEAKVTMLISGRCQEVKAVLEKTDEPGKYTADGGKHVAYIIRSHVKDHYIFYCE GELHGKPVRGVKLVGRDPKNNLEALEDFEKAAGARGLSTESILIPRQSETCSPGSD 使用Blosum62矩阵搜索 使用PAM30矩阵搜索 FastA简介 FastA算法是由Lipman和Pearson于1985年发表的(Lipman和Pearson,1985)。FastA的基本思路是识别与代查序列相匹配的很短的序列片段,称为k-tuple。 蛋白质序列数据库搜索时,短片段的长度一般是1~2个残基长;DNA序列数据库搜索时,通常采用稍大点的值,最多为6个碱基。通过比较两个序列中的短片段及其相对位置,可以构成一个动态规划矩阵的对角线方向上的一些匹配片段。 FastA程序采用渐进(heuristic approach)算法将位于同一对角线上相互接近的短片段连接起来。也就是说,通过不匹配的残基将这些匹配残基片段连接起来,以便得到较长的相似性片段。这就意味着,FastA输出结果中允许出现不匹配残基。这和BLAST程序中的成对片段类似。如果匹配区域很多,FastA利用动态规划算法在这些匹配区域间
显示全部
相似文档