文档详情

密码子偏好性分析讲解.ppt

发布:2016-10-29约3.95千字共28页下载文档
文本预览下载声明
密码子偏好性分析 陈永红 孟如月 制 密码子是核酸携带信息和蛋白质携带信息间对应的基本原则, 是生物体内信息传递的基本环节。在 生物的遗传密码中, 除色氨酸和甲硫氨酸只有一个密码子外, 其余氨基酸都有一个以上的简并密码子。对 同一物种, 不同蛋白编码密码子在基因中出现的频率不同; 就同一种氨基酸而言, 编码该氨基酸的不同密 码子的比率在不同的蛋白中也有差异, 因此生物体基因对简并密码子的选择具有一定的偏爱性。 同义密码子(Synonymous Codons):编码同一氨基酸的密码子。 在蛋白质编码过程中, 某一物种或某一基因通常倾向于使用一种或几种特定的同义密码子, 这种现象称为同义密码子的使用偏性(Synony mous Codon Usage Bias) 研究密码子使用偏性的意义: (一)作为预测真核生物核糖体在细胞内定位的一种手段 ,通过比较核基因编码的核糖体蛋白和线粒体基因编码的核糖体蛋白上密码子使用模式的差异来预测未知蛋白的基因所在基因组位置。 (二)通过密码子使用偏好性的研究, 可以判定一些最优密码子,针对这些密码子设计基因工程表达载体可以提高目的基因的表达量 。 (三)利用密码子使用偏好性和某种功能的关联程度对某些未知功能基因进行预测利用已知的密码子偏好知识对未知表达水平 的 基 因 进行 判 定 初步判断该基因的表达水平高或低。 (四)利用编码区和非编码区的基因组特征差异进行全基因组扫描,发现新基因。 密码子使用偏性的影响因素: (一)基因序列碱基组成的偏好性 在不存在自然选择压力 的 情 况 下, 一定方向的突变压会影响序列本身的碱基组成 ,而这一效应同时也会反映在同义密码子的第 3位上。这样 的偏好性仅仅是反映了序列组成的特征,而与蛋白功能或表达水平无关。 (二)弱的自然选择效应 对于所有密码子家族来讲,即使存在密码子偏好性,由于同义密码子并不改变最终的蛋白产 物。所以对于那些频繁被使用的密码子的选择性被认为是很弱的。但是这种弱的选择会体现在基因表达水平上。在高表达的基因中,密码子使用偏好性要强过一 般表达的基因。 (三)tRNA丰度 密码子在蛋白翻译过程中需要和携带对应反密码子的tRNA相互识别作用,才能把游离的氨基酸残基转移到多肽链上因 此这 些对应的的 tRNA丰度就决定了蛋白质合成的资源。密码子使用的偏性与细胞内tRNA 的含量呈正相关。 (四)基因长度 基因长度越长,能够容纳的密码子越多。在没有其他压力的情况下,则同义密码子被选择的概率不会受样本容量限制而出现统计上的误差;相 反基因长度越短,可以编码的密码子数量和种类越少,甚至有的密码子 根本不会出现 。 (五)蛋白质的结构功能 基因密码子的使用与基因编码的蛋白的结构和功能有关 ,蛋白质的折叠方式与序列之间存在一定的相关性 ,蛋白质的三级结构与密码子使用概 率有密切的关系。在不同物种中类型相同的基因具有相近的密码子使用 模式 。对于同一类型的基因由物种引起的同义密码子使用偏性的差异较小。 (六)蛋白的疏水性水平以及氨基酸 保守性不同的基因编码序列其氨基酸含量有可能不同,一 方 面 ,稀有氨基酸由于本身出现几率小,一旦使用某种密码子而其他密码子出现几率更小;另 一 方 ,面对 于 比 较 保 守 的氨基酸不容易发生突变则其密码子使用模式固定为序列本身组成。 研究方法 (一)研究指标 同义密码子相对使用度(Relative synonymous codon usage, RSCU):它是指对于某一特定的密码子,在编码对应氨基酸的同义密码子间的相对概率,去除了氨基酸组成对密码子使用的影响。该值的计算方法为某一密码子所使用的频率与其在无偏使用时预期频率之间的比值,如果密码子的使用没有偏好性,该密码子的RSCU值等于1,当某一密码子的RSCU值大于1时,代表该密码子为使用相对较多的密码子,反之亦然 。 其中,n表示这个密码子所代表的氨基酸的同义密码子种类数目(1n6), 戈代表第i个密码子的出现次数。RSCU是衡量密码子偏性较直观的一个参数。 密码子适应指数( Codon adaption index , CAI ) 该指数以一组具高表达水平的基因为参考 , 测量某一个基因的密码子偏好情况和这些高表达基因密码子偏好情况的接近程度 , 如果一个基因完全使用高表达基因中所用的密码子 , 则其 C AI 值为 1 。目前这个指数已被广泛用来预测基 因 的 表 达 水平。 其中RSCUmax、是高表达参照基因中,每一个氨基酸里使用频率最高的密码子的相对同义密码子使用频率,L是基因中密码子的个数 高 频 密 码 子与最优密码子 某
显示全部
相似文档