植物基因功能研究方法的新进展.doc
文本预览下载声明
植物基因功能研究基因功能基因组研究应该包括两方面的内容:以全基因组测序为目标的结构基因组学(struc tural genomics)和以基因功能鉴定为目标的功能基因组(functional genomics)。结构基因组学代表基因组分析的早期阶段,以建立生物体高分辨率遗传、物理和转录图谱为主。功能基因组学代表基因分析的新阶段,是利用结构基因组学提供的信息系统地研究基因功能,它以高通量、大规模实验方法以及统计与计算机分析为特征。功能基因组学(functional genomics)又往往被称为后基因组学(postgenomics),它利用结构基因组所提供的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使得生物学研究从对单一基因或蛋白质的研究转向多个基因或蛋白质同时进行系统的研究。这是在基因组静态的碱基序列弄清楚之后转入基因组动态的生物学功能学研究。研究内容包括基因功能发现、基因表达分析及突变检测。基因的功能包括:生物学功能,如作为蛋白质激酶对特异蛋白质进行磷酸化修饰;细胞学功能,如参与细胞间和细胞内信号传递途径;发育上功能,如参与形态建成等采用的手段包括经典的减法杂交,差示筛选,cDNA代表差异分析以及mRNA差异显示等,但这些技术不能对基因进行全面系统的分析。新的技术应运而生,包括基因表达的系统分析,cDNA微阵列,DNA芯片等。鉴定基因功能最有效的方法是观察基因表达被阻断或增加后在细胞和整体水平所产生的表型变异,因此需要建立模式生物体。自华大基因启动“千种动植物基因组参考序列谱构建计划”和“千种植物转录组研究”以来,已完成水稻、黄瓜、马铃薯、白菜等植物的基因组序列图谱绘制,并通过对大豆的重测序研究建立了高密度分子标记图谱。生物信息学利用生物信息学和电子技术(互联网技术)寻找并克隆新的未知功能的基因着重于技术和操作层面,利用生物信息学对新基因进行电子克隆,及克隆该新基因的序列后对其进行简单的功能分析,如基因的编码区、启动子区、内含子/外显子、翻译启始位点和翻译终止信号预测,基因的同源比对,编码的氨基酸辨识蛋白质,蛋白质的物理性质,蛋白质的二级/三级结构、特殊局部结构以及功能预测等
序列比对是生物信息学最基本的分析技术之一,最常用的方法是将目的DNA或蛋白质序列与已知的DNA和蛋白质序列数据库进行比对,搜索到与目的序列高度同源的功能已知的基因或蛋白质,用这些基因和蛋白质预测目的基因和蛋白质的功能。局部比对搜索工具BLAST是进行序列比对的基本工具,它允许用户选择一条查询序列与一个数据库进行比对,找到数据库中与输入的查询序列相匹配的项。BLAST是一个序列数据库搜索程序家族,其中包括许多有特定用途的程序。
1.2 利用生物信息学方法分析基因芯片数据
1.2.1 差异表达分析(又称基因表达差异分析)
识别两个条件下表达差异显著的基因,即一个基因在两个条件中的表达水平,在排除各种偏差后,其差异具有统计学意义
1.2.2 聚类分析
若组内基因具有相似的表达模式,则它们可能具有相似的功能,例如受共同的转录因子调控的基因,或者产物构成同一个蛋白复合体的基因,或者参与相同调控路径的基因。在具体应用中可按照相似的表达谱对基因进行聚类,从而预测组内未知基因的功能。目前已经有很多种聚类的方法应用到基因芯片的研究当中,如层次聚类(Hierarchical clustering)、K 均值聚类(K-means clustering)、自组织映射(self organizing map)、PCA (principlecomponet analysis)等。
1.3 通过生物信息学方法分析蛋白质结构来预测蛋白质功能
在氨基酸序列整体同源性不明显的情况下,对蛋白质的功能域进行分析将对预测基因功能提供极其有价值的信息。目前已通过多序列比对将蛋白质的同源序列收集在一起,确定了大量蕴藏于蛋白质结构中的保守区域或序列,如结构域(domain)和模体(motif),这些共享结构域和保守模体通常与特定的生物学活性相关,反映了蛋白质分子的一些重要功能。
2 实验分析确定基因功能
2.1 基因失活在基因功能分析的作用
基因失活是基因功能分析的主要手段。基因的功能是一个过程,是从基因到表型的一系列生理生化反应过程。现在的基因功能研究与传统的遗传分析正好相反,传统的遗传分析是从表型出发最终到达基因(正向遗传学),而在基因组计划中研究基因功能则是从基因出发,最终到达表型(反向遗传学)。因此必须寻找一系列的实验方法来鉴别与目标基因相关的表型
2.1.1 基因剔除(knock-out)
基因剔除(knock-out):最简单的基因失活方法,将一段无关的DNA片段用来取代目标基因。
原理:在一段无关DNA 片段的两侧连接与代换基因两侧相同的顺序,将
显示全部