生物信息学在农业中的应用.doc
文本预览下载声明
生物信息学在农业中的应用
摘要: 20世纪80年代末,人类基因组计划(Human Genome Proiect,HGP)的启动推动了生物信息学的产生和蓬勃发展。而2002年和2009年相继完成的水稻和高粱[1]基因组测序,则宣告了相对低迷的农作物基因工程的一个繁荣的信息时代的到来。生物信息学已经成为生物学实验的一种有力的辅助工具,在科学研究中发挥着无比卓越的作用。随着植物基因组计划和功能基因组学的发展,生物信息学将为世界粮食作物的基础和应用性研究提供宝贵的数据化信息,其在农作物基因工程研究中必将发挥出更加巨大的作用。因此,有效地将生物信息学应用于农作物基因工程的研究是一项极有意义的工作。
关键字:农作物基因工程 生物信息学
1. 生物信息学
1.1 生物信息学概述
20世纪末,互联网的日益普及和生命科学的蓬勃兴起孕育了一门崭新的学科——生物信息学。生物信息学以生物大分子数据库中核酸、蛋白质为主要研究对象,综合运用数学、计算机科学和生物学多种工具对其进行存储、管理、注释、加工,使之成为具有明确生物学意的信息,同时通过对生物信息的查询、搜索、比较、分析,从中获取基因编码、基因调控、核酸和蛋白质结构功能及其相互关系等知识。目前,生物信息学已经成为生物科学家一种必不可少的工具。这门学科在农作物研究中也有着非常广泛的应用。拟南芥、水稻等模式植物的全基因组测序工作完成之后,其序列图谱完全可以在基因组数据库中查询。玉米、棉花等农作物的基因组数据库也正在构建之中。在功能基因组研究方面,有关农作物生长发育、细胞信号和基因调控的网络资源层出不穷。对于得到的全基因组序列,也就是规模的序列数据,必须用全新的视角来观察,考虑怎样才能更好的组织和解读好这些数据。对于一个特定的农作物,如果还没有它的全基因组序列,可以用相关的亲缘关系近的同线物种的基因组来替代。由于水稻、高粱和其他重要的农作物有相似的基因组水平,水稻和高粱基因组全基因组测序完成已经对农作物生物技术学和农作物生物信息学产生了重大的影响。因此,生物信息学应用于农作物基因工程的研究必将有着广阔的前景。
1.2 生物信息学资源
生物信息学资源是由数据库、计算机网络和应用软件三大部分组成。目前,有一些大型生物学数据库包含了众多的生物学资源,我们可以方便地从国际互联网上查询,不仅方便了思想和资料的交流,减少了许多重复性的工作,也提供了一种新的工作方式和思维方式。
1.2.1 核酸序列数据库
用于核酸分析的数据库主要有GenBank、EMBL 、DDBJ等3大数据库GenBank的数据来源于约140 000个物种,包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。EMBL现由EBI(European Bioinformatics Institute)管理,有全基因组鸟枪序列和序列版本文档加入。DDBJ近来开发了SQmatcKE具,用来搜索基因或蛋白质中短的碱基或氨基酸序列区域,并建立了简便且易操作的服务器。
1.2.2 蛋白质序列数据库
蛋白质序列数据库主要有SWISS—PROT,它只收录已知蛋白质序列,并且每一条数据均有详细注释,包括功能、结构域、翻译后修饰以及一些相关的综述。TrEMBL是从EMBL库中的核酸序列翻译出来的氨基酸序列,并可以作为SWISS—PROT的一种补充。
1.2.3 结构数据库
结构数据库主要包括蛋白质结构、核酸结构、小分子数据库等。这里就重要的蛋白质结构数据库加以介绍。PDB(Protein Data Bank)是最为详尽的蛋白质结构数据库,它收录由x射线晶体衍射和核磁共振得到的三维结构数据。
结构分类数据库主要是SCOP(StructuralClassification of Proteins),它将已知蛋白质的结构按照进化与结构关系进行了全面的分类。
1.2.4 基因组数据库
基因组数据库主要是指人类基因组。TIGR数据库包含大量正在测定中的基因组数据,特别是EST序列以及cDNA数据库。人类基因组数据库主要是GDB(Genome Database),它保存了大量人类基因图谱和疾病数据。Ensembl数据库拥有大量基因序列注释信息,目前包括脊椎动物、蠕虫和昆虫共9个基因组数据。
2 生物信息学在农作物研究中的应用
目前,生物信息学方法越来越广泛地被应用于农作物研究领域。许多文献的基因克隆思路是:先在基因组数据库中查询有关基因的序列信息,然后使用软件设计引物,接着运用RT-PCR克隆该基因,最后应用Southen杂交等技术对获取的基因进行检测。许多农作物微卫星序列(SSR)引物的开发也采取此策略,避免了烦琐的基因组文库杂交筛选工作。就水稻全基因组测序而言,一部分工作集中于基因组文库的构建和DNA序列的测定,而另外一部分工作
显示全部