文档详情

生物技术导论论文--信息工程学院---计算机科学与技术专业.doc

发布:2017-04-03约5.69千字共6页下载文档
文本预览下载声明
生物信息学的现状与展望 姓名: 院系:信息工程 专业:计算机科学与技术 学号: 生物信息学的现状与展望 摘 要:本文阐述了生物信息学产生的背景,生物学数据库,生物信息学的主要研究内容,与生物信息学关系密切的数学和计算机科学技术领域,生物信息学产业等内容,展望了其未来并提出了若干在我国发展生物信息学的建议。着重指出,理解大量生物学数据所包括的生物学意义已成为后基因组时代极其重要的课题。生物信息学的作用将日益重要。有理由认为,今日生物学数据的巨大积累将导致重大生物学规律的发现。生物信息学的发展在国内、外基本上都处在起步阶段。因此,这是我国生物学赶超世界先进水平的一个百年一遇的极好机会。 关键词:人类基因组计划 生物信息学 一、生物信息学产生的背景 有人说,基于序列的生物学时代已经到来,尽管对“序列生物学”这一提法可能有所争议,但是今日像潮水般涌现的序列信息却是无可争辩的事实。自从1990年美国启动人类基因组计划以来,人与模式生物基因组的测序工作进展极为迅速。迄今已完成了约40多种生物的全基因组测序工作,人基因组约3x109碱基对的测序工作也接近完成。至2000年6月26日,被誉为生命“阿波罗计划”的人类基因组计划,经过美、英、日、法、德和中国科学家的艰苦努力,终于完成了工作草图,这是人类科学世上又一个里程碑式的事件。它预示着完成人类基因组计划已经指日可待。截止目前为止,仅登录在美国GenBank数据库中的DNA序列总量已超过70亿碱基对。在人类基因组计划进行过程中所积累起来的技术和经验,使得其它生物基因组的测序工作可以完成得更快捷。可以预计,今后DNA序列数据的增长将更为惊人。生物学数据的积累并不仅仅表现在DNA序列方面,与其同步的还有蛋白质的一级结构,即氨基酸序列的增长。此外,迄今为止,已有一万多种蛋白质的空间结构以不同的分辨率被测定。基于cDNA序列测序所建立起来的EST数据库其纪录已达数百万条。在这些数据基础上派生、整理出来的数据库已达500余个。这一切构成了一个生物学数据的海洋。可以打一个比方来说明这些数据的规模。有人估计,人类(包括已经去世的和仍然在世的)所说过的话的信息总量约为5唉字节(1唉字节等于1018字节)。而如今生物学数据信息总量已接近甚至超过此数量级。这种科学数据的急速和海量积累,在人类的科学研究历史中是空前的。 数据并不等于信息和知识,但却是信息和知识的源泉,关键在于如何从中挖掘它们。与正在以指数方式增长的生物学数据相比,人类相关知识的增长(粗略地用每年发表的生物、医学论文数来代表)却十分缓慢。一方面是巨量的数据;另一方面是我们在医学、药物、农业和环保等方面对新知识的渴求,这些新知识将帮助人们改善其生存环境和提高生活质量。这就构成了一个极大的矛盾。这个矛盾就催生了一门新兴的交叉科学,这就是生物信息学。美国人类基因组计划实施五年后的总结报告中,对生物信息学作了以下定义:生物信息学是一门交叉科学,它包含了生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。生物信息学这一名词的出现仅仅是几年前的事情,但是计算生物学这一名词的出现要早的多。鉴于这两门学科之间并没有或难以界定严格的分界线,在这里统称为生物信息学。 二、生物学数据库 《Nucleic Acids Research》杂志连续七年在其每年的第一期中详细介绍最新版本的各种数据库。在2000年1月1日出版的28卷第一期中详细地介绍了115种通用和专用数据库,包括其详尽描述和访问网址。迄今为止,生物学数据库总数已达500个以上。在DNA序列方面有GenBank、EMBL和DDBJ等。在蛋白质一级结构方面有SWISS-PROT、PIR和MIPS等。在蛋白质和其它生物大分子的结构方面有PDB等。在蛋白质结构分类方面有SCOP和CATH等。应该指出,几乎所有这些数据库对学术研究部门或人员来说都是免费的,可以免费下载或提供免费服务。但是鉴于相当多的数据库的经营者们面临着财务紧缺的境地,这种免费的局面还能维持多久就不得而知了。有的数据库,如SWISS-PROT,已开始向商业用户每年收取数千至数万美元不等的使用费。其它数据库暂时还是免费的,但不知是否永远免费。如果一些重要的数据库对学术研究部门开始收费,这对于我国生物信息学的发展是非常不利的。中国是一个基因信息资源大国,我们应当抓紧建设我国自有的数据库,在世界上做出我们自己的贡献,在平等的基础上与国外共享生物信息资源。 三、生物信息学的主要研究内容 生物信息学主要包括以下几个主要研究领域,但是限于篇幅,
显示全部
相似文档