3 生物信息学 蛋白质部分.pdf
文本预览下载声明
生物信息学蛋白质部分
医学科学实验中心
李洪涛
一、简介
(Introduction)
二、蛋白质数据库
(Protein Databases)
三、蛋白质序列分析
(Protein Sequence Analysis)
Why
Protein bioinformation?
20世纪人类科学史上三大工程
90年代的人类基
因组计划
60年代的阿波罗登月计划
40年代的曼哈顿原子弹计划
(2001) Draft Sequence of
Human Genome Published
The HGP consortium publishes its working draft in
Nature (15 February), and Celera publishes its draft
in Science (16 February).
后基因组时代
?人类基因组草图绘制完成一年后,以基因组
研究的未来走向及其在医药领域的发展应用为
主题,2004年国际人类基因组大会在柏林
召开。与会科学家说,当前人类已经步入“后
基因组时代”。
DNA sequence
Protein sequence
Protein structure
Protein function
基因组(genome = gene + chromosome):
生物体所拥有的全套染色体上的全部基因
转录组(transcriptome=transcript + genome):
一种细胞、组织或生物体完整基因组所对应的全
套mRNA
蛋白质组(proteome = protein + genome):
一种细胞、组织或生物体完整基因组所对应的全
套蛋白质
? 蛋白质组学( Proteomics)旨在阐明生物体全部蛋白
质的表达模式及功能模式,其内容包括鉴定蛋白质的
存在方式(修饰形式),研究其结构、功能、定量和
相互作用等。
“小科学”时代的“钓鱼”和组学时代的“捞鱼”
蛋白质组学与基因组学区别?
“A butterfly and a caterpillar
have the same genome but
different proteomes.”
Ron Orlando
差别一:蛋白质组具有多样性
蛋白质组中蛋白质的数目超过基因组的数目,
这一事实被许多研究证实与以下两种因素有关:
1、在转录时,一个基因可以剪接为多种
mRNA形式, 即可变剪接。
2、同一蛋白可能以许多形式进行翻译后修
饰。
预 30 000多个基因
计
的 4~6种可变剪切形式
基
因
组 120 000种可能的mRNA
与
蛋 >200种的翻译后修饰(PTM)方式
白
质 24 000 000种可能的蛋白质同型异构体
组 (protein isoforms)
的
数
量
关
预计有2 000 000种行使功能的蛋白质
系
差别二:时空性
在测定基因组的DNA序列时不需要考虑时空的影响。在蛋白
质组的研究中,时间和空间的影响都是不可忽略的。
1. 在个体发育的不同阶段产生的蛋白质不一样。
2. 不同蛋白质的寿命也不一样。
3. 不同的蛋白质定位于细胞内的位臵不同
4. 许多蛋白质在细胞里不是静止不动的,它们在细胞里常常
通过在不同亚细胞环境里的运动发挥作用。
因此,在进行蛋白质组分析时,需要把时间和空间作为重要
的参数。
空间上的差异 时间上的差异
Purposes:Therapeutic target discovery
Diagnostic/prognostic marker development
Mechanistic study
差别三:相互作用
? 蛋白质
显示全部