文档详情

生物分子网络-哈医大《生物信息学基础》课件.ppt

发布:2017-09-22约9.86千字共72页下载文档
文本预览下载声明
* * 基于表达数据使用机器学习或者其它智能训练的方法可以构建一个真实的布尔网络。其基本原理时根据基因表达的实验数据建立待研究的基因之间的相互作用关系,确定每个基因的连接输入(或调控输入),并且为每个基因生成布尔表达式,或者形成网络系统的状态转换表。 真实的问题中,布尔网络不是预先知道的。相反的,表达谱等数据信息能够为布尔网络模型提供前后不同时刻各个节点的取值。布尔网络模型分析的目的就是从多时刻的基因表达谱信息构建出特定环境下基因表达调控的网络结构。 是一种连续网络模型,在这种模型中,一个基因的表达值是若干个其它基因表达值的加权和。 表示形式为: 其中,Xi(t+1)是基因i在t+1时刻的表达水平,Xj(t)是基因j在t时刻的表达水平,而wij代表基因j的表达水平对基因i的影响。 2. 线性组合模型 给定一系列基因表达水平,即给定每个基因的时间序列{Xi(t)},就可以利用最小二乘法或者多重分析法求解整个系统的差分方程组,从而确定方程中的所有参数,即确定wij。 加权矩阵模型与线性组合模型相似,在该模型中,一个基因的表达值是其它基因表达值的函数。 基因i的总调控输入ri(t)为: 其中 uj(t) 是t时刻基因j的状态,若 wij 为正值,则基因j激活基因i的表达,而负值表示基因j抑制基因i的表达,0表示基因j对基因i没有作用。 3. 加权矩阵模型 则基因i在第t+1时刻的状态可以通过Sigmoid函数计算得到 四、蛋白质互作网络的重构和应用 (一)蛋白质网络的可靠性分析 高通量检验结果中包含着大量的不确定的结果,存在着严重的假阳性问题,因此确定数据的可靠性成为蛋白质互作网络分析前一项重要的工作。 当互作的实验证据来自高通量实验时,往往需要用同一条互作信息在不同的高通量实验所证明的次数来标志互作信息的可靠程度。 此外还可以通过结合表达相关性等与互作关系密切的其它数据信息来检验互作信息的可靠性 (二)基于蛋白质网络的蛋白功能预测方法 蛋白质通过彼此的连接来行使生物学功能,因此,存在一个很自然的假设,即彼此互作的蛋白具有相同或相近的功能。 较为重要的蛋白功能预测方法包括: 邻居计数法 卡方法 结合全局信息的网络分割算法 基于概率模型的全局算法 (三)模序的搜索和分析 全连结集是蛋白质网络中普遍存在的一类模序,无论是各种全连结集出现的频率,还是最大全连接集的规模,真实的蛋白质网络都远远超过随机网络,从而说明,组成高度连接的蛋白质复合物是蛋白质行使生物功能的一种基本形式。 挖掘其它类型的蛋白质互作网络模序同样对于理解蛋白行使功能的模式有着重要的意义。有研究通过整合基因表达相关性与蛋白质互作信息,以在互作网络中搜索高表达相关路径的方式预测潜在的生物通路等。 (四)基于拓扑属性的分析 利用拓扑属性分析网络中的节点是网络生物学当中独特的方法。在蛋白质互作网络中,具有独特拓扑属性的节点蛋白往往具有独特的生物学意义。 连通度较高的中心节点(在蛋白质互作网络中常以连通度大于5的节点作为中心节点)对网络的连通性起着特别重要的意义,其中显著富集着与生命基本活动相关的必需基因、与疾病相关基因以及药物靶点基因等具有重要意义的基因的表达产物。 五、代谢网络重构和应用 (一)代谢网络的重构 构建多反应代谢网络包含由主要代谢底物指向代谢产物的转化关系,也包含酶与底物以及不同底物分子之间的相互作用关系。 参与反应的生物分子被设定为节点,转化关系和催化作用被作为边,有时在反应中临时形成的媒介复合物也被作为网络的节点。由此构建的网络包括(N+E+R)个节点,其中N表示底物数量,E表示酶数量,R表示媒介复合物的数目。 (二)代谢网络一般特征 代谢网络是最早发现无标度特性和层次化特性的生物分子网络。 作为有向网络,无论是代谢网络的出度还是入度都表现出了幂率分布P(k)~k-r的特点。 不同物种的代谢网络在大尺度特征上显示了高度的一致性。这说明代谢网络的特征不是随机的。高度模块化和无标度的属性的一个直接反应是代谢网络的直径远小于随机网络,这就使生物体对外界环境变化以及内部突变所做出的反应更为迅速和有效。 小 结 高通量的生物学检测技术产生了大量的信息资源,充实了大量的生物信息学数据库。基于不同物种、不同类型的生物分子,出现了各种生物分子网络。其中最重要的是蛋白质互作网络,基因转录调控网络,代谢网络和信号传导网络。 无标度性是生物分子网络表现出均一的网络特征之一。生物分子网络的连通度分布一般都服从幂率分布,与
显示全部
相似文档