文档详情

基于序列的病毒宿主蛋白蛋白相互作用预测.docx

发布:2024-12-30约1.39万字共13页下载文档
文本预览下载声明

PAGE4

摘要

蛋白质序列决定蛋白质的结构和功能,氨基酸序列决定蛋白质之间的作用。本研究基于蛋白质序列,通过机器学习算法对病毒与宿主蛋白质之间的相互作用进行了预测。从VirHostnet数据库中得到29945条病毒-宿主蛋白质相互作用数据,作为阳性样本,通过随机匹配产生阴性样本。使用了两种特征编码算法(氨基酸组成AAC和局部描述符CTDC),进行了特征选择、聚类、降维、特征归一化四种特征分析方法,通过5折交叉验证和独立测试比较以两种特征编码算法构建的模型,发现仅以氨基酸组成构建的随机森林模型和整合支持向量机和随机森林的集成学习模型预测效果最好,AUC值均为0.89,结果表

显示全部
相似文档