文档详情

结肠癌基因表达谱的特征选取研究-山东大学学报工学版.pdf

发布:2017-11-13约1.98万字共7页下载文档
文本预览下载声明
 第42卷 第2期 山 东 大 学 学 报 (工 学 版) 2012年4月       Vol.42  No.2    JOURNALOFSHANDONGUNIVERSITY(ENGINEERINGSCIENCE) Apr.2012   文章编号:16723961(2012)02002307   DOI:10.6040/j.issn.16723961.2012.02.005 结肠癌基因表达谱的特征选取研究 潘冬寅,朱发,徐癉,业宁 (南京林业大学信息科学与技术学院,江苏 南京210037) 摘要:为了找到与结肠癌相关的基因,提高结肠癌样本的识别率,提出了基于Chernoff距离的浮动顺序搜索算法 (sequentialfloatingsearchmethod,SFSM)。通过对结肠癌基因表达谱数据集的分析,对每个基因进行评价和筛选; 对筛选后的基因子集利用SFSM算法进行搜索,并以Chernoff距离作为其评估函数,生成若干候选特征基因子集; 利用支持向量机(supportvectormachine,SVM)、K近邻(Knearestneighbor,KNN)和径向基(radicalbasisfunction, RBF)神经网络分类器来检验候选特征基因子集的分类效果。实验结果表明,利用SFSM及评估函数Chernoff距离 发现在参数 =025时能找到最佳的特征基因组合,该组合能以很高的正确率识别结肠癌样本。 β 关键词:特征选择;Chernoff距离;浮动顺序搜索;支持向量机;K近邻;径向基神经网络 中图分类号:TP3914   文献标志码:A Featureselectionofgeneexpressionprofilesofcoloncancer  PANDongyin,ZHUFa,XUSheng,YENing (CollegeofInformationTechnology,NanjingForestryUniversity,Nanjing210037,China) Abstract:Inordertoimprovetherecognitionrateofcoloncancersamplebyselectingtherelatedgenes,sequential floatingsearchmethod(SFSM)basingonChernoffdistancewasproposed.Everygenewasevaluatedandselectedby analyzingthedatasetofthecoloncancergeneexpressionprofiles.Somecandidatefeaturegenesubsetswereobtained bysearchingtheselectedgenesubsetwiththemethodofSFSMwhoseevaluationfunctionwasChernoffdistance.Three differentclassifies,supportvectormachines,Knearestneighbors,andRBFneuralnetworks,wereusedtovalidatethe classifiedefficiency.Theexperimentalresultsshowedthatwhen =025,thefeaturegenecombinationobtainedbySF β SMwithChernoffdistanceasitsevaluationfunctio
显示全部
相似文档