结肠癌基因表达谱的特征选取研究-山东大学学报工学版.pdf
文本预览下载声明
第42卷 第2期 山 东 大 学 学 报 (工 学 版) 2012年4月
Vol.42 No.2 JOURNALOFSHANDONGUNIVERSITY(ENGINEERINGSCIENCE) Apr.2012
文章编号:16723961(2012)02002307 DOI:10.6040/j.issn.16723961.2012.02.005
结肠癌基因表达谱的特征选取研究
潘冬寅,朱发,徐癉,业宁
(南京林业大学信息科学与技术学院,江苏 南京210037)
摘要:为了找到与结肠癌相关的基因,提高结肠癌样本的识别率,提出了基于Chernoff距离的浮动顺序搜索算法
(sequentialfloatingsearchmethod,SFSM)。通过对结肠癌基因表达谱数据集的分析,对每个基因进行评价和筛选;
对筛选后的基因子集利用SFSM算法进行搜索,并以Chernoff距离作为其评估函数,生成若干候选特征基因子集;
利用支持向量机(supportvectormachine,SVM)、K近邻(Knearestneighbor,KNN)和径向基(radicalbasisfunction,
RBF)神经网络分类器来检验候选特征基因子集的分类效果。实验结果表明,利用SFSM及评估函数Chernoff距离
发现在参数 =025时能找到最佳的特征基因组合,该组合能以很高的正确率识别结肠癌样本。
β
关键词:特征选择;Chernoff距离;浮动顺序搜索;支持向量机;K近邻;径向基神经网络
中图分类号:TP3914 文献标志码:A
Featureselectionofgeneexpressionprofilesofcoloncancer
PANDongyin,ZHUFa,XUSheng,YENing
(CollegeofInformationTechnology,NanjingForestryUniversity,Nanjing210037,China)
Abstract:Inordertoimprovetherecognitionrateofcoloncancersamplebyselectingtherelatedgenes,sequential
floatingsearchmethod(SFSM)basingonChernoffdistancewasproposed.Everygenewasevaluatedandselectedby
analyzingthedatasetofthecoloncancergeneexpressionprofiles.Somecandidatefeaturegenesubsetswereobtained
bysearchingtheselectedgenesubsetwiththemethodofSFSMwhoseevaluationfunctionwasChernoffdistance.Three
differentclassifies,supportvectormachines,Knearestneighbors,andRBFneuralnetworks,wereusedtovalidatethe
classifiedefficiency.Theexperimentalresultsshowedthatwhen =025,thefeaturegenecombinationobtainedbySF
β
SMwithChernoffdistanceasitsevaluationfunctio
显示全部