基于Fisher分和支持向量机的特征选择算法.docx
文本预览下载声明
2014年 12月计算机工程与设计Dec.2014第 35卷 第 12期COMPUTERENGINEERING AND DESIGNVol.35No.12基于 Fisher分和支持向量机的特征选择算法张润莲1,张昭1,彭小金1,曾兵2(1.桂林电子科技大学信息与通信学院,广西 桂林 541004;2.保密通信重点实验室,四川成都 610041) 摘 要:网络入侵数据集中存在的大量冗余和噪声特征严重影响检测系统的性能。 针对该问题, 提出一种基于 Fisher分 和 支持向量机的入侵特征选择算法。通过对各维特征的 Fisher分 值排序,结合支持向量机分类算法, 建立特征分类模型, 筛 选出具有最高检测率与误码率比值的最优特征组合。仿真结果表明,该算法筛选出的特征组合具有较高的检测率和较低的 误码率,有效降低了检测系统的建模时间和测试时间,提高了系统性能。关键词:入侵检测;Fisher分 ;支持向量机;特征选择;数据标准化中图法分类号 :TP393.08 文献标识号 :A 文章编号 :1000-7024 (2014)12-4145-04FeatureselectionalgorithmbasedonFishervalueandsupportvectormachineZHANG Run-lian1,ZHANGZhao1,PENG Xiao-jin1,ZENG Bing2(1.SchoolofInformationandCommunication,GuilinUniversityofElectronicTechnology,Guilin541004,China;2.ScienceandTechnologyonCommunicationSecurityLaboratory,Chengdu610041,China)Abstract:Therearemanyredundantandnoisycharacteristicsinnetworkintrusiondetectiondataset,whichleadstoabadper- formanceofthedetectionsystem.Tosolvetheproblems,anintrusionfeatureselectionalgorithmbasedonFishervalueandsup- portvectormachinewasproposed.BycombiningthesupportvectormachineandsortingFishervalueofeachdimensionalfea- ture,theoptimalfeaturesubsetwhichownedthehighestratioofdetectionrateandbiterrorratewasselected.Thesimulation testresultsshowthatthemethodcaneliminatenoisycharacteristicsoftheintrusiondataset,reducethemodelingtimeandthe testingtimeofthedetectionsystem,andimprovetheperformanceofthesystem. Keywords:intrusiondetection;Fishervalue;supportvectormachine;featureselection;datastandardization0 引言在网络入侵检 测 中, 过多的噪声特征和冗余 特 征 严 重 影响了入侵检测系统的性能和准确率, 优化特征选择是入 侵检测系统解决该问题的有效途径。特征选择是从一组特征中筛选出对分类器分类性能影 响最重要的特征 子 集, 并在不明显影响分类检测率的情况 下,挑选出最优特征组合的过程。 特征选择不仅可以 降 低 特征的维数,降低特征提取以及系统数据处理的难度, 还 能够剔除 数据集中的冗余和噪声特 征, 提 高 系 统 效 率。 Fisher准则是一种 有效的特征评价准则, 可以很好地剔除 噪声特征, 降 低 特 征 维 数。 但 Fisher准则独立于分类器 ,其需要与其它技 术 相 结 合, 以有效确定出对分类最优的特 征组合。文献 [1] 提出一种基于改进的 Fisher准 则的特征 选择算法用于文本情感分类;文献 [2] 将基于支持向量机 和 Fisher准则相结合进行特征选择 ;文献 [3] 则采用基于 Fisher准则和特征聚类进行特征选择 。本文提出一种基于 Fisher分和支持向量机相结合的特 征选择
显示全部