基于改进SMOTE算法的不平衡数据分类问题研究.pdf
文本预览下载声明
摘要
摘要
分类问题一直是数据挖掘中的一个重要组成部分,但在分类问题研究过程中,人
们发现在实际数据中经常出现其中一类数据的数量远大于另一类数据的数量的情况,
也就是出现数据类不平衡的问题。并且在传统分类算法中,通常情况下是假定数据集
为平衡分布,所以当数据集类不平衡时,会导致样本的总体分类准确率较高,但少数
类样本的识别率却很低。而往往在不平衡数据集中,误判少数类样本的代价远高于误
判多数类样本的代价。因此,解决该问题的
显示全部