文档详情

基于自适应密度邻域关系的多标签在线流特征选择.pdf

发布:2024-04-14约3.48万字共7页下载文档
文本预览下载声明

第34卷摇第1期计算机技术与发展Vol.34摇No.1

2024年1月摇摇摇摇摇摇摇摇摇摇COMPUTERTECHNOLOGYANDDEVELOPMENT摇摇摇摇摇摇摇摇摇摇Jan.摇2024

基于自适应密度邻域关系的多标签

在线流特征选择

122

张海翔,李培培,胡学钢

(1.蚌埠医学院附属合肥市第二人民医院讯息处,安徽合肥230012;

2.合肥工业大学大数据知识工程教育部重点实验室,安徽合肥230601)

摘摇要:流特征选择指从以流形式到来的特征数据中选出最优特征子集,现有方法大多在模型训练中需要事先学习领域

信息并预设给定参数值。实际应用中,由于不同的数据集数据结构和来源不同,在模型学习过程中研究人员无法提前获

取相关领域知识且针对不同类型数据集指定一个统一参数存在巨大挑战。基于此,提出一种基于自适应密度邻域关系的

多标签在线流特征选择方法(multi-labelonlinestreamfeatureselectionbasedonadaptivedensityneighborhoodrelation,ML-

OFS-ADNR),基于邻域粗糙集理论,所提方法在特征依赖计算时无需任何先验领域信息。此外,提出了一种新的自适应

密度邻域关系,使用周围实例的密度信息,可以在流特征选择过程中自动选择适当数量的邻域,不需要事先指定任何参

数。通过模糊等价约束,ML-OFS-ADNR可以选择高依赖低冗余度的特征。实验表明在10种不同类型的数据集上,所提

方法在特征数量相同的情况下优于传统特征选择方法和先进的在线流特征选择方法。

关键词:多标签分类;流特征;邻域粗糙集;自适应密度邻域;在线流特征选择

中图分类号:TP183摇摇摇摇摇摇摇文献标识码:A摇摇摇摇摇摇文章编号:1673-629X(2024)01-0023-07

doi:10.3969/j.issn.1673-629X.2024.01.004

Multi-labelOnlineStreamFeatureSelectionBasedonAdaptive

DensityNeighborhoodRelation

122

ZHANGHai-xiang,LIPei-pei,HUXue-gang

(1.InformationDivision,TheSecondPeoplesHospitalofHefeiAffiliatedto

BengbuMedicalCollege,Hefei230012,China;

2.KeyLaboratoryofKnowledgeEngineeringwithBigDataofMinistryofEducation,

HefeiUniversityofTechnology,Hefei230601,China)

Abstract:Streamfeatureselectionselectstheoptimalfeaturesubsetfromt

显示全部
相似文档