基于密度的不确定性数据概率聚类.pdf
文本预览下载声明
第 36 卷 第 5 期 计 算 机 科 学 Vol . 36 No . 5
2009 年 5 月 Co mp ut er Science May 2009
基于密度的不确定性数据概率聚类
1 ,2 2 2 3
许华杰 李国徽 杨 兵 杜建强
( ) 1 ( ) 2
上海第二工业大学计算机与信息学院 上海 20 1209 华中科技大学计算机学院 武汉 430074
(江西中医大学计算机学院 南昌330006) 3
摘 要 近期传感数据监测和移动对象跟踪等许多从自然界直接采集数据的新应用引发了不确定性数据管理这一新
的研究课题 。这些应用中相关数据的不确定性为传统的数据处理方法提出了新的挑战 。探讨的重点是不确定性数据
的聚类 。提出了一个针对不确定性数据的基于密度的聚类算法 ,根据不确定性数据内在的概率分布信息进行概率聚
类 ,并采用 R 树索引和概率阀值索引提高算法的效率 。仿真试验表明 ,提出的算法在有效性和效率方面均优于当前
主要的基于密度的不确定性数据聚类算法 。
关键词 基于密度的聚类 ,不确定性数据 ,R 树
Probabil istic Densitybased Clustering of Uncertain Data
XU Huaj ie1 ,2 L I Guohui2 YAN G Bing2 DU J ianqiang3
( School of Comp ut er and Infor mation ,Shanghai Second Polyt echnic U niver sit y , Shanghai 20 1209 ,China) 1
( School of Comp ut er Science and Technology , Huazhong U niver sit y of Science and Technology ,Wuhan 430074 ,China) 2
( School of Comp ut er ,J iangxi U niver sit y of Traditional Chinese Medicine ,Nanchang 330006 ,China) 3
Abstract Recently ,many new application s such a s sen sor dat a monitoring and mobile obj ect t racking rai se up t he i ssue
of uncert ain dat a management . The int rin sic uncert aint y of t he dat a in such app lication s offer s new challenges for t radi
tional dat a p rocessing met hods. The focu s of t he p ap er i s clu st ering of uncert ain dat a . A p robabili stic den sit ybased clu s
t ering algorit hm for uncert ain dat
显示全部