数据仓库与数据挖掘习题课3.ppt
文本预览下载声明
数据仓库与数 据 挖 掘 主讲教师:王浩畅 E-mail: wanghch_angel@ School of Computer Information Technology of NEPU 习题课3 习题7.3 习题7.3 给定两个对象,分别表示为(22,1,42,10),(20,0,36,8): (a)计算两个对象之间的欧几里得距离 (b)计算两个对象之间的曼哈顿距离 (c)计算两个对象之间的明考斯基距离,p=3 解答7.3 (a)计算两个对象之间的欧几里得距离 (b)计算两个对象之间的曼哈顿距离 (c)计算两个对象之间的明考斯基距离,p=3 习题7.6 假设数据挖掘的任务是将如下 8个点(用(x,y)代表位置)聚类为3个簇: A1(2,10), A2(2,5),A3(8,4), B1(5,8),B2(7,5), B3(6,4), C1(1,2), C2(4,9) 距离函数是欧几里德距离.假设初始选择A1, B1,C1为每个聚类的中心.用k-平均算法来给出 (a) 在第一次循环执行后的三个聚类中心 (b) 最后的三个簇 解答7.6 (a) (2,10),(6,6),(1.5,3.5) (b) A1 B1 C2 A3 B2 C3 A2 C1 d2 A1 A2 A3 B1 B2 B3 C1 C2 1 0 25 36+36 9+4 25+25 16+36 1+64 4+1 2 9+4 9+9 9+16 0 4+9 1+16 16+36 1+1 3 1+64 1+9 53 16+36 45 29 0 58 第一次迭代: 中心为1: A1(2,10), 2: B1(5,8), 3: C1(1,2) 因此: 1: A1 (2,10) 2:A3, B1,B2, B3, C2 (6, 6) 3: A2, C1 (1.5,3.5) d2 A1 A2 A3 B1 B2 B3 C1 C2 1 0 25 36+36 9+4 25+25 16+36 1+64 4+1 2 32 17 8 5 2 4 41 13 3 .52+ 6.52 .52+1.52 6.52+0.52 3.52+4.52 5.52+1.52 4.52+0.52 0.52+1.52 2.52+5.52 第二次迭代: 中心为1: (2,10), 2: (6,6), 3: (1.5,3.5) 1: A1, C2 (3.5,9.5) 2:A3, B1,B2, B3 (6.5, 5.25) 3: A2, C1 (1.5,3.5) d2 A1 A2 A3 B1 B2 B3 C1 C2 1 1+.52 1+4.52 52+5.52 22+1.52 42+4.52 32+5.52 22+7.52 12+.52 2 4.52+7.52 4.52+ 0.252 1.52+ 1.252 1.52+ 2.752 .52+0.252 .52+1.252 5.52+ 3.252 2.52+3.752 3 .52+ 6.52 .52+1.52 6.52+0.52 3.52+4.52 5.52+1.52 4.52+0.52 0.52+1.52 2.52+5.52 第三次迭代: 中心为1: (3.5,9.5 ), 2: (6.5,5.25), 3: (1.5,3.5) 1: A1, B1,C2 (11/3,9) 2:A3, B2, B3 (7, 13/3) 3: A2, C1 (1.5,3.5) d2 A1 A2 A3 B1 B2 B3 C1 C2 1 2 3 .52+ 6.52 .52+1.52 6.52+0.52 3.52+4.52 5.52+1.52 4.52+0.52 0.52+1.52 2.52+5.52 第四次迭代: 中心为1: (11/3,9), 2: (7, 13/3), 3: (1.5,3.5) 1: A1, B1,C2 (11/3,9) 2:A3, B2, B3 (7, 13/3) 3: A2, C1 (1.5,3.5) * * * * * * * * * * * * * * * * * * * *
显示全部