文档详情

python高级数据处理与可视化.pdf

发布:2018-10-17约2.61万字共50页下载文档
文本预览下载声明
Advanced Data Processing and Visualization of Python Python高级数据 与 处理 可视化 Department of Computer Science and Technology Department of University Basic Computer Teaching 用Python玩转数据 聚类分析 Nanjing University 聚类 3 • 聚类分析(cluster analysis) 以相似性为基础把相似的对象通过静态 分类的方法分成不同的组别或者更多的子集 – 特性 • 基于相似性 • 有多个聚类中心 Nanjing University 4 K-MEANS K-均值算法表示以空间中k个点为中心进行聚类,对最靠近他们的对 象归类。 A B 任意选择k个 对每个点确定 对象作为初始 其聚类中心点 聚类中心 不收敛 计算每个新聚 聚类完成 类的聚类中心 收敛 C D Nanjing University 一个日常小例子 5 高数 英语 Python 音乐 File 小明 88 64 96 85 # Filename: kmeansStu.py 大明 92 99 95 94 from pylab import * from scipy.cluster.vq import * 小朋 91 87 99 95 list1 = [88,74,96,85] 大朋 78 99 97 81 list2 = [92,99,95,94] scipy.cluster.vq更新 小萌 88 78 98
显示全部
相似文档