python高级数据处理与可视化.pdf
文本预览下载声明
Advanced Data Processing and Visualization of Python
Python高级数据 与
处理 可视化
Department of Computer Science and Technology
Department of University Basic Computer Teaching
用Python玩转数据
聚类分析
Nanjing University
聚类 3
• 聚类分析(cluster analysis)
以相似性为基础把相似的对象通过静态
分类的方法分成不同的组别或者更多的子集
– 特性
• 基于相似性
• 有多个聚类中心
Nanjing University
4
K-MEANS
K-均值算法表示以空间中k个点为中心进行聚类,对最靠近他们的对
象归类。
A B
任意选择k个
对每个点确定
对象作为初始
其聚类中心点
聚类中心
不收敛
计算每个新聚
聚类完成
类的聚类中心
收敛
C D
Nanjing University
一个日常小例子 5
高数 英语 Python 音乐 File
小明 88 64 96 85 # Filename: kmeansStu.py
大明 92 99 95 94 from pylab import *
from scipy.cluster.vq import *
小朋 91 87 99 95 list1 = [88,74,96,85]
大朋 78 99 97 81 list2 = [92,99,95,94] scipy.cluster.vq更新
小萌 88 78 98
显示全部