在学习图像分析技术过程中,接触到Mean-Shift算法,由于对.PDF
文本预览下载声明
在学习图像分析技术过程中,接触到 Mean-Shift 算法,由于对模式识别相关知识不太了解
故理解有点困难,参考了清华 《模式识别》和覃剑的 《基于边界力的 Mean-Shift 核窗宽自
适应算法》初步得到了如下的理解。
1、目标模型,算法采用的是特征值的加权概率分布来描述目标模型。这应该是模式识别中
主要描述目标的模型,不同于自动控制理论中采用的状态方程。
目标模型 q = {q } u Î[1,,m] 共m 个特征值。
u
2
n æ X -X ö
ç i 0 ÷
q(u) = Cåk d(b(X ) -u) i Î[1,...,n]
i=1 ç H ÷ i
è ø
其中X 是窗口中心点向量值 (可能为RBG 向量或者灰度值),X 是窗口内第i 点向量值。
0 i
C 为归一化常数,保障å q = 1。k (x )为核函数,H 为核函数的带宽向量。M 为
uÎ[1,...,m] u
特征值的个数,对应于图像处理可以理解为灰度等级划分的个数,从而特征值u 为对应的灰
度等级。d 函数为脉冲函数,保证只有具有u 特征值的像素才对概率分布作出贡献。从而k
d
函数可以理解为u 灰度值的一个加权频数。
2 、匹配对象,也采用特征值加权概率分布 e
2
nh æ X - Y ö r
ç i ÷
p (Y) = C åk d(b(X ) -u) i Î[1,...,n ]
u h i=1 ç Hh ÷ i e h
è ø t
其中,Y 为匹配对象的中心,X 是匹配窗口内第i 点向量值,H 为匹配窗口的核函数带宽
i s h
i
向量。C 为匹配窗口特征向量的归一化常数。
h g
3、匹配对象与目标模型的相似程度,相似函数可采用Bhattacharyya 函数
e m
r(p (Y), q) = å p (Y)q
u u
R u=1
4 、匹配过程就是寻找相似函数最大值的寻优过程,Mean-Shift 采用的是梯度下降法。首先
n
将r(Y) 在p (Y ) 附近进行泰勒级数展开,取前两项。即:
0
U
dr
r(Y) » r(Y ) + (p (Y) -p (Y ))
0 dp
显示全部