基于SVM的多类文本分类研究_张爱丽.pdf
文本预览下载声明
#情报方法# Journal of I nfor mat ion No. 9, 2004
*
SVM
张爱丽 刘广利 刘长宇
( ) ( )
基于统计学习理论, 构建了 SVM 文本分类模型, 并给出了模型参数的loo 自动选择算法, 解决了 往参数靠
经验确定的弊端传统的文本分类系统不能处理一篇文档同属多类别的情形, 论文将该情形归结为多类文本分类问
题, 提出二叉决策树SVM 模型, 并就农业机械化工程文档进行了实证分析结果表明, 该算法具有较好的分类效果
文本分类 支持向量机(SVM) 模型选择 留一法( loo)
, s.t. 6 Ay = 0,A E 0, i= 1, 2, ,, l.l
i i i
C ( i= 1, ,, M) i i= 1
A* ( Q) , (w#w) = 6 A * A* y y (x
i j i j i
( ) Wi SV
#x ) . A, A( y(w#x+ b) - 1) = 0 bj i i i i
= (W , ,W ,, W ) , W k , l
i1 ik i, li, ik i
x , sgn[ (w#x) + b] ,
W , U ,U, W
1 n
x
FF ,
,
, C = (t , ,t ,, t ) , t
i i1 ik is ik
W C d F , N E 0, i
k i j
y (w#x + b) E 1- N,NE 0, i= 1, ,, l. i i
, d D = (t , ,t ,, t ) t
j j j1 jk js jk
W d , ,
显示全部