《人工智能基础与应用》第4章 分门别类:帮你分而治之课后习题参考答案.pdf
《人工智能基础与应用》第4章分门别类:帮你分而治之课后习题参考答案--第1页
第4章分门别类:帮你分而治之
课后习题答案
一、考考你
1.关于正负样本的说法正确是D。
A.样本数量多的那一类是正样本B.样本数量少的那一类是负样本
C.正负样本没有明确的定义D.想要正确识别的那一类为正样本
2.分类器实质为一个A,把样本的特征集X映射到一个预先定义的类标号y。
A.模式B.函数C.映射D.转换
3.用计算概率来解决分类问题是哪种分类器C。
A.决策树B.最近邻C.贝叶斯D.支持向量机
4.识别手写数字过程中,对图片进行灰度化处理的主要原因是C。
A.方便转为文本格式B.尽可能保存全部图片信息
C.较少计算量,同时尽可能保存图片信息D.有利于提高分类效果
5.SVM的最优分界面是由A决定的。
A.支持向量B.所有样本C.多数样本D少数样本
二、亮一亮
1.最近邻分类器与支持向量机各自分类的基本思想是什么?
参考答案:
最近邻分类器的基本思想:找到与待分类的样本最相似的k个邻居,这k个邻居中多数
邻居属于哪一类,那么就指定该样本属于哪一类。即我们把每个具有n个特征的样本看作n
维空间的一个点,对于给定的新样本,先计算该点与其它样本点的距离(相似度),然后将新
样本指派为周围k个最近邻的多数类。该分类思想源于这样的常识:判别一个人是好人还是
坏人,可以从跟他走得最近的k个人来判断,如果k个人中多数是好人,那么可以指派他为
好人,否则他是坏人。
支持向量机分类器的基本思想:通过非线性映射,把无法在低维样本空间分类的问题映
射到一个高维的特征空间,在高维空间通过一个线性超平面而非低维空间的直线将样本完全
划分开。
2.在案例1的手写数字识别过程中,个别样本出现错分的现象,主要原因是什么?
参考答案:
个别样本出现错分主要原因有:
(1)因训练样本数据规模不够造成分类模型学习不够,导致不能有效应对各种样本的
分类;
《人工智能基础与应用》第4章分门别类:帮你分而治之课后习题参考答案--第1页
《人工智能基础与应用》第4章分门别类:帮你分而治之课后习题参考答案--第2页
(2)样本质量不高时也会影响模型识别的正确率。
三、帮帮我
1.尝试改用SVM方法来识别手写数字,建议核函数使用rbf,其它模型参数自己设定,
对比SVM模型的识别效果与案例1的差异,并分析原因。
参考答案:
#数字图片信息转存为txt文件
importos
fromPILimportImage
importnumpyasnp
importpandasaspd
importsklearn.model_selectionasms
#定义图片到文本的转换函数
defimgtotext(imgfile,txtfile,size=(32,32)):