文档详情

《人工智能基础与应用》第4章分门别类：帮你分而治之课后习题参考答案.pdf

发布：2024-10-07约6.05千字共5页下载文档

文本预览下载声明

《人工智能基础与应用》第4章分门别类：帮你分而治之课后习题参考答案--第1页

第4章分门别类：帮你分而治之

课后习题答案

一、考考你

1.关于正负样本的说法正确是D。

A.样本数量多的那一类是正样本B.样本数量少的那一类是负样本

C.正负样本没有明确的定义D.想要正确识别的那一类为正样本

2.分类器实质为一个A，把样本的特征集X映射到一个预先定义的类标号y。

A.模式B.函数C.映射D.转换

3.用计算概率来解决分类问题是哪种分类器C。

A.决策树B.最近邻C.贝叶斯D.支持向量机

4.识别手写数字过程中，对图片进行灰度化处理的主要原因是C。

A.方便转为文本格式B.尽可能保存全部图片信息

C.较少计算量，同时尽可能保存图片信息D.有利于提高分类效果

5.SVM的最优分界面是由A决定的。

A.支持向量B.所有样本C.多数样本D少数样本

二、亮一亮

1.最近邻分类器与支持向量机各自分类的基本思想是什么？

参考答案：

最近邻分类器的基本思想：找到与待分类的样本最相似的k个邻居，这k个邻居中多数

邻居属于哪一类，那么就指定该样本属于哪一类。即我们把每个具有n个特征的样本看作n

维空间的一个点，对于给定的新样本，先计算该点与其它样本点的距离(相似度)，然后将新

样本指派为周围k个最近邻的多数类。该分类思想源于这样的常识：判别一个人是好人还是

坏人，可以从跟他走得最近的k个人来判断，如果k个人中多数是好人，那么可以指派他为

好人，否则他是坏人。

支持向量机分类器的基本思想：通过非线性映射，把无法在低维样本空间分类的问题映

射到一个高维的特征空间，在高维空间通过一个线性超平面而非低维空间的直线将样本完全

划分开。

2.在案例1的手写数字识别过程中，个别样本出现错分的现象，主要原因是什么？

参考答案：

个别样本出现错分主要原因有：

（1）因训练样本数据规模不够造成分类模型学习不够，导致不能有效应对各种样本的

分类；

《人工智能基础与应用》第4章分门别类：帮你分而治之课后习题参考答案--第1页

《人工智能基础与应用》第4章分门别类：帮你分而治之课后习题参考答案--第2页

（2）样本质量不高时也会影响模型识别的正确率。

三、帮帮我

1.尝试改用SVM方法来识别手写数字，建议核函数使用rbf，其它模型参数自己设定，

对比SVM模型的识别效果与案例1的差异，并分析原因。

参考答案：

#数字图片信息转存为txt文件

importos

fromPILimportImage

importnumpyasnp

importpandasaspd

importsklearn.model_selectionasms

#定义图片到文本的转换函数

defimgtotext(imgfile,txtfile,size=(32,32)):

显示全部

相似文档