文档详情

《人工智能基础与应用》第4章 分门别类:帮你分而治之课后习题参考答案.pdf

发布:2024-10-07约6.05千字共5页下载文档
文本预览下载声明

《人工智能基础与应用》第4章分门别类:帮你分而治之课后习题参考答案--第1页

第4章分门别类:帮你分而治之

课后习题答案

一、考考你

1.关于正负样本的说法正确是D。

A.样本数量多的那一类是正样本B.样本数量少的那一类是负样本

C.正负样本没有明确的定义D.想要正确识别的那一类为正样本

2.分类器实质为一个A,把样本的特征集X映射到一个预先定义的类标号y。

A.模式B.函数C.映射D.转换

3.用计算概率来解决分类问题是哪种分类器C。

A.决策树B.最近邻C.贝叶斯D.支持向量机

4.识别手写数字过程中,对图片进行灰度化处理的主要原因是C。

A.方便转为文本格式B.尽可能保存全部图片信息

C.较少计算量,同时尽可能保存图片信息D.有利于提高分类效果

5.SVM的最优分界面是由A决定的。

A.支持向量B.所有样本C.多数样本D少数样本

二、亮一亮

1.最近邻分类器与支持向量机各自分类的基本思想是什么?

参考答案:

最近邻分类器的基本思想:找到与待分类的样本最相似的k个邻居,这k个邻居中多数

邻居属于哪一类,那么就指定该样本属于哪一类。即我们把每个具有n个特征的样本看作n

维空间的一个点,对于给定的新样本,先计算该点与其它样本点的距离(相似度),然后将新

样本指派为周围k个最近邻的多数类。该分类思想源于这样的常识:判别一个人是好人还是

坏人,可以从跟他走得最近的k个人来判断,如果k个人中多数是好人,那么可以指派他为

好人,否则他是坏人。

支持向量机分类器的基本思想:通过非线性映射,把无法在低维样本空间分类的问题映

射到一个高维的特征空间,在高维空间通过一个线性超平面而非低维空间的直线将样本完全

划分开。

2.在案例1的手写数字识别过程中,个别样本出现错分的现象,主要原因是什么?

参考答案:

个别样本出现错分主要原因有:

(1)因训练样本数据规模不够造成分类模型学习不够,导致不能有效应对各种样本的

分类;

《人工智能基础与应用》第4章分门别类:帮你分而治之课后习题参考答案--第1页

《人工智能基础与应用》第4章分门别类:帮你分而治之课后习题参考答案--第2页

(2)样本质量不高时也会影响模型识别的正确率。

三、帮帮我

1.尝试改用SVM方法来识别手写数字,建议核函数使用rbf,其它模型参数自己设定,

对比SVM模型的识别效果与案例1的差异,并分析原因。

参考答案:

#数字图片信息转存为txt文件

importos

fromPILimportImage

importnumpyasnp

importpandasaspd

importsklearn.model_selectionasms

#定义图片到文本的转换函数

defimgtotext(imgfile,txtfile,size=(32,32)):

显示全部
相似文档