《数据挖掘与机器学习》 课件6.1.1 朴素贝叶斯.pptx
8南宁职业技术学院
NCVTNANNINGCOLLEGEFORVOCATIONALTECHNOLOGY
厨
数据挖掘与机器学习
DATAMININGA°NDMACHINELEARNING
构建运输车辆安全驾驶行为分析模型
运输车辆安全驾驶行为分析——朴素贝叶斯、K近邻
朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。
对于运输企业来说,安全意识和责任感的重要性不言而喻,这是是企业长期发展和稳定运营的必要因素。构建运输车辆安全驾驶行为分析模型能帮助企业更好地管理和监控运输车辆的安全性能。
在本任务中将使用高斯朴素贝叶斯和多项式分布朴素贝叶斯构建运输车辆安全驾驶行为分析模型,探索、分析各车辆的驾驶行为。
构建运输车辆安全驾驶行为分析模型
任务描述
读取并探索驾驶行为数据。
处理驾驶行为数据。
使用sklearn库构建朴素贝叶斯模型。
运用Python构建运输车辆安全驾驶行为分析模型需调用不同的库
利用Matplotlib库对预测结果进行可视化展示。
使用准确率、精确率、召回率、F1得分评估朴素贝叶斯模型。
构建运输车辆安全驾驶行为分析模型
任务要求
Part1相关知识
·高斯朴素贝叶斯
·多项式分布朴素贝叶斯
什么是朴素贝叶斯?
朴素贝叶斯是分类器中最常用的一种生成式模型,其基于贝叶斯定理将联合概率转化为条件概率,利用特征条件及独立假设简化条件的概率进行计算。
构建运输车辆安全驾驶行为分析模型
朴素贝叶斯基本概念
按照分类维度计算:分类概率×每个特征概率。
计算先验概率,如果已经给出先验概率,那么利用给出的先验概率。
分别计算第k个类别的第i维特征的第i个取值的条件概率。
朴素贝叶斯基本概念
朴素贝叶斯算法流程
确定待分类项所属的类别。
高斯朴素贝叶斯主要处理连续型变量的数据,它的模型是假设每一个维度都符合高斯分布。
使用sklearn库中naive_bayes模块的GaussianNB类可以构建高斯朴素贝叶斯模型,其语法格式如下。
sklearn.naive_bayes.GaussianNB(priors=None)
GaussianNB类常用的参数及其说明如下:
参数名称
说明
priors
接收array。表示先验概率大小,若没有给定,则模型根据样本数据计算(利用极大似然法)。默认为None。
构建运输车辆安全驾驶行为分析模型
高斯朴素贝叶斯
特征名称特征说明
性别当地居民性别,取值为0、1。其中,0代表女性,1代表男性
年龄当地居民年龄,取值为其自身年龄
婚姻情况当地居民婚姻情况,取值为0-3。其中,0代表已婚,1代表离异,2代表未婚,3代表丧偶
家庭角色
当地居民在家庭中所扮演的角色,取值为0-5。其中,0代表妻子,1代表丈夫,2代表未婚,
3代表离家,4代表孩子,5代表其他关系
当地居民所接受的教育程度,取值为0-8。其中,0代表初中,1代表中专,2代表高中,3代受教育程度表职业学校,4代表大专,5代表大学未毕业,6代表学士,7代表硕士,8代表博士
为了响应共同富裕的主题,以帮助当地居民提高收入水平,某地基层组织决定进行人口普查,
以便更好地了解当地居民的收入情况。现有某地的人口普查收入数据,数据描述如下。
构建运输车辆安全驾驶行为分析模型
朴素贝叶斯例题
特征名称特征说明
工作类型
当地居民的工作类型,取值为0-5。其中,0代表私人,1代表自由职业非公司,2代表
自由职业公司,3代表政府,4代表无薪,5代表无工作经验
每周工作时长(h)当地居民的每周工作时长,取值为其每周工作的小时数
当地居民的职业,取值为0-13。其中,0代表技术支持,1代表手工艺维修,2代表销
职业售,3代表执行主管,4代表专业技术,5代表劳工保洁,6代表机械操作,7代表管理
文书,8代表农业捕捞,9代表运输,10代表家政服务,11代表保安,12代表军人,13代表其他职业
收入等级
当地居民所属收入等级类别,取值为0、1。其中,0代表收入小于等于5万每年,1代
表收入大于5万每年
为了响应共同富裕的主题,以帮助当地居民提高收入水平,某地基层组织决定进行人口普查,
以便更好地了解当地居民的收入情况。现有某地的人口普查收入数据,数据描述如下。
构建运输车辆安全驾驶行