文档详情

第8章 朴素贝叶斯方法.pptx

发布:2025-01-07约1.43千字共22页下载文档
文本预览下载声明

张爱桃河北医科大学Python机器学习技术与应用

朴素贝叶斯方法第八章

本章要点布里尔分数高斯朴素贝叶斯方法对数似然函数多项式朴素贝叶斯方法可靠性曲线朴素贝叶斯方法基本原理

主要内容8.1朴素贝叶斯方法概述8.2不同分布下的贝叶斯方法8.4概率类模型的评估指标主要内容8.3朴素贝叶斯实例——文本分类

8.1朴素贝叶斯方法概述贝叶斯定理?后验概率事件B发生的概率事件A发生的概率事件A发生条件下事件B发生的条件概率

例流感季,假设全国人口13亿人,感染流感有8万人,感染流感后发热的人数为6.5万,而没有感染流感而由于其他原因发热的人数为100万人。推断出自己发热感染流感的概率。8.1朴素贝叶斯方法概述???

8.1朴素贝叶斯方法概述?

高斯朴素贝叶斯方法8.2不同分布下的贝叶斯方法8??????朴素贝叶斯分类公式:

高斯朴素贝叶斯方法8.2不同分布下的贝叶斯方法性别身高(英尺)体重(磅)脚掌(英寸)男618012男5.9219011男5.5817012男5.9216510女51006女5.51508女5.421307女5.751509测试样本X=(身高=6英尺,体重=130磅,脚掌=8英寸)??

高斯朴素贝叶斯方法????8.2不同分布下的贝叶斯方法

高斯朴素贝叶斯方法性别男5.855176.2511.08611.250.957女5.4180.312132.523.6297.51.291????8.2不同分布下的贝叶斯方法

多项式朴素贝叶斯方法多项式朴素贝叶斯分类器适合特征变量是离散变量,且服从多项式分布的情况。序号文本类别1尊敬的顾客欢迎促销垃圾邮件2尊敬的顾客订阅优惠垃圾邮件3顾客优惠订阅垃圾邮件4宠物约会有趣正常邮件5朋友约会游玩正常邮件对测试文本“订阅优惠优惠保真”进行分类。8.2不同分布下的贝叶斯方法

???8.2不同分布下的贝叶斯方法多项式朴素贝叶斯方法

?8.3多项式朴素贝叶斯方法多项式朴素贝叶斯方法

多项式朴素贝叶斯方法文本特征频率表8.3多项式朴素贝叶斯方法

多项式朴素贝叶斯方法8.3多项式朴素贝叶斯方法??多项式项对测试文本“订阅优惠优惠保真”进行分词,得到该文本的特征向量集X=(订阅,优惠,优惠,保真),类别集合为Y=(垃圾邮件,正常邮件)。因此分类器为:?

多项式朴素贝叶斯方法8.3多项式朴素贝叶斯方法?

8.3文本分类实现数据的获取及预处理划分训练与测试数据构建特征向量构建朴素贝叶斯分类器对分类器的性能进行评估实现流程

布利尔分数(Brierscore)8.4概率类模型的评估指标?计算布利尔分数的函数为brier_score_loss()

对数损失函数(Logarithmicloss)8.4概率类模型的评估指标?在sklearn当中,对数似然函数为log_loss()

可靠性曲线(Reliabilitycurve)8.4概率类模型的评估指标可靠性曲线又叫做概率校准曲线(Probabilitycalibrationcurve),可靠性图(Reliabilitydiagrams)是以预测概率为横坐标,真实标签为纵坐标的曲线。预测概率和真实值越接近,模型校准效果越好,因此可靠性曲线越接近对角线时,我们认为模型的性能越好。文本分类模型中类标签为1的可靠性曲线利用calibration_curve()函数绘制的可靠性曲线

感谢聆听

显示全部
相似文档