收藏 分销(赏)

人工智能和机器学习--PPT09-朴素贝叶斯.pdf

上传人:a199****6536 文档编号:3563914 上传时间:2024-07-09 格式:PDF 页数:37 大小:851.95KB
下载 相关 举报
人工智能和机器学习--PPT09-朴素贝叶斯.pdf_第1页
第1页 / 共37页
人工智能和机器学习--PPT09-朴素贝叶斯.pdf_第2页
第2页 / 共37页
人工智能和机器学习--PPT09-朴素贝叶斯.pdf_第3页
第3页 / 共37页
人工智能和机器学习--PPT09-朴素贝叶斯.pdf_第4页
第4页 / 共37页
人工智能和机器学习--PPT09-朴素贝叶斯.pdf_第5页
第5页 / 共37页
点击查看更多>>
资源描述

1、朴素贝叶斯王秋月中国人民大学信息学院单个事件概率单个事件概率:()()概率基本知识()概率基本知识单个事件概率单个事件概率:(),()单个事件概率单个事件概率:(),()联合事件概率:联合事件概率:(,)(,)概率基本知识(|)概率基本知识单个事件概率单个事件概率:(),()联合事件概率:联合事件概率:(,)条件概率:条件概率:(|)(|)概率基本知识单个事件概率单个事件概率:(),()联合事件概率:联合事件概率:(,)条件概率:条件概率:(|),(|)概率基本知识单个事件概率单个事件概率:(),()联合事件概率:联合事件概率:(,)条件概率:条件概率:(|),(|)条件和联合概率的关系:条件

2、和联合概率的关系:(,)=(|)()=(|)()条件和联合概率的关系:条件和联合概率的关系:(,)=(|)()=(|)()贝叶斯公式推导贝叶斯公式推导条件和联合概率的关系:条件和联合概率的关系:(,)=(|)()=(|)()贝叶斯公式推导条件和联合概率的关系:条件和联合概率的关系:(,)=(|)()=(|)()贝叶斯定理贝叶斯定理贝叶斯定理训练朴素贝叶斯给定特征向量(),计算其属于每个类别(C)的概率训练朴素贝叶斯:朴素假设给定特征向量(),计算其属于每个类别(C)的概率很难计算所有特征的联合概率训练朴素贝叶斯:朴素假设给定特征向量(),计算其属于每个类别(C)的概率解决方案:假设假设给定类别

3、,所有给定类别,所有特征相互独立特征相互独立训练朴素贝叶斯:朴素假设给定特征向量(),计算其属于每个类别(C)的概率解决方案:假设假设给定类别,所有给定类别,所有特征相互独立特征相互独立这就是“朴素”的假设训练朴素贝叶斯给定特征向量(),计算其属于每个类别(C)的概率按照最大后验概率规则,把X分入概率最大的类别对数技巧很多概率值连乘,容易造成浮点计算下界溢出对数技巧很多概率值连乘,容易造成浮点计算下界溢出取对数把乘法转化成加法DayOutlookTemperatureHumidityWindPlayTennisD1SunnyHotHighWeakNoD2SunnyHotHighStrongNo

4、D3OvercastHotHighWeakYesD4RainMildHighWeakYesD5RainCoolNormalWeakYesD6RainCoolNormalStrongNoD7OvercastCoolNormalStrongYesD8SunnyMildHighWeakNoD9SunnyCoolNormalWeakYesD10RainMildNormalWeakYesD11SunnyMildNormalStrongYesD12OvercastMildHighStrongYesD13OvercastHotNormalWeakYesD14RainMildHighStrongNo案例:预测

5、打网球P(Play=Yes)=9/14P(Play=No)=5/14案例:预测打网球P(Play=Yes)=9/14P(Play=No)=5/14OutlookPlay=YesPlay=NoSunny2/93/5Overcast4/90/5Rain3/92/5TemperaturePlay=YesPlay=NoHot2/92/5Mild4/92/5Cool3/91/5HumidityPlay=YesPlay=NoHigh3/94/5Normal6/91/5WindPlay=YesPlay=NoStrong3/93/5Weak6/92/5使用训练数据构建概率查找表使用训练数据构建概率查找表案例:

6、预测打网球预测下面情境下是否打网球:预测下面情境下是否打网球:x=(Outlook=Sunny,Temperature=Cool,Humidity=High,Wind=Strong)案例:预测打网球FeaturePlay=YesPlay=NoOutlook=Sunny2/93/5Temperature=Cool3/91/5Humidity=High3/94/5Wind=Strong3/93/5Overall Label9/145/14案例:预测打网球预测下面输入的输出:预测下面输入的输出:x=(Outlook=Sunny,Temperature=Cool,Humidity=High,Wind=

7、Strong)FeaturePlay=YesPlay=NoOutlook=Sunny2/93/5Temperature=Cool3/91/5Humidity=High3/94/5Wind=Strong3/93/5Overall Label9/145/14Probability0.00530.0206案例:预测打网球预测下面输入的输出:预测下面输入的输出:x=(Outlook=Sunny,Temperature=Cool,Humidity=High,Wind=Strong)FeaturePlay=YesPlay=NoOutlook=Sunny2/93/5Temperature=Cool3/91/

8、5Humidity=High3/94/5Wind=Strong3/93/5Overall Label9/145/14Probability0.00530.0206案例:预测打网球预测下面输入的输出:预测下面输入的输出:x=(Outlook=Sunny,Temperature=Cool,Humidity=High,Wind=Strong)拉普拉斯平滑技术问题:问题:有些类别里没有的特征将会导致这些条件概率值为00拉普拉斯平滑技术问题:问题:有些类别里没有的特征将会导致这些条件概率值为00解决方案:解决方案:在这些条件概率的分子和分母上各加1朴素贝叶斯模型朴素贝叶斯模型数据类型数据类型贝努利模型贝

9、努利模型二值二值(T/F)多项式模型多项式模型离散值离散值(如,计数如,计数)高斯模型高斯模型连续值连续值朴素贝叶斯模型的类型不同朴素贝叶斯模型的区别,主要在于它们对概率分布(i|C)所做的不同假设。问题问题模型特征包含不同的数据类型(连续的和类别的)结合不同特征类型问题问题模型特征包含不同的数据类型(连续的和类别的)结合不同特征类型解决解决方案方案 1:将连续特征离散化成类别变量,然后应用多项式模型问题问题模型特征包含不同的数据类型(连续的和类别的)问题问题模型特征包含不同的数据类型(连续的和类别的)结合不同特征类型解决解决方案方案 1:将连续特征离散化成类别变量,然后应用多项式模型方案方案

10、 2:用高斯模型拟合连续特征,用多项式模型拟合分类变量,然后再结合成一个“元模型”(后面章节会讲到)问题问题模型特征包含不同的数据类型(连续的和类别的)导入包含朴素贝叶斯分类方法的类:导入包含朴素贝叶斯分类方法的类:from sklearn.naive_bayes import BernoulliNB创建该类的一个对象:创建该类的一个对象:BNB=BernoulliNB(alpha=1.0)拟合训练数据,并预测:拟合训练数据,并预测:BNB=BNB.fit(X_train,y_train)y_predict=BNB.predict(X_test)朴素贝叶斯的语法导入包含朴素贝叶斯分类方法的类:

11、导入包含朴素贝叶斯分类方法的类:from sklearn.naive_bayes import BernoulliNB创建该类的一个对象:创建该类的一个对象:BNB=BernoulliNB(alpha=1.0)拟合训练数据,并预测:拟合训练数据,并预测:BNB=BNB.fit(X_train,y_train)y_predict=BNB.predict(X_test)拉普拉斯平滑参数拉普拉斯平滑参数朴素贝叶斯的语法http:/scikit-learn.org/stable/modules/generated/sklearn.naive_bayes.BernoulliNB.html导入包含朴素贝叶斯分类方法的类:导入包含朴素贝叶斯分类方法的类:from sklearn.naive_bayes import BernoulliNB创建该类的一个对象:创建该类的一个对象:BNB=BernoulliNB(alpha=1.0)拟合训练数据,并预测:拟合训练数据,并预测:BNB=BNB.fit(X_train,y_train)y_predict=BNB.predict(X_test)拉普拉斯平滑参数拉普拉斯平滑参数朴素贝叶斯的语法其他朴素贝叶斯模型其他朴素贝叶斯模型:MultinomialNB,GaussianNB.Jupyter演示第9章-朴素贝叶斯.ipynb

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服