失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 机器学习实战篇:使用贝叶斯模型对鸢尾花数据集分类

机器学习实战篇:使用贝叶斯模型对鸢尾花数据集分类

时间:2023-04-20 01:46:54

相关推荐

机器学习实战篇:使用贝叶斯模型对鸢尾花数据集分类

1、简介

本文主要讲解朴素贝叶斯及其推理,并实现鸢尾花数据的分类问题

2、算法解释

朴素贝叶斯最初来源于统计科学领域。根据朴素贝叶斯公式:

由于类似然涉及到多个特征的组合求解较为困难。所以为了简化运算,降低计算复杂度,我们假设每个特征具备统计独立性,即特征间不存在关联性。这样就可以简化上述贝叶斯公式为:

上述公式即为朴素贝叶斯通用公式,我们进一步化简去除无关证据项得:

根据上述朴素贝叶斯简化公式,即可以得到某个样本属于某个类的近似统计概率。

3、案例展示

### 这里使用sklearn朴素贝叶斯集成库进行案例分析,其中GaussianNB函数假设了类似然函数满足高斯分布,即:

from sklearn import datasetsiris = datasets.load_iris()from sklearn.naive_bayes import GaussianNBgnb = GaussianNB()y_pred = gnb.fit(iris.data, iris.target).predict(iris.data)print("Number of mislabeled points out of a total %d points : %d" % (iris.data.shape[0],(iris.target != y_pred).sum()))

结果:

Number of mislabeled points out of a total 150 points : 6

原创整理,转载请注明出处!!!

如果觉得《机器学习实战篇:使用贝叶斯模型对鸢尾花数据集分类》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。