Press "Enter" to skip to content

机器学习之朴素贝叶斯

本站内容均来自兴趣收集,如不慎侵害的您的相关权益,请留言告知,我们将尽快删除.谢谢.

机器学习之朴素贝叶斯

3 代码实现贝努力朴素贝叶斯
4 代码实现高斯朴素贝叶斯
5 代码实现多项式朴素贝叶斯

前言:主要介绍朴素贝叶斯的概念、公式,以及代码实现贝努利、高斯、多项式朴素贝叶斯。

 

1 朴素贝叶斯

朴素贝叶斯(Naive Bayes)是一个非常简单,但是实用性很强的分类模型。朴素贝叶斯分类器的构造基础是贝叶斯理论。
联合概率:是指两件事情同时发生的概率,一般对于X和Y来说,对应的联合概率记为P(XY)。
条件概率:表示为在Y发生的条件下,发生X的概率。记为P(X∣Y)。
贝叶斯公式: ,其中W为特征向量,C为预测的类别。

2 朴素贝叶斯应用

id刮北风闷热多云预报有雨真下雨?
101010
211101
301101
400010
501101
601010
710010

 

注意:0代表否,1代表是。

 

我们可以使用上述公式依次计算出真下雨的概率,这里不再计算。我们可以通过代码使用贝努利、高斯、多项式来完成计算。

 

3 代码实现贝努力朴素贝叶斯

 

为了方便继续使用上述数据进行预测,数据截图如下:

 

代码实现:

 

from sklearn.model_selection import train_test_split
import pandas as pd
from sklearn.naive_bayes import BernoulliNB
def naviebayes():
    # 读取数据
    data = pd.read_csv("train_2.csv")
    # 取出数据当中的特征值和目标值
    y = data['真下雨?'] #目标值
    x = data[['刮北风', '闷热','多云','天气预报有雨']] #特征值
    # 进行数据分割
    x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2)
    #贝努力朴素贝叶斯
    clf = BernoulliNB()
    clf.fit(x_train, y_train)
    y_predict = clf.predict(x_test)
    print(x_test)
    print(y_predict)
    print("预测的概率为",clf.score(x_test, y_test))
    print("--------------------")
    Next_Day = [[0, 0, 1, 0]]
    pre = clf.predict(Next_Day)
    pre2 = clf.predict_proba(Next_Day)
    print("预测结果为:", pre)
    # 输出模型预测的分类概率
    print("预测的概率为:", pre2)
if __name__ == '__main__':
    naviebayes()

 

截图:

 

4 代码实现高斯朴素贝叶斯

 

代码实现:

 

from sklearn.model_selection import train_test_split
import pandas as pd
from sklearn.naive_bayes import GaussianNB
def naviebayes():
    # 读取数据
    data = pd.read_csv("train_2.csv")
    # 取出数据当中的特征值和目标值
    y = data['真下雨?'] #目标值
    x = data[['刮北风', '闷热','多云','天气预报有雨']] #特征值
    # 进行数据分割
    x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2)
    #高斯朴素贝叶斯
    gnb = GaussianNB()
    gnb.fit(x_train, y_train)
    y_predict = gnb.predict(x_test)
    print(x_test)
    print(y_predict)
    print("预测的概率为",gnb.score(x_test, y_test))
    print("--------------------")
    Next_Day = [[0, 0, 1, 0]]
    pre = gnb.predict(Next_Day)
    pre2 = gnb.predict_proba(Next_Day)
    print("预测结果为:", pre)
    # 输出模型预测的分类概率
    print("预测的概率为:", pre2)
if __name__ == '__main__':
    naviebayes()

 

截图:

 

5 代码实现多项式朴素贝叶斯

 

代码如下:

 

from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import MultinomialNB
import pandas as pd
def naviebayes():
    # 读取数据
    data = pd.read_csv("train_2.csv")
    # 取出数据当中的特征值和目标值
    y = data['真下雨?'] #目标值
    x = data[['刮北风', '闷热','多云','天气预报有雨']] #特征值
    # 进行数据分割
    x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2)
    # 多项式朴素贝叶斯
    mlt = MultinomialNB(alpha=1.0)
    mlt.fit(x_train, y_train)
    y_predict = mlt.predict(x_test)
    print(x_test)
    print(y_predict)
    print("准确率为:", mlt.score(x_test, y_test))
    print("--------------------")
    Next_Day = [[0, 0, 1, 0]]
    pre = mlt.predict(Next_Day)
    pre2 = mlt.predict_proba(Next_Day)
    print("预测结果为:", pre)
    # 输出模型预测的分类概率
    print("预测的概率为:", pre2)
if __name__ == '__main__':
    naviebayes()

 

截图:

 

通过对比贝努力、高斯、多项式的结果,预测的准确率不一样,所以我们在开发使用的时候,一定要注意区分这几类。

Be First to Comment

发表回复

您的电子邮箱地址不会被公开。