pythonde朴素贝叶斯算法

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了pythonde朴素贝叶斯算法，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3564字，纯文字阅读大概需要6分钟。

内容图文

算法优缺点

优点：在数据较少的情况下依然有效，可以处理多类别问题

缺点：对输入数据的准备方式敏感

适用数据类型：标称型数据

算法思想：

朴素贝叶斯

比如我们想判断一个邮件是不是垃圾邮件，那么我们知道的是这个邮件中的词的分布，那么我们还要知道：垃圾邮件中某些词的出现是多少，就可以利用贝叶斯定理得到。

朴素贝叶斯分类器中的一个假设是：每个特征同等重要

贝叶斯分类是一类分类算法的总称，这类算法均以贝叶斯定理为基础，故统称为贝叶斯分类。

函数

loadDataSet()

创建数据集，这里的数据集是已经拆分好的单词组成的句子，表示的是某论坛的用户评论，标签1表示这个是骂人的

createVocabList(dataSet)

找出这些句子中总共有多少单词，以确定我们词向量的大小

setOfWords2Vec(vocabList, inputSet)

将句子根据其中的单词转成向量，这里用的是伯努利模型，即只考虑这个单词是否存在

bagOfWords2VecMN(vocabList, inputSet)

这个是将句子转成向量的另一种模型，多项式模型，考虑某个词的出现次数

trainNB0(trainMatrix,trainCatergory)

计算P(i)和P(w[i]|C[1])和P(w[i]|C[0])，这里有两个技巧，一个是开始的分子分母没有全部初始化为0是为了防止其中一个的概率为0导致整体为0，另一个是后面乘用对数防止因为精度问题结果为0

classifyNB(vec2Classify, p0Vec, p1Vec, pClass1)

根据贝叶斯公式计算这个向量属于两个集合中哪个的概率高

#coding=utf-8
from numpy import *
def loadDataSet():
    postingList=[['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'],
                 ['maybe', 'not', 'take', 'him', 'to', 'dog', 'park', 'stupid'],
                 ['my', 'dalmation', 'is', 'so', 'cute', 'I', 'love', 'him'],
                 ['stop', 'posting', 'stupid', 'worthless', 'garbage'],
                 ['mr', 'licks', 'ate', 'my', 'steak', 'how', 'to', 'stop', 'him'],
                 ['quit', 'buying', 'worthless', 'dog', 'food', 'stupid']]
    classVec = [0,1,0,1,0,1]    #1 is abusive, 0 not
    return postingList,classVec
#创建一个带有所有单词的列表
def createVocabList(dataSet):
    vocabSet = set([])
    for document in dataSet:
        vocabSet = vocabSet | set(document)
    return list(vocabSet)
    
def setOfWords2Vec(vocabList, inputSet):
    retVocabList = [0] * len(vocabList)
    for word in inputSet:
        if word in vocabList:
            retVocabList[vocabList.index(word)] = 1
        else:
            print 'word ',word ,'not in dict'
    return retVocabList
#另一种模型    
def bagOfWords2VecMN(vocabList, inputSet):
    returnVec = [0]*len(vocabList)
    for word in inputSet:
        if word in vocabList:
            returnVec[vocabList.index(word)] += 1
    return returnVec
def trainNB0(trainMatrix,trainCatergory):
    numTrainDoc = len(trainMatrix)
    numWords = len(trainMatrix[0])
    pAbusive = sum(trainCatergory)/float(numTrainDoc)
    #防止多个概率的成绩当中的一个为0
    p0Num = ones(numWords)
    p1Num = ones(numWords)
    p0Denom = 2.0
    p1Denom = 2.0
    for i in range(numTrainDoc):
        if trainCatergory[i] == 1:
            p1Num +=trainMatrix[i]
            p1Denom += sum(trainMatrix[i])
        else:
            p0Num +=trainMatrix[i]
            p0Denom += sum(trainMatrix[i])
    p1Vect = log(p1Num/p1Denom)#处于精度的考虑，否则很可能到限归零
    p0Vect = log(p0Num/p0Denom)
    return p0Vect,p1Vect,pAbusive
    
def classifyNB(vec2Classify, p0Vec, p1Vec, pClass1):
    p1 = sum(vec2Classify * p1Vec) + log(pClass1)    #element-wise mult
    p0 = sum(vec2Classify * p0Vec) + log(1.0 - pClass1)
    if p1 > p0:
        return 1
    else: 
        return 0
        
def testingNB():
    listOPosts,listClasses = loadDataSet()
    myVocabList = createVocabList(listOPosts)
    trainMat=[]
    for postinDoc in listOPosts:
        trainMat.append(setOfWords2Vec(myVocabList, postinDoc))
    p0V,p1V,pAb = trainNB0(array(trainMat),array(listClasses))
    testEntry = ['love', 'my', 'dalmation']
    thisDoc = array(setOfWords2Vec(myVocabList, testEntry))
    print testEntry,'classified as: ',classifyNB(thisDoc,p0V,p1V,pAb)
    testEntry = ['stupid', 'garbage']
    thisDoc = array(setOfWords2Vec(myVocabList, testEntry))
    print testEntry,'classified as: ',classifyNB(thisDoc,p0V,p1V,pAb)
    
    
def main():
    testingNB()
    
if __name__ == '__main__':
    main()

以上就是pythonde 朴素贝叶斯算法的详细内容，更多请关注Gxl网其它相关文章！

内容总结

以上是互联网集市为您收集整理的pythonde朴素贝叶斯算法全部内容，希望文章能够帮你解决pythonde朴素贝叶斯算法所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/429770.html

来源：【匿名】

【上一篇】Python的快速排序方法【下一篇】浅谈php实现映射的两种方法（链表和二叉树）

更多 ►

【pythonde朴素贝叶斯算法】教程文章相关的互联网学习教程文章

import numpy as np#返回样本数据集 def loadDataSet(): postingList=[[‘my‘, ‘dog‘, ‘has‘, ‘flea‘, ‘problems‘, ‘help‘, ‘please‘], [‘maybe‘, ‘not‘, ‘take‘, ‘him‘, ‘to‘, ‘dog‘, ‘park‘, ‘stupid‘], [‘my‘, ‘dalmation‘, ‘is‘, ‘so‘, ‘cute‘, ‘I‘, ‘love‘, ‘him‘], [‘stop‘, ‘posting‘, ‘stupid‘, ‘worthless‘...

数据算法 --hadoop/spark数据处理技巧 --（13.朴素贝叶斯 14.情感分析）【图】

十三。朴素贝叶斯朴素贝叶斯是一个线性分类器。处理数值数据时，最好使用聚类技术（eg:K均值）和k-近邻方法，不过对于名字、符号、电子邮件和文本的分类，则最好使用概率方法，朴素贝叶斯就可以。在某些情况下，NBC也可以用来对数值数据分类。对于数值数据的分类，比如（连续属性，身高，体重，脚长），建议采用采用高斯分布，令x是一个连续属性。首先，按类对数据分段，然后计算各个类中的x的均值（u）和方差（）。本次主要以文本...

PHP实现机器学习之朴素贝叶斯算法详解

这篇文章主要介绍了PHP实现机器学习之朴素贝叶斯算法,结合实例形式详细分析了朴素贝叶斯算法的概念、原理及php实现技巧,需要的朋友可以参考下本文实例讲述了PHP实现机器学习之朴素贝叶斯算法。分享给大家供大家参考，具体如下：机器学习已经在我们的生活中变得随处可见了。比如从你在家的时候温控器开始工作到智能汽车以及我们口袋中的智能手机。机器学习看上去已经无处不在并且是一个非常值得探索的领域。但是什么是机器学习呢？通...

PHP如何实现机器学习之朴素贝叶斯算法

本文主要介绍了PHP实现机器学习之朴素贝叶斯算法,结合实例形式详细分析了朴素贝叶斯算法的概念、原理及php实现技巧,需要的朋友可以参考下，希望能帮助到大家。本文实例讲述了PHP实现机器学习之朴素贝叶斯算法。分享给大家供大家参考，具体如下：机器学习已经在我们的生活中变得随处可见了。比如从你在家的时候温控器开始工作到智能汽车以及我们口袋中的智能手机。机器学习看上去已经无处不在并且是一个非常值得探索的领域。但是什么...

NaiveBayes(朴素贝叶斯算法)[分类算法]，naivebayes_PHP教程【图】

Naive Bayes(朴素贝叶斯算法)[分类算法]，naivebayesNave Bayes(朴素贝叶斯)分类算法的实现 (1) 简介：(2) 算法描述：(3) 1 php2 /*3 *Naive Bayes朴素贝叶斯算法（分类算法的实现）4 */5 6 /*7 *把.txt中的内容读到数组中保存8 *$filename:文件名称9 */10 //--------------------------------------------------------------------11 function getFileContent($filename)12 {13 $array = array(null);14 $content = f...

算法 - 最热教程

浅谈SQLServer查询优化器中的JOIN算法有没那种可逆算法是密文比明文短的呢？...javascript-类似Excel里面的NORMDIST函...C++中的分治算法及常见题目汇总压缩感知重构算法综述-学习笔记 c++中内置函数qsort（快速排序）和bsea...一、fpga图像处理算法整合基于遗传算法（deap）的非线性函数寻优...集成学习-Bagging集成学习算法随机森林...机器学习笔记（九）聚类算法及实践（K-...

首页 / 算法 / pythonde朴素贝叶斯算法

pythonde朴素贝叶斯算法

内容导读

内容图文

内容总结

内容备注

内容手机端

【pythonde朴素贝叶斯算法】教程文章相关的互联网学习教程文章

学习日志---朴素贝叶斯算法【代码】

数据算法 --hadoop/spark数据处理技巧 --（13.朴素贝叶斯 14.情感分析）【图】

PHP实现机器学习之朴素贝叶斯算法详解

PHP如何实现机器学习之朴素贝叶斯算法

NaiveBayes(朴素贝叶斯算法)[分类算法]，naivebayes_PHP教程【图】

详细介绍如何在python中使用朴素贝叶斯算法【图】

如何使用python中朴素贝叶斯算法的介绍【图】

pythonde朴素贝叶斯算法

朴素贝叶斯算法的python实现

朴素贝叶斯算法的python实现方法【图】

朴素贝叶斯算法在垃圾邮件过滤中的应用

数据挖掘之朴素贝叶斯算法

朴素贝叶斯算法【图】

第116天：机器学习算法之朴素贝叶斯理论【图】

从零开始的《数据挖掘与大数据分析》课堂学习笔记-6 7 第四章分类决策树 KNN算法朴素贝叶斯【图】

PYTHON - 相关标签

算法 - 相关标签

算法 - 最新教程

算法 - 最热教程