首页 / PYTHON / NBC朴素贝叶斯分类器 ————机器学习实战 python代码

NBC朴素贝叶斯分类器 ————机器学习实战 python代码

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了NBC朴素贝叶斯分类器 ————机器学习实战 python代码，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2341字，纯文字阅读大概需要4分钟。

内容图文

# -*- coding: utf-8 -*-
"""
Created on Mon Aug 07 23:40:13 2017

@author: mdz
"""
import numpy as np
def loadData():
    vocabList=[[‘my‘, ‘dog‘, ‘has‘, ‘flea‘, ‘problems‘, ‘help‘, ‘please‘],
                 [‘maybe‘, ‘not‘, ‘take‘, ‘him‘, ‘to‘, ‘dog‘, ‘park‘, ‘stupid‘],
                 [‘my‘, ‘dalmation‘, ‘is‘, ‘so‘, ‘cute‘, ‘I‘, ‘love‘, ‘him‘],
                 [‘stop‘, ‘posting‘, ‘stupid‘, ‘worthless‘, ‘garbage‘],
                 [‘mr‘, ‘licks‘, ‘ate‘, ‘my‘, ‘steak‘, ‘how‘, ‘to‘, ‘stop‘, ‘him‘],
                 [‘quit‘, ‘buying‘, ‘worthless‘, ‘dog‘, ‘food‘, ‘stupid‘]]
    classList=[0,1,0,1,0,1]#1 侮辱性文字，0 正常言论
    return vocabList,classList

#对vocabList已经拆分过的句子进行筛选，筛选掉重复的单词，最后再返回list
#该list的length即属性的个数
def filterVocabList(vocabList):
    vocabSet=set([])
    for document in vocabList:
        vocabSet=vocabSet|set(document)
    return list(vocabSet)    

#对测试样本进行0-1处理
def zero_one(vocabList,input):
    returnVec=[0]*len(vocabList)
    for word in input:
       if word in vocabList:
         returnVec[vocabList.index(word)]=1
       else:
         print "the word: %s is not in my Vocabulary!"%word
    return returnVec

def trainNbc(trainSamples,trainCategory):
    numTrainSamp=len(trainSamples)
    numWords=len(trainSamples[0])
    pAbusive=sum(trainCategory)/float(numTrainSamp)
    #y=1 or 0下的特征计数
    p0Num=np.ones(numWords)
    p1Num=np.ones(numWords)
    #y=1 or 0下的类别计数
    p0NumTotal=numWords
    p1NumTotal=numWords
    for i in range(numTrainSamp):
        if trainCategory[i]==1:
             p0Num+=trainSamples[i]
             p0NumTotal+=sum(trainSamples[i])
        else:
             p1Num+=trainSamples[i]
             p1NumTotal +=sum(trainSamples[i])
    p1Vec=np.log(p1Num/p1NumTotal)
    p0Vec=np.log(p0Num/p0NumTotal)
    return p1Vec,p0Vec,pAbusive

def classifyOfNbc(testSamples,p1Vec,p0Vec,pAbusive):
    p1=sum(testSamples*p1Vec)+np.log(pAbusive)
    p0=sum(testSamples*p0Vec)+np.log(1-pAbusive)
    if p1>p0:
        return 1
    else:
        return 0
def testingNbc():
    vocabList,classList=loadData()
    vocabSet=filterVocabList(vocabList)
    trainList=[]
    for term in vocabList:
        trainList.append(zero_one(vocabSet,term))
    p1Vec,p0Vec,pAbusive=trainNbc(np.array(trainList),np.array(classList))
    testEntry=[‘love‘,‘my‘,‘daughter‘]
    testSamples=np.array(zero_one(vocabSet,testEntry))
    print testEntry,‘classified as :‘,classifyOfNbc(testSamples,p0Vec,p1Vec,pAbusive)
    testEntry=[‘stupid‘,‘garbage‘]
    testSamples=np.array(zero_one(vocabSet,testEntry))
    print testEntry,‘classified as :‘,classifyOfNbc(testSamples,p0Vec,p1Vec,pAbusive)

原文：http://www.cnblogs.com/mdz-great-world/p/7308210.html

内容总结

以上是互联网集市为您收集整理的NBC朴素贝叶斯分类器 ————机器学习实战 python代码全部内容，希望文章能够帮你解决NBC朴素贝叶斯分类器 ————机器学习实战 python代码所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1222169.html

来源：【匿名】

【上一篇】python利用request发送post请求【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【NBC朴素贝叶斯分类器 ————机器学习实战 python代码】教程文章相关的互联网学习教程文章

朴素贝叶斯python实现

概率论是很多机器学习算法基础，朴素贝叶斯分类器之所以称为朴素，是因为整个形式化过程中只做最原始、简单的假设。（这个假设：问题中有很多特征，我们简单假设一个个特征是独立的，该假设称做条件独立性，其实往往实际问题中不是完全独立的，这时需要用到另外一种方法叫做贝叶斯网络），后面利用朴素贝叶斯方法，我们应用在垃圾邮件过滤问题当中去。贝叶斯决策理论的分类方法：优点：数据较少仍然有效，可以处理多类别问题。缺点...

python实现随机森林、逻辑回归和朴素贝叶斯的新闻文本分类【代码】【图】

实现本文的文本数据可以在THUCTC下载也可以自己手动爬虫生成，本文主要参考：https://blog.csdn.net/hao5335156/article/details/82716923 nb表示朴素贝叶斯 rf表示随机森林 lg表示逻辑回归初学者（我）通过本程序的学习可以巩固python基础，学会python文本的处理，和分类器的调用。方便接下来的机器学习的学习。各个参数直观的含义：# -*- coding: utf-8 -*- """ Created on Thu Nov 29 13:00:46 2018@author: caoqu """ import...

朴素贝叶斯学习日志——简单案例python计算过程【代码】【图】

思路 1、根据贝叶斯公式：P（输出|输入）=P（输入|输出）*P（输出）/P（输入） 2、P（输入）=历史数据中，某个输入占所有样本的比例； 3、P（输出）=历史数据中，某个输出占所有样本的比例； 4、P（输入|输出）=历史数据中，某个输入，在某个输出的数量占所有样本的比例；题目介绍有14天的天气数据，以及是否可以打网球的判断，先给出一组天气数据，判断是否可以打网球？训练数据集：求解问题的数据集：对于以上数据进行简单的的...

关于朴素贝叶斯的10篇文章推荐【图】

本文主要介绍了python中如何使用朴素贝叶斯算法的相关知识。具有很好的参考价值。下面跟着小编一起来看下吧这里再重复一下标题为什么是"使用"而不是"实现"：首先，专业人士提供的算法比我们自己写的算法无论是效率还是正确率上都要高。其次，对于数学不好的人来说，为了实现算法而去研究一堆公式是很痛苦的事情。再次，除非他人提供的算法满足不了自己的需求，否则没必要"重复造轮子"。下面言归正传，不了解贝叶斯算法的可以去查一...

详细介绍如何在python中使用朴素贝叶斯算法【图】

如何使用python中朴素贝叶斯算法的介绍【图】

这里再重复一下标题为什么是"使用"而不是"实现"：首先，专业人士提供的算法比我们自己写的算法无论是效率还是正确率上都要高。其次，对于数学不好的人来说，为了实现算法而去研究一堆公式是很痛苦的事情。再次，除非他人提供的算法满足不了自己的需求，否则没必要"重复造轮子"。下面言归正传，不了解贝叶斯算法的可以去查一下相关资料，这里只是简单介绍一下： 1.贝叶斯...

pythonde朴素贝叶斯算法

算法优缺点优点：在数据较少的情况下依然有效，可以处理多类别问题缺点：对输入数据的准备方式敏感适用数据类型：标称型数据算法思想：朴素贝叶斯比如我们想判断一个邮件是不是垃圾邮件，那么我们知道的是这个邮件中的词的分布，那么我们还要知道：垃圾邮件中某些词的出现是多少，就可以利用贝叶斯定理得到。朴素贝叶斯分类器中的一个假设是：每个特征同等重要贝叶斯分类是一类分类算法的总称，这类算法均以贝叶斯定理为基础，故统...

朴素贝叶斯算法的python实现

朴素贝叶斯算法的python实现方法【图】

本文实例讲述了朴素贝叶斯算法的python实现方法。分享给大家供大家参考。具体实现方法如下：朴素贝叶斯算法优缺点优点：在数据较少的情况下依然有效，可以处理多类别问题缺点：对输入数据的准备方式敏感适用数据类型：标称型数据算法思想：比如我们想判断一个邮件是不是垃圾邮件，那么我们知道的是这个邮件中的词的分布，那么我们还要知道：垃圾邮件中某些词的出现是多少，就可以利用贝叶斯定理得到。朴素贝叶斯分类器中的一...

python机器学习 | 朴素贝叶斯算法介绍及实现【图】

周末去长沙玩了一趟，在长沙呆了四年，然后就像真游客一样去爬了岳麓山和逛了橘子洲头，哈哈，和亲近的人一起玩闹的体验很舒服，很庆幸和感恩有那么一群人宠着你~~ 当然，游乐之余，我也不忘学习的，在回来的高铁上，学了一下朴素贝叶斯算法，这是机器学习里面的经典的分类算法，也是为数不多的基于概率论的分类算法。朴素贝叶斯算法介绍及实现 1 贝叶斯定理介绍1.1 贝叶斯介绍1.2 经典统计学和贝叶斯统计学简单介绍1.3 贝叶斯定理...

朴素贝叶斯Python代码实现（转）

#-*- coding:utf-8 -*-import pandas as pd import numpy as np import jsonclass NaiveBayes:def __init__(self):self.model = {} # key 为类别名 val 为字典PClass表示该类的该类，PFeature:{}对应对于各个特征的概率def calEntropy(self, y): # 计算熵valRate = y.value_counts().apply(lambda x: x / y.size) # 频次汇总得到各个特征对应的概率valEntropy = np.inner(valRate, np.log2(valRate)) * -1return valEntropyde...

Python机器学习（十五）朴素贝叶斯算法原理与代码实现【代码】【图】

算法原理朴素贝叶斯是经典的机器学习算法之一，也是为数不多的基于概率论的分类算法。朴素贝叶斯原理简单，也很容易实现，多用于文本分类，比如垃圾邮件过滤。该算法的优点在于简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。但由于该算法以自变量之间的独立（条件特征独立）性和连续变量的正态性假设为前提，就会导致算法精度在某种程度上受影响。 marco 博客https://www.cnblogs.com/marc01in/p...

python调用sklearn模块实现朴素贝叶斯(NBC)——以新闻分类为例【图】

目录程序简述程序/数据集下载数据集截图核心代码解析 Module/BuildModel.py Module/NewsPredict.py接口调用、运行效果 Main.py程序简述将9类新闻语料切割为训练集和数据集，对新闻进行分词、去停用词、句向量构建后，调用sklearn模块提供的朴素贝叶斯接口建模，对新闻分类，最终实现的接口为输入：新闻字符串输出：新闻分类朴素贝叶斯分类（NBC）是以贝叶斯定理为基础并且假设特征条件之间相互独立的方法，先通过已给定的训...

python – 如何指定scikit-learn的朴素贝叶斯的先验概率【代码】

我正在使用scikit-learn机器学习库(Python)进行机器学习项目.我正在使用的算法之一是高斯朴素贝叶斯实现. GaussianNB()函数的一个属性如下：class_prior_ : array, shape (n_classes,)我想先手动更改类,因为我使用的数据非常偏斜,其中一个类的调用非常重要.通过为该类分配较高的先验概率,召回应该增加. 但是,我无法弄清楚如何正确设置属性.我已经阅读了以下主题,但他们的答案对我不起作用. How can the prior probabilities manual...

Python NLTK代码片段,用于使用特征频率训练分类器(朴素贝叶斯)【代码】

我想知道是否有人可以通过代码片段来帮助我,该代码片段演示了如何使用特征频率方法而不是特征存在来训练朴素贝叶斯分类器. 我认为下面第6章link text中所示的是指使用Feature Presence(FP)创建一个特征集 – def document_features(document): document_words = set(document) features = {}for word in word_features:features['contains(%s)' % word] = (word in document_words)return features请指教解决方法:在您发送的链接中...

首页 / PYTHON / NBC朴素贝叶斯分类器 ————机器学习实战 python代码

NBC朴素贝叶斯分类器 ————机器学习实战 python代码

内容导读

内容图文

内容总结

内容备注

内容手机端

【NBC朴素贝叶斯分类器 ————机器学习实战 python代码】教程文章相关的互联网学习教程文章

朴素贝叶斯python实现

python实现随机森林、逻辑回归和朴素贝叶斯的新闻文本分类【代码】【图】

朴素贝叶斯学习日志——简单案例python计算过程【代码】【图】

关于朴素贝叶斯的10篇文章推荐【图】

详细介绍如何在python中使用朴素贝叶斯算法【图】

如何使用python中朴素贝叶斯算法的介绍【图】

pythonde朴素贝叶斯算法

朴素贝叶斯算法的python实现

朴素贝叶斯算法的python实现方法【图】

python机器学习 | 朴素贝叶斯算法介绍及实现【图】

朴素贝叶斯Python代码实现（转）

Python机器学习（十五）朴素贝叶斯算法原理与代码实现【代码】【图】

python调用sklearn模块实现朴素贝叶斯(NBC)——以新闻分类为例【图】

python – 如何指定scikit-learn的朴素贝叶斯的先验概率【代码】

Python NLTK代码片段,用于使用特征频率训练分类器(朴素贝叶斯)【代码】

朴素贝叶斯 - 相关标签

机器学习 - 相关标签

代码 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程