首页 / HADOOP / 数据算法 --hadoop/spark数据处理技巧 --（13.朴素贝叶斯 14.情感分析）

数据算法 --hadoop/spark数据处理技巧 --（13.朴素贝叶斯 14.情感分析）

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了数据算法 --hadoop/spark数据处理技巧 --（13.朴素贝叶斯 14.情感分析），小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含532字，纯文字阅读大概需要1分钟。

内容图文

数据算法 --hadoop/spark数据处理技巧 --（13.朴素贝叶斯 14.情感分析）

十三。朴素贝叶斯

　　朴素贝叶斯是一个线性分类器。处理数值数据时，最好使用聚类技术（eg:K均值）和k-近邻方法，不过对于名字、符号、电子邮件和文本的分类，则最好使用概率方法，朴素贝叶斯就可以。在某些情况下，NBC也可以用来对数值数据分类。

　　对于数值数据的分类，比如（连续属性，身高，体重，脚长），建议采用采用高斯分布，令x是一个连续属性。首先，按类对数据分段，然后计算各个类中的x的均值（u）和方差（）。

　　本次主要以文本数据进行。

　　数据算法 --hadoop/spark数据处理技巧 --（13.朴素贝叶斯 14.情感分析） - 文章图片

　　首先先进行Map函数，将数据进行处理。

　　数据算法 --hadoop/spark数据处理技巧 --（13.朴素贝叶斯 14.情感分析） - 文章图片

　　得到的数据如下：

　　数据算法 --hadoop/spark数据处理技巧 --（13.朴素贝叶斯 14.情感分析） - 文章图片

　　之后再进行reduce，输入的数据诸如：

　　　　数据算法 --hadoop/spark数据处理技巧 --（13.朴素贝叶斯 14.情感分析） - 文章图片

　　reduce的代码处理如下：

　　　　数据算法 --hadoop/spark数据处理技巧 --（13.朴素贝叶斯 14.情感分析） - 文章图片

　　reduce的输出是

内容总结

以上是互联网集市为您收集整理的数据算法 --hadoop/spark数据处理技巧 --（13.朴素贝叶斯 14.情感分析）全部内容，希望文章能够帮你解决数据算法 --hadoop/spark数据处理技巧 --（13.朴素贝叶斯 14.情感分析）所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/735484.html

来源：【匿名】

【上一篇】大数据学习笔记 - hadoop day02 - HDFS JAVA API 数据读写流程【下一篇】php能用hadoop吗

更多 ►

【数据算法 --hadoop/spark数据处理技巧 --（13.朴素贝叶斯 14.情感分析）】教程文章相关的互联网学习教程文章