首页 / PYTHON / 使用Python中的Scipy Hierarchy Clustering进行文本聚类

使用Python中的Scipy Hierarchy Clustering进行文本聚类

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了使用Python中的Scipy Hierarchy Clustering进行文本聚类，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含908字，纯文字阅读大概需要2分钟。

内容图文

使用Python中的Scipy Hierarchy Clustering进行文本聚类

我有一个文本语料库,每个文章包含1000个文章.我试图在python中使用Scipy使用层次结构聚类来生成相关文章的集群.
这是我用来进行聚类的代码

# Agglomerative Clustering
import matplotlib.pyplot as plt
import scipy.cluster.hierarchy as hac
tree = hac.linkage(X.toarray(), method="complete",metric="euclidean")
plt.clf()
hac.dendrogram(tree)
plt.show()

我得到了这个情节

然后我用fcluster()切断了第三层的树

from scipy.cluster.hierarchy import fcluster
clustering = fcluster(tree,3,'maxclust')
print(clustering)

我得到了这个输出：
[2 2 2 …,2 2 2]

我的问题是如何在每个群集中找到前10个常用词,以便为每个群集建议一个主题？

解决方法:

您可以执行以下操作：

>将结果(您的聚类变量)与您的输入(1000篇文章)对齐.
>使用pandas库,您可以使用groupby函数将集群#作为其键.
>每组(使用get_group函数),为每个填充一个整数的defaultdict
你遇到的一句话.
>您现在可以按降序对单词计数字典进行排序,并获得所需数量的最常用单词.

祝你好运,请接受我的答案,如果你正在寻找的话.

内容总结

以上是互联网集市为您收集整理的使用Python中的Scipy Hierarchy Clustering进行文本聚类全部内容，希望文章能够帮你解决使用Python中的Scipy Hierarchy Clustering进行文本聚类所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/699647.html

来源：【匿名】

【上一篇】如何用python检测firebase子的变化？【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【使用Python中的Scipy Hierarchy Clustering进行文本聚类】教程文章相关的互联网学习教程文章

python-Newick树表示为scipy.cluster.hierarchy链接矩阵格式【代码】

我有一组基于DNA序列进行比对和聚类的基因,并且我以Newick树表示形式(https://en.wikipedia.org/wiki/Newick_format)拥有这组基因.有谁知道如何将该格式转换为scipy.cluster.hierarchy.linkage矩阵格式？从链接矩阵的scipy文档中：A (n-1) by 4 matrix Z is returned. At the i-th iteration, clusterswith indices Z[i, 0] and Z[i, 1] are combined to form cluster n+i. Acluster with an index less than n corresponds to one...

python – 来自scipy.cluster.kmeans的不稳定结果【代码】

以下代码在每个运行时给出不同的结果,同时使用k均值方法将数据聚类为3个部分：from numpy import array from scipy.cluster.vq import kmeans,vqdata = array([1,1,1,1,1,1,3,3,3,3,3,3,7,7,7,7,7,7]) centroids = kmeans(data,3,100) #with 100 iterations print (centroids)获得的三个可能的结果是：(array([1, 3, 7]), 0.0) (array([3, 7, 1]), 0.0) (array([7, 3, 1]), 0.0)实际上,计算出的k均值的顺序是不同的.但是,分配哪个k...

python 连接 redis cluster 集群【代码】

一. redis集群模式有多种, cluster模式只是其中的一种实现方式, 其原理请自行谷歌或者百度, 这里只举例如何使用Python操作 redis cluster 集群二. python 连接 redis cluster 集群第三方库:redis-py-cluster: 最近还在维护rediscluster: 似乎很久没有更新了pip install redis-py-clusterfrom rediscluster import StrictRedisCluster# redis cluster 集群最少三主三从 startup_nodes = [{"host":"192.168.3.25", "port":6379}, ...

在python中连接MongoDB集群(MongoDB Cluster)

建立了一个MongoDB集群，集群名称 replSet=rs0，包含以下 3 个节点：172.16.250.233:27017 # SECONDARY 172.16.250.234:27017 # PRIMARY 172.16.250.237:27017 # SECONDARY 集群的 test 用户的密码为 “123456” ，只能访问 test 数据库。另外还有一个MongoDB数据库单独部署在 172.16.250.238，其 admin 用户的密码为 “123456” ，只能访问 admin 数据库。 MongoDB集群没有提供类似MySQL集群和Redis集群中的虚拟IP。在使用的时候...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / 使用Python中的Scipy Hierarchy Clustering进行文本聚类

使用Python中的Scipy Hierarchy Clustering进行文本聚类

内容导读

内容图文

内容总结

内容备注

内容手机端

【使用Python中的Scipy Hierarchy Clustering进行文本聚类】教程文章相关的互联网学习教程文章

python-Newick树表示为scipy.cluster.hierarchy链接矩阵格式【代码】

python – 来自scipy.cluster.kmeans的不稳定结果【代码】

python 连接 redis cluster 集群【代码】

在python中连接MongoDB集群(MongoDB Cluster)

PYTHON - 相关标签

IE - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程