首页 / PYTHON / python – ValueError：标签数为1.使用silhouette_score时,有效值为2到n_samples – 1(包括)

python – ValueError：标签数为1.使用silhouette_score时,有效值为2到n_samples – 1(包括)

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python – ValueError：标签数为1.使用silhouette_score时,有效值为2到n_samples – 1(包括)，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2353字，纯文字阅读大概需要4分钟。

内容图文

python – ValueError：标签数为1.使用silhouette_score时,有效值为2到n_samples – 1(包括)

我正在尝试计算剪影得分,因为我找到了要创建的最佳簇数,但得到的错误表明：

ValueError: Number of labels is 1. Valid values are 2 to n_samples - 1 (inclusive)

我无法理解这个原因.这是我用来聚类和计算轮廓分数的代码.

我读了包含要聚类的文本的csv,并在n个簇值上运行K-Means.可能是我收到此错误的原因是什么？

  #Create cluster using K-Means
#Only creates graph
import matplotlib
#matplotlib.use('Agg')
import re
import os
import nltk, math, codecs
import csv
from nltk.corpus import stopwords
from gensim.models import Doc2Vec
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
import pandas as pd
from sklearn.metrics import silhouette_score

model_name = checkpoint_save_path
loaded_model = Doc2Vec.load(model_name)

#Load the test csv file
data = pd.read_csv(test_filename)
overview = data['overview'].astype('str').tolist()
overview = filter(bool, overview)
vectors = []

def split_words(text):
  return ''.join([x if x.isalnum() or x.isspace() else " " for x in text ]).split()

def preprocess_document(text):
  sp_words = split_words(text)
  return sp_words

for i, t in enumerate(overview):
  vectors.append(loaded_model.infer_vector(preprocess_document(t)))

sse = {}
silhouette = {}


for k in range(1,15):
  km = KMeans(n_clusters=k, max_iter=1000, verbose = 0).fit(vectors)
  sse[k] = km.inertia_
  #FOLLOWING LINE CAUSES ERROR
  silhouette[k] = silhouette_score(vectors, km.labels_, metric='euclidean')

best_cluster_size = 1
min_error = float("inf")

for cluster_size in sse:
    if sse[cluster_size] < min_error:
        min_error = sse[cluster_size]
        best_cluster_size = cluster_size

print(sse)
print("====")
print(silhouette)

解决方法:

产生错误是因为您有一个循环用于不同数量的集群n.在第一次迭代期间,n_clusters为1,这导致所有(km.labels_ == 0)为True.

换句话说,您只有一个标签为0的集群(因此,np.unique(km.labels_)打印数组([0],dtype = int32)).

silhouette_score需要多个群集标签.这会导致错误.错误消息很明确.

例：

from sklearn import datasets
from sklearn.cluster import KMeans
import numpy as np

iris = datasets.load_iris()
X = iris.data
y = iris.target

km = KMeans(n_clusters=3)
km.fit(X,y)

# check how many unique labels do you have
np.unique(km.labels_)
#array([0, 1, 2], dtype=int32)

我们有3个不同的集群/集群标签.

silhouette_score(X, km.labels_, metric='euclidean')
0.38788915189699597

功能正常.

现在,让我们导致错误：

km2 = KMeans(n_clusters=1)
km2.fit(X,y)

silhouette_score(X, km2.labels_, metric='euclidean')

06003

内容总结

以上是互联网集市为您收集整理的python – ValueError：标签数为1.使用silhouette_score时,有效值为2到n_samples – 1(包括)全部内容，希望文章能够帮你解决python – ValueError：标签数为1.使用silhouette_score时,有效值为2到n_samples – 1(包括)所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/699747.html

来源：【匿名】

【上一篇】在python中最小化函数的最快方法是什么？【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python – ValueError：标签数为1.使用silhouette_score时,有效值为2到n_samples – 1(包括)】教程文章相关的互联网学习教程文章

python画图中colorbar设置刻度和标签字体大小【代码】

fig=plt.figure(figsize=(10,8)) h=plt.contourf(data) cb=plt.colorbar(h) cb.ax.tick_params(labelsize=16) #设置色标刻度字体大小。 plt.xticks(fontsize=16) plt.yticks(fontsize=16) font = {‘family‘ : ‘serif‘,‘color‘ : ‘darkred‘,‘weight‘ : ‘normal‘,‘size‘ : 16,} cb.set_label(‘colorbar‘,fontdict=font) #设置colorbar的标签字体及其大小转载：https://blog.csdn.net/weixin_43718675/article/de...

python3用BeautifulSoup用字典的方法抓取a标签内的数据【代码】

# -*- coding:utf-8 -*- #python 2.7 #XiaoDeng #http://tieba.baidu.com/p/2460150866 #标签操作from bs4 import BeautifulSoup import urllib.request import re#如果是网址，可以用这个办法来读取网页 #html_doc = "http://tieba.baidu.com/p/2460150866" #req = urllib.request.Request(html_doc) #webpage = urllib.request.urlopen(req) #html = webpage.read()html=""" <html><head><title>The Dormouse‘s story</titl...

python3用BeautifulSoup用字典的方法抓取a标签内的数据【代码】

python - pandas或者sklearn中如何将字符形式的标签数字化

参考：http://www.php.cn/wenda/91257.html　　　　https://www.cnblogs.com/king-lps/p/7846414.html　　　　http://blog.csdn.net/kancy110/article/details/75043202原文：http://www.cnblogs.com/rrttp/p/8110329.html

23-python用BeautifulSoup用抓取a标签内所有数据【代码】

原文：https://blog.csdn.net/suibianshen2012/article/details/62040460?utm_source=copy # -*- coding:utf-8 -*- #python 2.7 #XiaoDeng #http://tieba.baidu.com/p/2460150866 #标签操作from bs4 import BeautifulSoup import urllib.request import re#如果是网址，可以用这个办法来读取网页 #html_doc = "http://tieba.baidu.com/p/2460150866" #req = urllib.request.Request(html_doc) #webpage = urllib.request.urlopen...

python selenium-webdriver 标签页切换（十四）【代码】【图】

测试过程中有时候会遇到点击某个按钮或者链接会弹出新的窗口，这时候我们的操作的页面还保持着最初打开页面，但是此时我们需要操作新打开的页面上的功能，这个时候我们需要切换一下标签页。　　其实页面的切换与frame的切换比较相识，一种切换时本页面内frame的操作，而标签页面是多页面的操作，道理很相似。下面讲解下操作页面标签会涉及到那些方法。 driver.current_window_handle 　　 #获取当前窗口的句...

python3生成标签云【代码】【图】

标签云是现在大数据里面最喜欢使用的一种展现方式，其中在python3下也能实现标签云的效果，贴图如下：-------------------进入正文---------------------首先要安装以下几个库：1#!/usr/bin/python3.42# -*- coding: utf-8 -*-34# http://www.lfd.uci.edu/~gohlke/pythonlibs/#cx_freeze5# 万能仓库下载pygame6# pip3下载simplejson还有最重要的库：pip3 install pytagcloud 或者去官网下载：https://pypi.python.org/pypi/pytagcl...

PythonNote03_HTML标签【代码】【图】

1<!DOCTYPE> 2<html> 3<head> 4<meta charset = "utf-8"/> 5<meta name="Keywords" content=""/> 6<mata name = "description" content = ""/> 7<title>03_复习随敲_0111</title> 8<style> 9 *{margin: 0;padding: 0;} 10 h1{text-align: center;color: red;} 11 ol{margin: 0 0 0 30px} 12 .zd{color: red;font-size: 20} 13</style> 14</head> 15<body> 16<h1>03_复习笔记_...

python 获取html置顶标签文本信息【代码】

class MyParser(HTMLParser):def __init__(self,key):self.data=[]self.key=keyself.falg=Falseself.linkname=‘‘HTMLParser.__init__(self)def handle_starttag(self,tag,attrs):if self.key and tag ==self.key:self.falg=Truedef handle_data(self,data):if self.falg and data:self.data.append(unicode(eval(repr(data)),"utf-8"))def handle_endtag(self,tag):if self.key and tag ==self.key:self.falg=Falsedef getresult...

利用python和shell脚本生成train.txt的标签文件【代码】【图】

1. 用shell脚本生成带绝对路径的train.txt例如我要生成如下形式的带标签的文件，如图:(如有两个标签：0 和 1)shell脚本如下：这样标签0写入了train.txt 1# /usr/bin/env sh 2 DATA=/home/ttwang/Desktop/Texture/03 DATASAVE=/home/ttwang/Desktop4 5 echo "Create train.txt..." 6 7# /usr/bin/env sh 8 find $DATA -name Grass*.jpg | sed "s/$/ 1/" >>$DATASAVE/train.txt910 echo "Done.."再写一个脚本，这样就把指定文件下的想...

用于NLP的Python：使用Keras的多标签文本LSTM神经网络分类【代码】【图】

原文链接：http://tecdat.cn/?p=8640 介绍在本文中，我们将看到如何开发具有多个输出的文本分类模型。我们将开发一个文本分类模型，该模型可分析文本注释并预测与该注释关联的多个标签。多标签分类问题实际上是多个输出模型的子集。在本文结尾，您将能够对数据执行多标签文本分类。数据集数据集包含来自Wikipedia对话页编辑的评论。评论可以属于所有这些类别，也可以属于这些类别的子集，这使其成为多标签分类问题。将...

python-TensorFlow RuntimeError：在SavedModel中找不到与标签服务相关联的MetaGraphDef【代码】

当我使用simple_save保存模型时,尝试加载模型时出现运行时错误. 要保存的代码是：session = Session() inputs = tf.placeholder(dtype=tf.float32, shape=(None, height, width, in_channel_size), name='input_img') model = Some_Model(inputs, num_classes=no_of_defects, is_training=False) logits, _ = model.build_model() predictor = tf.nn.softmax(self.logits, name='logits_to_softmax') feed_dict = {inputs: inputs}...

python – Tensorflow中的多标签分类器【代码】

我想用TensorFlow开发一个多标签分类器,我试图意味着存在多个包含多个类的标签.为了说明你可以想象这样的情况： > label-1类：灯光下雨,下雨,局部下雨,没有下雨>标签-2类：晴天,部分多云,多云,非常多云. 我想用神经网络对这两个标签进行分类.现在,我为每个(label-1,label-2)对类使用了不同的类标签.这意味着我有4 x 4 = 16个不同的标签. 通过训练我的模型目前的损失cross_entropy = tf.reduce_mean(-tf.reduce_sum(ys * tf.log(pr...

python-模板片段缓存似乎不适用于某些自定义模板标签【代码】

我一直在django应用程序中实现缓存,并通过缓存API和模板片段缓存对每个视图进行缓存.在我的某些页面上,我使用了一个自定义的django模板标签,该标签是由第三方开发人员提供的,它在其模板标签中包含一些参数,然后向远程服务器发出请求,并通过XML返回响应,并且然后将结果呈现在我的页面中.太好了-我以为我可以使用片段缓存轻松地缓存它,所以我：{% load cache %} {% cache 500 request.user.username %} {% load third party custom t...

python用来正常显示中文标签 plt.rcParams[‘font.sans-serif‘] = [‘SimHei‘]错误【图】

用来正常显示中文标签显示错误代码plt.rcParams[‘font.sans-serif’] = [‘SimHei’]无法运行我的环境：在JetBrains PyCharm Community Edition 2018.3.5 x64中，解释器是Anaconda3中的Python3.5 错误根源代码：plt.rcParams['font.sans-serif'] = ['SimHei'] 错误根源：Anaconda3的字体库中没有中文字simhei.ttf 如下图是我添加之后的文件夹字体显示解决办法 1、下载simhei.ttf字体，这里提供一个链接SimHei.ttf 2、找到你的解...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / python – ValueError：标签数为1.使用silhouette_score时,有效值为2到n_samples – 1(包括)

python – ValueError：标签数为1.使用silhouette_score时,有效值为2到n_samples – 1(包括)

内容导读

内容图文

内容总结

内容备注

内容手机端

【python – ValueError：标签数为1.使用silhouette_score时,有效值为2到n_samples – 1(包括)】教程文章相关的互联网学习教程文章

python画图中colorbar设置刻度和标签字体大小【代码】

python3用BeautifulSoup用字典的方法抓取a标签内的数据【代码】

python3用BeautifulSoup用字典的方法抓取a标签内的数据【代码】

python - pandas或者sklearn中如何将字符形式的标签数字化

23-python用BeautifulSoup用抓取a标签内所有数据【代码】

python selenium-webdriver 标签页切换（十四）【代码】【图】

python3生成标签云【代码】【图】

PythonNote03_HTML标签【代码】【图】

python 获取html置顶标签文本信息【代码】

利用python和shell脚本生成train.txt的标签文件【代码】【图】

用于NLP的Python：使用Keras的多标签文本LSTM神经网络分类【代码】【图】

python-TensorFlow RuntimeError：在SavedModel中找不到与标签服务相关联的MetaGraphDef【代码】

python – Tensorflow中的多标签分类器【代码】

python-模板片段缓存似乎不适用于某些自定义模板标签【代码】

python用来正常显示中文标签 plt.rcParams[‘font.sans-serif‘] = [‘SimHei‘]错误【图】

PYTHON - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程