首页 / 算法 / 聚类(Clustering) - K-means算法 - 理论详解实战

聚类(Clustering) - K-means算法 - 理论详解实战

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了聚类(Clustering) - K-means算法 - 理论详解实战，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1537字，纯文字阅读大概需要3分钟。

内容图文

一、Kmeans算法计算过程理论讲解

1. 归类：

聚类(clustering) 属于非监督学习 (unsupervised learning)
无类别标记(class label)

2. 举例：

3. K-means 算法：

3.1 Clustering 中的经典算法，数据挖掘十大经典算法之一
3.2 算法接受参数 k ；然后将事先输入的n个数据对象划分为 k个聚类以便使得所获得的聚类满足：同一
聚类中的对象相似度较高；而不同聚类中的对象相似度较小。
3.3 算法思想：
以空间中k个点为中心进行聚类，对最靠近他们的对象归类。通过迭代的方法，逐次更新各聚类中心
的值，直至得到最好的聚类结果
3.4 算法描述：

（1）适当选择c个类的初始中心；
（2）在第k次迭代中，对任意一个样本，求其到c各中心的距离，将该样本归到距离最短的中心所在
的类；
（3）利用均值等方法更新该类的中心值；
（4）对于所有的c个聚类中心，如果利用（2）（3）的迭代法更新后，值保持不变，则迭代结束，
否则继续迭代。
3.5 算法流程：

输入：k, data[n];
（1）选择k个初始中心点，例如c[0]=data[0],…c[k-1]=data[k-1];
（2）对于data[0]….data[n], 分别与c[0]…c[k-1]比较，假定与c[i]差值最少，就标记为i;
（3）对于所有标记为i点，重新计算c[i]={ 所有标记为i的data[j]之和}/标记为i的个数；
（4）重复(2)(3),直到所有c[i]值的变化小于给定阈值。

4. 举例：

聚类(Clustering) - K-means算法 - 理论详解实战 - 文章图片

停止

优点：速度快，简单
缺点：最终结果跟初始点选择相关，容易陷入局部最优，需直到k值
Reference: http://croce.ggf.br/dados/K%20mean%20Clustering1.pdf

内容总结

以上是互联网集市为您收集整理的聚类(Clustering) - K-means算法 - 理论详解实战全部内容，希望文章能够帮你解决聚类(Clustering) - K-means算法 - 理论详解实战所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/806851.html

来源：【匿名】

【上一篇】小白一路走来，连续刷题三年，谈谈我的算法学习经验【下一篇】浅谈php实现映射的两种方法（链表和二叉树）

更多 ►

【聚类(Clustering) - K-means算法 - 理论详解实战】教程文章相关的互联网学习教程文章

聚类--K均值算法：自主实现与sklearn.cluster.KMeans调用【代码】【图】

import numpy as np x=np.random.randint(1,100,[20,1]) #在1-100范围中产生20行1列的随机数组 y=np.zeros(20) k=3 #取数据中k个对象为初始中心,每个对象代表一个聚类中心 def initcenter(x,k): return x[:k] kc=initcenter(x,k) kc#对于样本中的数据对象，根据它们与这些聚类中心的欧氏距离，按距离最近的准则将它们分到距离它们最近的聚类中心（最相似）所对应的类； def nearest(kc,i): #数组中的值，与...

聚类--K均值算法：自主实现与sklearn.cluster.KMeans调用【图】

#从数据集中导入鸢尾花数据import numpy as npfrom sklearn.datasets import load_irisiris =load_iris()x = iris.data[:,1]y =np.zeros(150) #1）选取数据空间中的K个对象作为初始中心，每个对象代表一个聚类中心；def initcenter(x,k): #初始聚类中心数组 return x[0:k].reshape(k) #2）将各个数据分到距离它们最近的聚类中心（最相似）所对应的类def nearest(kc,i): #数组中的值，与聚类中心最小距离所在类别的索引号 d...

聚类--K均值算法：自主实现与sklearn.cluster.KMeans调用【代码】【图】

import numpy as np x=np.random.randint(1,100,[20,1]) #在1-100范围中产生20行1列的随机数组 y=np.zeros(20) k=3#取数据中k个对象为初始中心,每个对象代表一个聚类中心 def initcenter(x,k): return x[:k] kc=initcenter(x,k) kc#对于样本中的数据对象，根据它们与这些聚类中心的欧氏距离，按距离最近的准则将它们分到距离它们最近的聚类中心（最相似）所对应的类； def nearest(kc,i): #数组中的值，与...

聚类--K均值算法：自主实现与sklearn.cluster.KMeans调用【代码】【图】

import numpy as np from sklearn.datasets import load_iris iris = load_iris() x=iris.data[:,1] y=np.zeros(150) k=3def initcent(x,k):return x[0:k].reshape(k)def nearest(kc,i):#数组中的值，与聚类中心最小距离所在类型的索引号d=(abs(kc-i))w=np.where(d == np.min(d))return w[0][0]def kcmean(x,y,kc,k): #计算各聚类新均值l=list(kc)flag= Falsefor c in range(k):print(c)m=np.where(y == c)# print(m,x[m])n = np.m...

聚类--K均值算法：自主实现与sklearn.cluster.KMeans调用【代码】【图】

4 用python实现K均值算法x=np.random.randint(1,100,[20,1]) y=np.zeros(20) k=3def initcenter(x,k):return x[:k]def nearest(kc,i):d = (abs(kc - i))w = np.where(d ==np.min(d))return w [0] [0]kc = initcenter(x,k) nearest(kc,14)for i in range(x.shape[0]):print(nearest(kc,x[i]))运行结果为: for i in range(x.shape[0]):y[i] = nearest(kc,x[i]) print(y)运行结果为: for i in range(x.shape[0]):y[i]=nearest(k...

第八次作业--聚类--K均值算法：自主实现与sklearn.cluster.KMeans调用【代码】【图】

1.用python实现K均值算法 K-means是一个反复迭代的过程，算法分为四个步骤：（x,k,y) 1）选取数据空间中的K个对象作为初始中心，每个对象代表一个聚类中心； def initcenter(x, k): kcimport numpy as np x = np.random.randint(1,100,[20,1]) y = np.zeros(20) k = 3 xdef initcenter(x, k):#初始聚类中心数组return x[:k]kc = initcenter(x,k) kc 2）对于样本中的数据对象，根据它们与这些聚类中心的欧氏距离，按距离最近...

数据分布算法：hash+ 一致性 hash + redis cluster 的 hash slot

讲解分布式数据存储的核心算法，数据分布的算法 hash 算法 -> 一致性 hash 算法（memcached） -> redis cluster 的 hash slot 算法用不同的算法，就决定了在多个 master 节点的时候，数据如何分布到这些节点上去，解决这个问题看到这里的时候，已经明白了，可能是通过 key 去路由到多个 master 上的 redis cluster 介绍#自动将数据进行分片，每个 master 上放一部分数据提供内置的高可用支持，部分 master 不可用时，还是可以继...

27_数据分布算法：hash+一致性hash+redis cluster的hash slot

讲解分布式数据存储的核心算法，数据分布的算法 hash算法 -> 一致性hash算法（memcached） -> redis cluster，hash slot算法用不同的算法，就决定了在多个master节点的时候，数据如何分布到这些节点上去，解决这个问题 1、redis cluster介绍 redis cluster （1）自动将数据进行分片，每个master上放一部分数据（2）提供内置的高可用支持，部分master不可用时，还是可以继续工作的在redis cluster架构下，每个redis要放开两个端口...

算法 - 最热教程

浅谈SQLServer查询优化器中的JOIN算法有没那种可逆算法是密文比明文短的呢？...javascript-类似Excel里面的NORMDIST函...C++中的分治算法及常见题目汇总压缩感知重构算法综述-学习笔记 c++中内置函数qsort（快速排序）和bsea...一、fpga图像处理算法整合基于遗传算法（deap）的非线性函数寻优...集成学习-Bagging集成学习算法随机森林...机器学习笔记（九）聚类算法及实践（K-...

首页 / 算法 / 聚类(Clustering) - K-means算法 - 理论详解实战

聚类(Clustering) - K-means算法 - 理论详解实战

内容导读

内容图文

一、Kmeans算法计算过程理论讲解

1. 归类：

2. 举例：

3. K-means 算法：

4. 举例：

内容总结

内容备注

内容手机端

【聚类(Clustering) - K-means算法 - 理论详解实战】教程文章相关的互联网学习教程文章

聚类--K均值算法：自主实现与sklearn.cluster.KMeans调用【代码】【图】

聚类--K均值算法：自主实现与sklearn.cluster.KMeans调用【图】

聚类--K均值算法：自主实现与sklearn.cluster.KMeans调用【代码】【图】

聚类--K均值算法：自主实现与sklearn.cluster.KMeans调用【代码】【图】

聚类--K均值算法：自主实现与sklearn.cluster.KMeans调用【代码】【图】

第八次作业--聚类--K均值算法：自主实现与sklearn.cluster.KMeans调用【代码】【图】

数据分布算法：hash+ 一致性 hash + redis cluster 的 hash slot

27_数据分布算法：hash+一致性hash+redis cluster的hash slot

算法 - 相关标签

算法 - 最新教程

算法 - 最热教程