首页 / 算法 / KNN算法

KNN算法

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了KNN算法，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1691字，纯文字阅读大概需要3分钟。

内容图文

KNN算法 - 文章图片
1、底层算法

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

#先随机设置十个样本点表示十杯酒
rowdata = {'颜色深度':[14.23,13.2,13.16,14.37,13.24,12.07,12.43,11.79,12.37,12.04],
          '酒精浓度':[5.64,4.38,5.68,4.80,4.32,2.76,3.94,3.  ,2.12,2.6 ],
          '品种':[0,0,0,0,0,1,1,1,1,1]}
# 0代表黑皮诺 ， 1代表赤霞珠
wine_data = pd.DataFrame(rowdata)
wine_data

X = np.array(wine_data.iloc[:,0:2])
X
y = np.array(wine_data.iloc[:,-1])
y
new_data = np.array([12.8,4.1])   #要判断的数据

# 1 算距离
from math import sqrt
distance = [sqrt(np.sum((x-new_data)**2)) for x in X]
distance

# 2 找邻居
sort_dist = np.argsort(distance)  #排序 返回数组的索引
sort_dist

k = 3   #选取前3个样本
topK = [y[i] for i in sort_dist[:k]]
topK

# 3 做分类
from collections import Counter   #对已有的数据类别进行计数，返回字典

votes = Counter(topK)
votes

predict = votes.most_common(1)[0][0]   #排序，索引 次数出现最多的
predict

#打包成函数
def KNN(inx,dataset,k):
    import numpy as np
    import pandas as pd
    from math import sqrt
    from collections import Counter
    
    result=[]
    distance = [sqrt(np.sum((x-inx)**2)) for x in np.array(dataset.iloc[:,0:2])]
    sort_dist = np.argsort(distance)
    topK = [dataset.iloc[:,-1][i] for i in sort_dist[:k]]
    result.append(Counter(topK).most_common(1)[0][0])
    return result
    
KNN(new_data,wine_data,3)

2、sklearn实现

from sklearn.neighbors import KNeighborsClassifier  #  调包  k近邻分类型

# 实例化（赋值的过程：将算法本身的模型赋值给一个变量）
clf = KNeighborsClassifier(n_neighbors=3)
# 训练模型
clf = clf.fit(X,y)
# 预测输出,返回预测的标签
result = clf.predict([[12.8,4.1]])
result

# 模型的评估，接口score返回预测的准确率
score = clf.score([[12.8,4.1]],[0])
score
# 返回预测的概率
clf.predict_proba([[12.8,4.1]])

内容总结

以上是互联网集市为您收集整理的KNN算法全部内容，希望文章能够帮你解决KNN算法所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/715723.html

来源：【匿名】

【上一篇】k均值聚类算法【下一篇】浅谈php实现映射的两种方法（链表和二叉树）

更多 ►

【KNN算法】教程文章相关的互联网学习教程文章

机器学习实战学习笔记(二)-KNN算法(2)-KNN算法改进约会网站的配对效果【代码】【图】

机器学习实战学习笔记(二)-KNN算法(2)-KNN算法改进约会网站的配对效果情景概要某个妹子交往过三种类型的人:不喜欢的人魅力一般的人.极具魅力的人这个妹子想要知道自己到底喜欢哪一类男人，于是提供了她收集的约会数据(1000行,吐槽一波，手动狗头)，并希望能创建一种分类机制来帮她完成这件事情。数据表格如下:实际数据集是这样的:datingTestSet.txtdatingTestSet2.txt导入数据# 判断分类 def isWhichClass(className):if className...

knn算法手写字识别案例【代码】【图】

import pandas as pd import numpy as np import matplotlib.pyplot as plt import os from sklearn.neighbors import KNeighborsClassifierdef build_data(dir_name):"""构建数据:param dir_name: 指定传入文件夹名称:return: 构建好的数据"""# 获取文件名列表file_name_list = os.listdir(dir_name + "/")print("获取到的文件名列表：\n", file_name_list)# 进行读取文件data = np.zeros(shape=(len(file_name_list), 1025))# 循...

【机器学习】knn算法自实现【代码】

1import pandas as pd2import numpy as np3 4 5def build_data():6""" 7 加载数据8 :return:9"""10# 1、加载数据11 data = pd.read_excel("./电影分类数据.xlsx") 1213return data 141516def distance(v1, v2): 17"""18 计算距离 19 :param v1:点1 20 :param v2: 点2 21 :return: 距离dist 22"""23# 法124# v1 是矩阵将矩阵转化数组，再进行降为1维25# v1 = v1.A[0]26# print(v1)27# sum_ = 028# for i in ...

KNN算法java实现代码注释【代码】【图】

K近邻算法思想非常简单，总结起来就是根据某种距离度量检测未知数据与已知数据的距离，统计其中距离最近的k个已知数据的类别，以多数投票的形式确定未知数据的类别。一直想自己实现knn的java实现，但限于自己的编程水平，java刚刚入门，所以就广泛搜索网上以实现的java代码来研习。下面这个简单的knn算法的java实现是在这篇博客中找到的：http://blog.csdn.net/luowen3405/article/details/6278764 下面给出我对代码的注释，如果有...

自己实现KNN算法【代码】

import numpy as np from math import sqrt from collections import Counterclass KNNClassifier(object):"""docstring for KNNClassifier"""def__init__(self, k):assert k>=1,"k must be valid"self.k = kself._X_train = Noneself._y_train = Nonedef fit(self,X_train,y_train):‘‘‘根据训练数据集X_train和y_train训练KNN分类器‘‘‘self._X_train = X_trainself._y_train = y_trainreturn selfdef predict(self,X_predic...

机器学习 KNN算法实现（鸢尾花）【代码】【图】

frame 是Pandas的dataframe对象alpha 图像透明度figsize 英寸为单位的图像大小diagonal 只能在{‘hist‘,‘kde‘}中选一个 hist表示直方图 kde表示核密度估计　　　　这个参数是scatter_matrix的关键参数marker 是标记类型，如圈，点，三角号代码from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split iris_dataset=load_iris() X_train,X_test,y_train,y_test=train_test_split(iris_da...

KNN算法

K最近邻(k-Nearest Neighbor，KNN)分类算法，是一个理论上比较成熟的方法，也是最简单的机器学习算法之一。该方法的思路是：如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。如：绿色圆要被决定赋予哪个类，是红色三角形还是蓝色四方形？如果K=3，由于红色三角形所占比例为2/3，绿色圆将被赋予红色三角形那个类，如果K=5，由于蓝色四方形比例为3/5，因此绿色圆被...

python用K近邻（KNN）算法分类MNIST数据集和Fashion MNIST数据集【代码】

一、KNN算法的介绍　　K最近邻（k-Nearest Neighbor，KNN）分类算法是最简单的机器学习算法之一，理论上比较成熟。KNN算法首先将待分类样本表达成和训练样本一致的特征向量；然后根据距离计算待测试样本和每个训练样本的距离，选择距离最小的K个样本作为近邻样本；最后根据K个近邻样本判断待分类样本的类别。KNN算法的正确选取是分类正确的关键因素之一，而近邻样本是通过计算测试样本与每个训练集样本的距离来选定的，故定义合适的...

Machine Learning In Action 第二章学习笔记: kNN算法【代码】【图】

本文主要记录《Machine Learning In Action》中第二章的内容。书中以两个具体实例来介绍kNN（k nearest neighbors)，分别是：约会对象预测手写数字识别通过“约会对象”功能，基本能够了解到kNN算法的工作原理。“手写数字识别”与“约会对象预测”使用完全一样的算法代码，仅仅是数据集有变化。约会对象预测1 约会对象预测功能需求主人公“张三”喜欢结交新朋友。“系统A”上面注册了很多类似于“张三”的用户，大家都想结交心朋友...

python实现简单knn算法【代码】

原理：计算当前点（无label，一般为测试集）和其他每个点（有label，一般为训练集）的距离并升序排序，选取k个最小距离的点，根据这k个点对应的类别进行投票，票数最多的类别的即为该点所对应的类别。代码实现（数据集采用的是iris）： 1import numpy as np2from sklearn.datasets import load_iris3from sklearn.model_selection import train_test_split4from sklearn import neighbors5from sklearn.metrics import accuracy_sc...

KNN算法【代码】【图】

KNN算法的介绍请参考：http://blog.csdn.net/zouxy09/article/details/16955347统计学习方法里面给出了KD Tree的算法介绍,按照书上的进行了实现：# -*- coding: utf-8 -*-from operator import itemgetter from copy import deepcopy import heapqclass Node(object):def__init__(self, dim, label=None, parent = None,split = 0):"""kd树的节点:param dim: 节点的向量:param label: 节点的label:param parent: 父节点:param spli...

使用KNN算法对鸢尾花数据集进行分类处理【图】

首先对数据进行读取与处理然后实现KNN分类算法上边是把原始数据集切割为测试集和训练集，然后创建KNN对象进行训练和测试原文：https://www.cnblogs.com/lxt-/p/11523385.html

KNN算法Hadoop实现及kaggle digit recognition数据测试【图】

软件版本：Hadoop2.6,MyEclipse10.0 , Maven 3.3.2源码下载地址：https://github.com/fansy1990/knn 。1. KNN算法思路如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。KNN算法中，所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。-- 摘自《邻近算法》，百度百科2. KNN算法MR实现：Hadoo...

KNN算法--python实现【代码】

邻近算法或者说K最近邻(kNN，k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻，就是k个最近的邻居的意思，说的是每个样本都可以用它最接近的k个邻居来代表。关于K最近邻算法，非常好的一篇文章：KNN算法理解行业应用：客户流失预测、欺诈侦测等（更适合于稀有事件的分类问题）写在前面的：Python2.7 数据iris: http://pan.baidu.com/s/1bHuQ0A 测试数据集: iris的第1行数据；训练数据: ir...

机器学习系列(5) KNN算法【代码】【图】

KNN算法一、KNN算法介绍KNN算法全称是K Nearest Neighbors ，KNN原理就是当预测一个值属于什么分类，根据它最近的K个分类是什么进行预测它属于什么类别。重点有两个： K 的确定和距离的计算距离的计算：欧式距离K值的计算：通过交叉验证（将样本数据按照一定的比例拆分成训练用的数据和验证用的数据），从中选取一个较小的K值开始，不断增加K的值，然后计算验证集合方差，最终找到一个比较适合的K值二、KNN的优缺点优点：简单易用，...

算法 - 最热教程

浅谈SQLServer查询优化器中的JOIN算法有没那种可逆算法是密文比明文短的呢？...javascript-类似Excel里面的NORMDIST函...C++中的分治算法及常见题目汇总压缩感知重构算法综述-学习笔记 c++中内置函数qsort（快速排序）和bsea...一、fpga图像处理算法整合基于遗传算法（deap）的非线性函数寻优...集成学习-Bagging集成学习算法随机森林...机器学习笔记（九）聚类算法及实践（K-...

首页 / 算法 / KNN算法

KNN算法

内容导读

内容图文

内容总结

内容备注

内容手机端

【KNN算法】教程文章相关的互联网学习教程文章

机器学习实战学习笔记(二)-KNN算法(2)-KNN算法改进约会网站的配对效果【代码】【图】

knn算法手写字识别案例【代码】【图】

【机器学习】knn算法自实现【代码】

KNN算法java实现代码注释【代码】【图】

自己实现KNN算法【代码】

机器学习 KNN算法实现（鸢尾花）【代码】【图】

KNN算法

python用K近邻（KNN）算法分类MNIST数据集和Fashion MNIST数据集【代码】

Machine Learning In Action 第二章学习笔记: kNN算法【代码】【图】

python实现简单knn算法【代码】

KNN算法【代码】【图】

使用KNN算法对鸢尾花数据集进行分类处理【图】

KNN算法Hadoop实现及kaggle digit recognition数据测试【图】

KNN算法--python实现【代码】

机器学习系列(5) KNN算法【代码】【图】

算法 - 相关标签

算法 - 最新教程

算法 - 最热教程