基于用户的协同过滤算法

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了基于用户的协同过滤算法，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2648字，纯文字阅读大概需要4分钟。

内容图文

一、协同过滤算法简介

　　协同过滤算法是一种较为著名和常用的推荐算法，它基于对用户历史行为数据的挖掘发现用户的喜好偏向，并预测用户可能喜好的产品进行推荐。也就是常见的“猜你喜欢”，和“购买了该商品的人也喜欢”等功能。它的主要实现由：

　　●根据和你有共同喜好的人给你推荐

　　●根据你喜欢的物品给你推荐相似物品

　　●根据以上条件综合推荐

　　因此可以得出常用的协同过滤算法分为两种，基于用户的协同过滤算法(user-based collaboratIve filtering)，以及基于物品的协同过滤算法(item-based collaborative filtering)。特点可以概括为“人以类聚，物以群分”，并据此进行预测和推荐。

二、协同过滤算法的关键问题　

　　实现协同过滤算法，可以概括为几个关键步骤：

　　1：根据历史数据收集用户偏好

　　2：找到相似的用户（基于用户）或物品（基于物品）

三、基于用户的协同过滤算法描述

　　基于用户的协同过滤算法的实现主要需要解决两个问题，一是如何找到和你有相似爱好的人，也就是要计算数据的相似度：

　　计算相似度需要根据数据特点的不同选择不同的相似度计算方法，有几个常用的计算方法：

　　（1）杰卡德相似系数(Jaccard similarity coefficient)

　　　　其实就是集合的交集除并集

　　　　　　　　　　　　　　　　　　基于用户的协同过滤算法 - 文章图片

　　（2）夹角余弦(Cosine)

　　在二维空间中向量A(x1,y1)与向量B(x2,y2)的夹角余弦公式：

　　　　　　　　　　　　　　　　基于用户的协同过滤算法 - 文章图片

　　两个n维样本点a(x11,x12,…,x1n)和b(x21,x22,…,x2n)的夹角余弦：

　　　　　　　　　　　　　　　　　基于用户的协同过滤算法 - 文章图片

　　即　　　　　　　　　　　　　　基于用户的协同过滤算法 - 文章图片

　　（3）其余方法，例如欧式距离、曼哈顿距离等相似性度量方法可以点此了解

　　找到与目标用户最相邻的K个用户

　　我们在寻找有有相同爱好的人的时候，可能会找到许多个，例如几百个人都喜欢A商品，但是这几百个人里，可能还有几十个人与你同时还喜欢B商品，他们的相似度就更高，我们通常设定一个数K，取计算相似度最高的K个人称为最相邻的K个用户，作为推荐的来源群体。

　　这里存在一个小问题，就是当用户数据量十分巨大的时候，在所有人之中找到K个基友花的时间可能会比较长，而且实际中大部分的用户是和你没有什么关系的，所以在这里需要用到反查表

　　所谓反查表，就是比如你喜欢的商品有A、B、C，那就分别以ABC为行名，列出喜欢这些商品的人都有哪些，其他的人就必定与你没有什么相似度了，从这些人里计算相似度，找到K个人

　　通过这K个人推荐商品

　　我们假设找到的人的喜好程度如下

你	A	B	C	D
甲（相似度25%）	√	√		√
乙（相似度80%）			√	√

　　那么对于产品ABCD，推荐度可以计算为：

　　●A：1*0.25=0.25

　　●B：1*0.25=0.25

　　●C：1*0.8=0.8

　 ●D：1*0.25+1*0.8=1.05

　　很明显，我们首先会推荐D商品，其次是C商品，再后是其余商品

　　当然我们也可以采用其他的推荐度计算方法，但是我们一定会使用得到的相似度0.25和0.80，也即一定是进行加权的计算。

　　算法总结

　　这就是基于用户的协同推荐算法，总结步骤为

　　1.计算其他用户的相似度，可以使用反查表除掉一部分用户

　　2.根据相似度找到与你嘴相似的K个用户

　　3.在这些邻居喜欢的物品中，根据与你的相似度算出每一件物品的推荐度

　　4.根据相似度推荐物品

　　算法存在的问题

　　例如一段时间内非常流行的某种商品，或者某种通用的商品，购买的人非常多，此时如果列入正常计算过程中就没有太大意义了，并且会增加负担。可以给此种商品价一个权值或者在数据预处理阶段作为脏数据处理掉。

实战-待补　　

内容总结

以上是互联网集市为您收集整理的基于用户的协同过滤算法全部内容，希望文章能够帮你解决基于用户的协同过滤算法所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/849471.html

来源：【匿名】

【上一篇】《算法》第四章部分程序 part 16 【下一篇】浅谈php实现映射的两种方法（链表和二叉树）

更多 ►

【基于用户的协同过滤算法】教程文章相关的互联网学习教程文章

仅仅基于用户行为数据设计的推荐算法一般称为协同过滤算法，方法有：隐语义模型基于图的随机游走算法基于邻域的方法：应用最广泛基于用户的协同过滤算法：给用户推荐和他兴趣相似的其他用户喜欢的物品基于物品的协同过滤算法：给用户推荐和他之前喜欢的物品相似的物品　两步走：找到和目标用户兴趣相似的用户的集合找到这个集合中的用户喜欢的，且目标用户没有听过的商品推荐给目标用户一、找到和目标用户兴趣相似的用户的集合1、...

Python Spark实现协同过滤算法【代码】

Python Spark实现协同过滤算法环境 Python 3.7.6 CentOS Linux release 8.1.1911 (Core) Spark version 3.0.0 Scala version 2.12.10 (Java HotSpot(TM) 64-Bit Server VM, Java 14.0.2)实现代码 from pyspark import SparkContext# $example on$ from pyspark.mllib.recommendation import ALS, Rating from argparse import ArgumentParserif __name__ == "__main__":sc = SparkContext(appName="PythonCollaborativeFiltering...

【推荐系统】{1} —— 基于用户的协同过滤算法【图】

协同过滤（英语：Collaborative Filtering，简称CF），简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息，个人透过合作的机制给予信息相当程度的回应（如评分）并记录下来以达到过滤的目的进而帮助别人筛选信息，回应不一定局限于特别感兴趣的，特别不感兴趣信息的纪录也相当重要。——维基百科基于用户的协同过滤算法（简称UserCF）在一个在线个性化推荐系统中，当一个用户A需要个性化推荐时，可以先找...

推荐系统Lambda架构算法（一）：Model-Based 协同过滤算法有哪些种类？

文章目录Model-Based 协同过滤算法 Model-Based 协同过滤算法随着机器学习技术的逐渐发展与完善，推荐系统也逐渐运用机器学习的思想来进行推荐。将机器学习应用到推荐系统中的方案真是不胜枚举。以下对Model-Based CF算法做一个大致的分类：基于分类算法、回归算法、聚类算法基于矩阵分解的推荐基于神经网络算法基于图模型算法接下来我们重点学习以下几种应用较多的方案：基于回归模型的协同过滤推荐基于矩阵分解的协同过滤推...

协同过滤算法【代码】

关于相似度的三种计算，可用于电影推荐系统。 from random import sample import json from math import sqrt import time from collections import defaultdict#曼哈顿欧式 cos 三种距离users={"Angelica":{"星际穿越"：3.5，“放牛班的春天”：2.0，"肖申克的救赎"：4.5，"盗梦空间":5.0,"阿甘正传"：1.5，"乱世佳人":2.5,"傲慢与偏见":2.0},"Bill":{"星际穿越"：2.0，"放牛班的春天":3.5,"肖申克的救赎"：4.5，"盗梦空间": 5.0...

协同过滤算法总结篇

(注:这里不再对算法公式累述)1.相似度算法 1.1Jaccard距离使用集合中的不同元素的比例来衡量两个集合的区分度，但是存在比较明显的问题无法关注到集合中元素的权重值(评分) 1.2余弦相似度利用向量空间解决了权重值(评分)带入相似度计算的问题，非常常用的相似度算法，弥补了Jaccard距离计算的不足 1.3Pearson相似度(又名中心余弦相似度)Pearson相似度是对余弦相似度改进，简明来说就是将权重值(评分)减去权重的平均值，可以理解为将...

电影推荐系统---协同过滤算法(SVD,NMF)【图】

SVD 参考 https://www.zybuluo.com/rianusr/note/1195225 1 推荐系统概述? 1.1 项目安排 ? 1.2 三大协同过滤? 1.3 项目开发工具? 2 Movielens数据集简介MovieLens是推荐系统常用的数据集； MovieLens数据集中，用户对自己看过的电影进行评分，分值为1~5； MovieLens包括两个不同大小的库，适用于不同规模的算法；小规模的库事943个独立用户对1682部电影做的10000次评分的数据；大规模的库事6040个独立用户对3900部电影做的100万...

用户 - 相关标签

用户登录界面用户管理系统用户脚本用户名和密码用户态和内核态

算法 - 最热教程

浅谈SQLServer查询优化器中的JOIN算法有没那种可逆算法是密文比明文短的呢？...javascript-类似Excel里面的NORMDIST函...C++中的分治算法及常见题目汇总压缩感知重构算法综述-学习笔记 c++中内置函数qsort（快速排序）和bsea...一、fpga图像处理算法整合基于遗传算法（deap）的非线性函数寻优...集成学习-Bagging集成学习算法随机森林...机器学习笔记（九）聚类算法及实践（K-...

首页 / 算法 / 基于用户的协同过滤算法

基于用户的协同过滤算法

内容导读

内容图文

内容总结

内容备注

内容手机端

【基于用户的协同过滤算法】教程文章相关的互联网学习教程文章

2、前奏之基于用户的协同过滤算法：UserCF【图】

推荐系统实践--基于用户的协同过滤算法【代码】【图】

Python Spark实现协同过滤算法【代码】

【推荐系统】{1} —— 基于用户的协同过滤算法【图】

推荐系统Lambda架构算法（一）：Model-Based 协同过滤算法有哪些种类？

协同过滤算法【代码】

协同过滤算法总结篇

电影推荐系统---协同过滤算法(SVD,NMF)【图】

推荐系统-协同过滤算法【图】