什么是推荐系统以及其基本原理使用案例_编程10000问

来源:脚本之家  责任编辑:小易  
目录
基于内容的推荐系统基于协同过滤的推荐系统(1)基于item的协同过滤(2)基于用户的协同过滤

基于内容的推荐系统

根据每部电影的内容以及用户已经评过分的电影来判断每个用户对每部电影的喜好程度,从而预测每个用户对没有看过的电影的评分。

这里写图片描述

电影内容矩阵X * 用户喜好矩阵θ = 电影评分表

那么,用户喜好矩阵θ(用户对于每种不同类型电影的喜好程度)如何求解呢?

用户喜好矩阵θ的代价函数:

这里写图片描述

这里写图片描述 

其中,正则化项为防止过拟合。

优点:

            (1)不存在商品冷启动问题

            (2)可以明确告诉用户推荐的商品包含哪些属性

缺点:

             (1)需要对内容进行透彻的分析

             (2)很少能给用户带来惊喜

             (3)存在用户冷启动的问题

基于协同过滤的推荐系统

根据电影评分表和用户喜好矩阵θ,来求得电影内容矩阵X。然后,将电影内容矩阵X与用户喜好矩阵θ相乘,这样就得到了一个完整的电影评分表。

 这里写图片描述

所以,基于协同过滤的电影推荐就是根据每个用户对于每种电影类型的喜好程度以及用户已经评过分的电影来推断每部电影的内容,从而预测每个用户对没有看过的电影的评分。

那么,如何求解电影内容矩阵X呢?

电影内容矩阵X的代价函数:

这里写图片描述

用户喜好矩阵X的获取:

(1)通过在线问卷调查来获取用户对电影的评价,但并不是所有的用户都会填写,就算填写了,也不一定全部是正确信息;

(2)通过一种更高效的方式来同时求解电影内容矩阵X和用户喜好矩阵θ.

通过前面,可以看到电影内容矩阵X和用户喜好矩阵θ,它们的第一项是相同的,因此,我们可以将这两个公式合并为一个公式来同时求解X与θ,这种方法的好处就是只用搜集用户对电影的评分。

这里写图片描述

目标是最小化这个代价函数,随机初始化X和θ,通过梯度下降法或其他优化算法求解。

(1)基于item的协同过滤

 先计算商品之间的相似度,然后根据商品之间的相似度来向用户进行推荐,如:用户购买了硬盘,则很有可能向用户推荐u盘,因为硬盘和u盘具有相似性。

在基于item的协同过滤中,只需要用户对商品的评分,首先需要计算商品之间的相似度。

如何度量商品之间的相似度?

这里写图片描述

计算出商品之间的相似度之后, 我们就能够预测用户对商品的评分。

这里写图片描述

这里写图片描述:商品i 与其他商品的相似度

这里写图片描述:用户u对其他商品的评分

分母:与商品 i 相似的商品的相似度的总和

表达的是:根据用户u对其他和商品 i 相似的商品的评分来推断用户对商品 i 的评分。 当求出用户u对所有商品的预测评分后,将其进行排序,选择得分最高的商品推荐给用户。

(2)基于用户的协同过滤

基本思想:假设我们要对用户A进行推荐,首先要找到与用户相似的其他用户,看其他用户都购买过其他商品,把其他用户购买的商品推荐给用户A。

这时就需要度量用户之间的相似度,与基于item的协同过滤类似:

这里写图片描述

这里写图片描述:用户u对商品 i 的评分

这里写图片描述:用户u对这些商品评分的平均值

计算了用户之间的相似度之后就可以预测用户对商品的评分。

 商品评分公式:

这里写图片描述

公式表示:根据与用户u相似的其他用户对商品i 的评分来推断用户u对商品i 的评分。 当求出用户u对所有商品的预测评分后,将其进行排序,选择得分最高的几个商品推荐给用户。

基于协同过滤推荐系统的优点:

(1)能够根据各个用户的历史信息推断出商品的质量

(2)不需要对商品有任何专业领域的知识

缺点:

(1)冷启动问题

(2)gray sheep

(3)协同过滤的复杂度会随着商品数量和用户数量的增加而增加

(4)同义词的影响

(5)shilling attack:对竞争对手的商品专门打低分,对自己的商品打高分

日常生活中,我们每个人其实都直接或者间接接触过推荐系统,也都享受过推荐系统带来的生活上便利。关于推荐系统的介绍就到这里,希望大家以后多多支持真格学网!

您可能感兴趣的文章:不到40行代码用Python实现一个简单的推荐系统如何用Python来搭建一个简单的推荐系统Python用户推荐系统曼哈顿算法实现完整代码Python基于机器学习方法实现的电影推荐系统实例详解

  • 本文相关:
  • 如何防止计数器刷新计数?
  • 为什么用磁盘序列号加密过的代码不能被复制安装?
  • 如何取得服务器上的用户组列表?
  • 如何遍历目录及目录下的文件?
  • 如何制作一个web日程安排表?
  • 如何实现点击数的计算?
  • 如何利用数据库内容建立一个下拉式列表?
  • asp中在jscript中使用recordset对象的getrows
  • 浅析java、c/c++、javascript、php、python分别用来开发什么?
  • 如何上传一个单纯的html文件?
  • 超临界流体萃取技术的基本原理,工艺流程,基本特点及主要影响...
  • 考试科目:《 马克思主义基本原理概论 》 一、大作业题目(内容...
  • 静电喷涂技术的基本原理是什么?
  • 时钟电路的工作原理以及作用是什么?菜鸟求解释
  • DNS的基本工作原理是怎样的?
  • 安全管理的基本原理有哪五项
  • 汽车空调系统的组成与工作原理
  • 起动系统组成及工作原理
  • 计算机的基本工作原理是什么?
  • 马克思主义哲学基本原理
  • 光学瓦斯检定器的全部操作以及原理。
  • 减压蒸馏是什么原理?
  • 门禁系统IC卡加密原理是什么?
  • 中央新风系统的工作原理是什么?
  • dcs控制系统的工作原理是什么啊
  • 运用政府经济学的基本原理和相关知识,对我国政府宏观经济管...
  • 马克思主义基本原理概论试题及答案(大学公共课)
  • 液压系统的工作原理:
  • 网站首页网页制作脚本下载服务器操作系统网站运营平面设计媒体动画电脑基础硬件教程网络安全javascriptasp.netphp编程ajax相关正则表达式asp编程jsp编程编程10000问css/htmlflex脚本加解密web2.0xml/rss网页编辑器相关技巧安全相关网页播放器其它综合dart首页编程10000问不到40行代码用python实现一个简单的推荐系统如何用python来搭建一个简单的推荐系统python用户推荐系统曼哈顿算法实现完整代码python基于机器学习方法实现的电影推荐系统实例详解如何防止计数器刷新计数?为什么用磁盘序列号加密过的代码不能被复制安装?如何取得服务器上的用户组列表?如何遍历目录及目录下的文件?如何制作一个web日程安排表?如何实现点击数的计算?如何利用数据库内容建立一个下拉式列表?asp中在jscript中使用recordset对象的getrows浅析java、c/c++、javascript、php、python分别用来开发什么?如何上传一个单纯的html文件?如何判断电子邮件的地址格式是否oblog_4.6_sql 语句如何阻止别人非法链接你网站的图asp问答集如何在asp里显示进度条?asp中在jscript中使用recordset对禁止站外提交表单(author:killer如何按时间显示最新标志怎样获知数据库的连接属性?如何远程读取数据库页面?如何制作一个文本文件编辑器?如何在线更改密码?如何编写翻页函数?如何利用数据库内容建立一个下拉式列表?如何把一个excel文件放到asp页面中去?怎样避免直接在地址栏敲入url即可绕过登录如何显示最后十名来访者?如何检测字符串出现的次数?如何创建一个pdf文件?
    免责声明 - 关于我们 - 联系我们 - 广告联系 - 友情链接 - 帮助中心 - 频道导航
    Copyright © 2017 www.zgxue.com All Rights Reserved