读书笔记——

Recommender Systems An Introduction

作者:Dietmar Jannach, Markus Zanker, Alexander Felfernig, Gerhard Friedrich(蒋凡 译)

第1章 引言

推荐系统必须开发并维护一个用户模型(user model)或用户记录(user profile)保存用户的偏好。

用户的偏好可以通过监测用户行为隐式地获取,也可以由推荐系统询问访问者显示地获取。

系统生成个性化推荐列表时利用什么样额外的信息:基于群体协同的方法。

第一部分:基本概念

1.1.1 协同过滤推荐

基本思想:如果用户在过去有相同的偏好,那么他们在未来也会有相似的偏好。

协同过滤(CF, Collaborative Filtering)。

常见问题:

  • 如何发现与我们要推荐的用户有着相似偏好的用户?
  • 如何衡量相似度?
  • 如何处理还没有购买经历的新用户?
  • 如果只有很少的评分该怎么办?
  • 除了利用相似的用户之外,还有哪些技术可以用来预测某个用户是否喜欢其物品?

纯粹的协同过滤方法不会利用或要求任何有关物品本身的知识。

1.1.2 基于内容的推荐

推荐系统的两个目的:

  • 用于激发用户去做某件事情
  • 解决信息过载的工具

基于内容推荐的核心:能够得到物品的描述和这些特征的重要记录。

常见问题:

  • 系统如何自动获取并持续改进用户记录?
  • 如何决定哪个物品匹配或者至少能接近、符合用户的兴趣?
  • 什么技术能自动抽取或学习物品的描述,从而减少人工标注?

基于内容推荐的两大优点:

  • 不需要大规模用户就可以达到适度的推荐精准度
  • 一旦得到物品的属性就能立刻推荐新物品

1.1.3 基于知识的推荐

基于知识的方法中,推荐系统通常会用到有关当前用户和有效物品的额外信息(如基于约束的推荐)。

为了弥补缺少个性化,基于约束的推荐同样需要维护用户记录。

在许多基于知识的推荐系统中,用户需求必须通过交互引导得出。

常见问题:

  • 哪种领域知识能表示成知识库?
  • 什么机制可根据用户的特点来选择和排名物品?
  • 如何在没有购买记录的领域获取用户信息?如何处理用户直接给出的偏好信息?
  • 哪种交互方式能够用于交互式推荐系统?
  • 设计对话时,要考虑哪些个性化因素才能确保准确获得用户偏好信息?

1.1.4 混合推荐方法

常见问题:

  • 哪种方法能被组合,特定组合的前提是什么?
  • 两个或多个推荐算法是应该顺序计算?还是采用其他混合方式?
  • 不同方法的结果如何赋以权重,可以动态决定吗?

1.1.5 推荐系统的解释

解释是为了让用户更容易理解推荐系统的推理脉络。

常见问题:

  • 推荐系统在解释其推荐结果的同时如何提高用户对系统的信任度?
  • 推荐策略如何影响解释推荐的方式?
  • 能通过解释让用户相信系统给出的建议是”公正的“或者不偏颇的吗?

1.1.6 评估推荐系统

推荐系统领域研究的主要推动力是提高推荐质量。

更好地描述用户体验或系统目标的3种评估方法设计方案:实验、半实验和非实验。

常见问题:

  • 哪些研究设计适用于评估推荐系统?
  • 如何利用历史数据实验评估推荐系统?
  • 什么衡量标准适合不同的评估目标?
  • 现有评估技术的局限是什么?尤其是在推荐系统的会话性或商业价值方面。

1.1.7 案例研究

常见问题:

  • 推荐系统的商业价值是什么?
  • 它能帮助提高销售额获奖更多访问者转化为购买者吗?
  • 不同推荐算法在效果上有差别吗?在哪种情况下应该使用哪种技术?

1.2 第二部分:最新进展

涉及问题:

  • 隐私和鲁棒性
  • 在线消费决策
  • 社交和语义网背景下的推荐系统
  • 无处不在的应用

第2章 协同过滤推荐

主要思想:利用已有用户群过去的行为或意见预测当前用户最可能喜欢哪些东西或对哪些东西感兴趣。

存粹的协同方法的输入数据只有给定的用户-物品评分矩阵,输出数据一般有以下几种类型:

  1. 表示当前用户对物品喜欢或不喜欢程度的预测数值
  2. n项推荐物品的列表(不包含当前用户已经购买的物品)

2.1 基于用户的最近邻推荐

基于用户的最近邻推荐(user-based nearest neighbor recommendation)主要思想:

  • 首先,给定一个评分数据集和当前(活跃)用户的ID作为输入,找出与当前用户过去有相似偏好的其他用户,这些用户称为对等用户最近邻
  • 然后,对当前用户没有见过的每个产品p,利用其近邻对p的评分计算预测值。

潜在假设:

  1. 如果用户过去有相似的偏好,那么他们未来也会有相似的偏好;
  2. 用户偏好不会随时间而变化。

2.1.1 第一个例子

用户-物品评分矩阵

2.1.2 更好的相似度和赋权体系

计算用户间接近程度的方法:

  • 改进余弦相似度(在基于物品的推荐技术中更胜一筹
  • Spearman秩相关系数
  • 均方差
  • Pearson相关系数(在基于用户的推荐技术中更胜一筹)

让两个用户对有争议的物品达成共识会比对广受欢迎的物品达成共识更有价值,解决方案:

  • 对物品的评分进行变换,降低对广受欢迎物品有同样看法的相对重要性
  • 通过方差权重因子,提高了具有高方差评分值的物品,也就是指有争议的物品的作用。

基于近邻评分的预测方法在遇到当前用户只为非常少的共同物品评分时会出错,导致不准的预测,解决方案:

  • 重要性赋权
  • 样本扩展:强调那些接近+1和-1的值,对原始数值乘以一个常量p来调整近邻的权值。

2.1.3 选择近邻

降低近邻集规模的两种方法:

  • 为用户相似度定义一个具体的最小阈值:潜在问题是阈值过高,覆盖率降低;阈值太低,近邻规模不会显著降低。
  • k近邻:潜在问题是k值的选择,20到50个近邻似乎比较合理

2.2 基于物品的最近邻推荐

主要思想:利用物品间相似度,而不是用户间相似度来计算预测值。

基于物品推荐的方法就是简单地找到用户对相似物品的评分,来预测目标物品的评分。

2.2.1 余弦相似度量

在基于物品的推荐方法中,余弦相似度由于效果精确,已经被证实是一种标准的度量体系。

2.2.2 基于物品过滤的数据预处理

离线预计算:事先构建一个物品相似度矩阵

降低矩阵复杂度:

  • 仅考虑那些与其他物品同时评分数最少的物品
  • 对每个物品只记录有限的近邻

风险:增加无法预测某个特定物品的风险

相对用户相似度而言,物品相似度更稳定,预处理计算不会过于影响预测准确度。

二次采样:可以随机选取数据的子集,或者忽略那些仅有非常少量评分或仅包含非常热门物品的用户记录。

2.3 关于评分

2.3.1 隐式和显示评分

显示评分主要问题:需要推荐系统的用户额外付出,而用户很可能由于看不到好处而不愿意提供这些评分。

隐式评分主要问题:难以确定用户行为是否被正确解释。

2.3.2 数据稀疏和冷启动问题

基于图的方法:主要思想式利用假定用户品味的“传递性”,并由此增强额外信息矩阵

缺省投票式另外一种用来处理稀疏评分数据的技术。这种思路就是给那些只有一两个用户评过分的物品赋以缺省值。

将两种不同类型的相似度(用户相似度或物品相似度)组合起来提高预测准确率。

冷启动问题式稀疏问题的一个特例。此类问题包括:

  1. 如何向还没给任务物品评分的新用户推荐
  2. 如何处理从未被评过分或购买过的物品

这两类问题都可以通过混合方式来解决,即利用额外的外部信息。对于新用户问题,其他策略也可能奏效:

  1. 在推荐之前要求用户给出最低限度数量的评分。
  2. Eigentaste算法要求用户提供标准集合的评分也是一种类似的策略。

2.4 更多基于模型和预处理的方法

协同推荐技术一般分为两类:

  • 基于记忆:传统的基于用户技术式基于记忆的(原始评分数据保存在内存中,直接生成推荐结果)。
  • 基于模型:首先处理原始数据,就像基于物品的过滤和某些降维技术。运行时,只需要预计算或“学习过”的模型就能预测。

2.4.1 矩阵因子分解

方法:

  • 奇异值分解(SVD):发现文档中的潜在因子
  • 主成分分析(Eigentaste):用主成分分析(PCA)对评分数据预处理,过滤得出数据中“最重要”的方面,以解释大多数变量。
  • 概率潜在语义分析(pLSA):发现用户社区和评分数据里隐藏的兴趣模式,基于这种方法可以达到很好的准确度级别。

所有的预处理方法都必须解决数据更新问题:如何整合新的评分而不用重新计算整个“模型”。

2.4.2 关联规则挖掘

关联规则挖掘是一种在大规模交易中识别类似规则关系模式的通用技术。这种技术的典型应用是从超市里经常同时购买的商品中发掘成对或成组的商品。

2.4.3 基于概率分析的推荐方法

用概率方法实现协同过滤,最初非常简单的方法是将预测问题看作分类问题,如贝叶斯分类器

2.5 近来实际的方法和系统

2.5.1 Slope One 预测器

思想:基于“热门度差异”,也就是对用户来说物品之间的评分差异。

2.5.2 Google 新闻个性化推荐引擎

主要挑战:

  1. 实时产生列表只允许至多在1秒钟内生成内容;
  2. 由于新物品的连续流入,“物品目录”变化频繁,与此同时其他文章很快就变得过时了。
  3. 还有一个目标:及时反馈用户的交互和要考虑用户最近阅读的文章。

组合使用基于模型和基于记忆的技术:

  • 基于模型:依赖两种聚类技术:概率潜在语义索引(PLSI)和一种新方法MinHash。
  • 基于记忆:为了处理新用户,推荐系统基于记忆的方法分析“伴随浏览量”显得非常重要。

2.6 讨论和小结

协同过滤技术不可能应用于每个领域:例如一个没有购买历史的汽车销售系统,或需要更多用户偏好细节的系统。

协同过滤技术要求用户社区处于某个特定规模,需要足够的用户或评分数据。

2.7 书目注释

第3章 基于内容的推荐

两类信息:

  • 物品特征的描述
  • 描述用户(历史)兴趣的用户记录

挑战点: 如何获取物品主观的定性特征。

关注的算法侧重于推荐文本描述的物品,并能自动“学习”用户记录(基于知识的推荐系统通常是显式询问用户的偏好)。

3.1 内容表示和相似度

描述物品目录最简单的方法就是维护每个物品特征的详细列表(也叫属性集特征集物品记录)。

基于内容推荐系统的一般工作原理是:评估用户还没看到的物品与当前用户过去喜欢的物品的相似程度。

3.1.1 向量空间模型和TF-IDF

TF-IDF是信息检索领域的成熟技术,代表词频反文档频率

  • 词频描述某个词在一篇文档中出现的频繁程度(假设重要的词语出现得更多)。
  • 反文档频率是组合了词频后的第二个衡量值,旨在降低所有文档中几乎都会出现的关键词的权重。

3.1.2 向量空间模型的改进及局限

改进方法:

  • 停用词和词干还原:一种直接的方法是删除所谓的停用词。
  • 精简规模:另一种直接方法是仅用n个信息量最大的词语来减少文档描述的规模,期望删除数据中的“噪声”。
  • 短语:短语比单个词语更能描述文本,用它来替换词有可能进一步提高描述的准确性。

局限:从文本中抽取个别关键词并赋权的方法有另外一个重要的局限,即没有考虑到关键词的上下文,在某些情况下没有正确体现描述的“含义”。

3.2 基于内容相似度检索

协同过滤中物品选择问题:推荐相似用户喜欢的物品

基于内容推荐:推荐与用户过去喜欢的物品相似的物品

推荐系统的任务:基于用户是否喜欢子集没有见过的物品

3.2.1 最近邻

短期记录允许系统提供给用户最近兴趣主题的信息

长期模型,系统会收集一段更长时间的信息,不会通过限定那些在更大的文档集合中已知得到高TF-IDF值的词来识别最有信息量的词语。

组合:

  • 搜寻短期模型中的近邻;如果不存在这样的近邻,则使用长期用户模型
  • 在线获取短期偏好,然后基于长期偏好的信息再对匹配的物品排序

kNN优点:

  • 相对易于实现、可快速适应新近变化等优点。
  • 只要有相对较少的评分数据就能够得到一定的推荐质量

kNN缺点:纯粹kNN方法比其他更复杂的技术的预测精准度要低。

3.2.2 相关性反馈——Rocchio方法

SMART的特点:用户不能只提交给系统基于关键词的查询词,还要反馈检索结果是否相关。

3.3 其他文本分类方法

还有一种确定用户是否对一个文档感兴趣的方法,即将这类问题看做分类任务,分为“喜欢”和“不喜欢”。

3.3.1 基于概率模型的方法

3.3.2 其他线性分类器和机器学习

3.3.3 显式决策模型

另外两种已用于构建基于内容推荐系统的学习技术式决策树和规则归纳法,其独特之处在于训练阶段生成显式的决策模型。

另个主要优势:

  1. 推导出的决策规则可作为生成系统推荐解释的基础
  2. 已有的先验领域知识可以整合到模型中

3.3.4 特征选择

选择文档集中所有词的一个子集分类

3.4 讨论

3.4.1 对比评估

3.4.2 局限

局限性:

  • 浅层内容分析
  • 推荐结果缺乏新颖性:基于学习的方法很快就会倾向给出相同的推荐,会推荐与当前用户已经(正面)评价的物品比较相似的物品。
  • 获取评分:至少需要来自用户的出事评分集合。

3.5 小结

挑战:获取用户偏好和应对新用户。

目前商业领域几乎没有纯粹的基于内容的推荐系统。

3.6 书目注释

基于内容推荐的几种技术来源于信息检索和信息过滤领域。

第4章 基于知识的推荐

4.1 介绍

基于知识的推荐系统:推荐结果不依赖单个用户评分:要么是以用户需求与产品之间相似度的形式,要么是根据明确的推荐规则

基于知识推荐的交互性很强,这个基本性质也是其作为会话式系统的原因。

两种基本类型:

  • 基于约束推荐:在符合推荐规则的所有物品集合中搜索得出要推荐的物品集合。
  • 基于实例推荐:基于实例的系统会根据相似度衡量标准检索那些与特定用户需求(在预定义阈值内)相似的物品。

4.2 知识表示法和推理

基于约束的推荐问题一般可以表示为由约束求解器解决的约束满足问题,或者式通过数据库引擎执行并解决的合取查询形式。

4.2.1 约束

经典的约束满足问题(CSP)可以用一组(V, D, C)描述,其中:

  • V是一组变量
  • D是一组这些变量的有限域
  • C是一组约束条件,描述了这些变量能够同时满足取值的组合情况

变量和约束条件:

  • 用户属性(VC):描述潜在的用户需求
  • 产品属性(VPROD):按照分类描述产品的属性
  • 一致性约束条件(CR):定义了允许范围内的用户属性实例
  • 过滤条件(CF):定义了在哪种条件下应该选择哪种产品
  • 产品约束条件(CPROD):定义了当前有效的产品分类

识别能匹配用户愿望和需求的一组产品的任务称为推荐任务

4.2.2 实例与相似度

基于实例的推荐方法利用相似度检索物品,相似度可以描述物品属性与某些给定用户需求之间的匹配程度。

4.3 与基于约束推荐系统交互

基于知识的会话式推荐系统的一般交互过程如下:

  • 用户指定自己的最初偏好
  • 当收集到了足够有关用户需求和偏好的信息,会提供给用户一组匹配产品
  • 用户可能会修改自己的需求,比如看看其他候选方案,或者减少匹配的产品数量

4.3.1 默认设置

推荐默认值

默认设置可以由以下方法确定:

  • 静态默认设置:在这种情况下,每个用户属性都有这项默认设置。
  • 条件默认设置:在这种情况下,默认设置根据用户潜在需求的不同组合确定。
  • 派生默认设置:利用已有的交互日志自动抽取默认值。

各种方案都可以决定派生的默认设置;其中决定合适默认值的基本方法是1最近邻加权多数投票

选择下一个提问

除了使用默认值帮助用户明确需求之外,交互日志和默认机制也能用于识别用户在推荐过程中可能感兴趣的属性。

4.3.2 处理不满意的需求和空结果集

一种可行的方法是逐渐、自动地放宽推荐问题的限制,直到找到对应的解决方案。

4.3.3 提出对为满足需求的修改建议

4.3.4 对基于物品/效用推荐结果的排序

在基于知识的会话式推荐系统中,物品排序根据的是多属性效用理论(MAUT, multi-attribute utility theory),依据每个物品对用户的效用来评价。每个物品都会根据预先定义好的维度来评价,这些维度一般会集中在物品的基本属性上:

  • 质量经济实惠是数码相机领域需要考虑的维度
  • 有效性风险利润是金融服务领域需要考虑的维度。

确定用户对某个维度的兴趣度由很多方法:

  • 用户定义偏好
  • 基于效用的偏好
  • 联合分析

用户在找不到解决方案时,可以求助于判定结果修改默认值能够给出合理的候选方案,有助于明确需求,其负面作用时滥用默认值操纵用户。基于效用排序有助于在结果页面上对信息单元(比如物品)排序,修改判定结果和修改成分提供的候选方案,以及对推荐物品解释的排序。

4.4 与基于实例的推荐系统交互

4.4.1 评价

评价的基本思想时:用户以当前待审核物品(录入物品推荐物品)未满足的目标来指明他们的修改要求。

  • 物品推荐
  • 物品审核:用户会审核推荐物品(或录入物品),然后要么接受推荐,要么选择另一个评价,这会触发新一轮的评价。

4.4.2 混合评价

允许用户在多个属性上评价能显著提高推荐交互过程的效率,比如可以减少评价周期。

4.4.3 动态评价

动态评价会用到范式,这是推荐物品与候选物品之间差异的通用性描述,这些范式可用于生成混合评价。之所以说评价是动态的,是因为每轮的评价是实时产生的。计算动态评价用到了关联规则挖掘的概念。每轮动态评价由以下几个基本步骤组成:

  • 物品推荐:返回一个推荐物品
  • 识别评价范式:评价范式是当前推荐(录入)物品与候选物品之间差异的一般性描述。
  • 从评价范式中挖掘混合评价
  • 混合评价排序
  • 物品审核

4.4.4 高级的物品推荐方法

4.4.5 评价多样性

4.5 应用实例

4.5.1 VITA——基于约束的推荐系统

4.5.2 Entree——基于实例的推荐系统

4.6 书目注释

第5章 混合推荐方法

5.1 混合推荐的时机

5.1.1 推荐理论框架

推荐问题通常可以转换成效用函数rec,预测物品集合I中的物品i对整个用户集U中某个特定用户u的有用性。

推荐系统RS会输出前n个估计对于给定用户具有最高效用的物品的有序列表。

三种基本的推荐理论框架:

  • 协同过滤:假设人以类聚,大家有着相似的行为,需求和偏好也差不多。协同推荐的任务就是确定相似的对等者,从他们喜欢的物品中得到推荐结果。
  • 基于内容:遵循“以不变应万变”的方法,根据用户过去喜欢的物品推荐相似的物品。
  • 基于知识:会有额外的信息源,即显式的个性化知识。这种知识可以采取逻辑约束的形式,将用户需求映射到物品属性上。多属性的效用机制和特定的相似度标准都可以作为候选知识表示方法。这些知识模型可以从第三方获取,比如领域专家,也可以从过去的交易数据中学习到,或者双管齐下。

推荐算法需要的输入数据:

理论框架 用户记录和上下文参数 群体数据 产品特征 知识模型
协同过滤
基于内容
基于知识

5.1.2 混合设计

三种基本混合设计:

  • 整体式混合设计
  • 并行式混合设计
  • 流水线混合设计

5.2 整体式混合设计

整体式混合设计只包含一个推荐单元,通过预处理和组合多个知识源从而将多种方法整合在一起。实现方法是通过对算法进行内部调整,从而能够利用不同类型的输入数据。一般来说,特定数据的预处理步骤将输入数据转换成某个特定算法需要的格式(特征组合特征补充)。

5.2.1 特征组合的混合方案

特征组合的混合方案:

  • 将协同特征(比如用户的好恶)与物品目录的内容特征组合起来
  • 用到了基于预测准确性和有效性的不同类型的评分反馈

由于特征组合的方法非常简单,目前很多推荐系统都会以这样或那样的方式对协同过滤和(或)基于内容的特征进行组合。然后,还有待人们继续研究的领域是:如何将基于知识方法的输入特征,比如约束条件,与基于内容或协同过滤的知识源组合运用。我们认为,基于评价的系统根据特定物品的约束条件方式抽取用户反馈,比如价格应该低于物品a的价格,可能是未来研究中比较合适的触发点。

5.2.2 特征补充的混合方案

特征补充是另外一种整体式混合设计,用于将多个推荐算法整合在一起。相比较特征组合而言,这种混合设计不是简单地组合并预处理多种类型的输入数据,而是进行了更为复杂的转换。

内容扩充的协同过滤:使用了一个包含了基于内容预测结果的协同机制类预测用户的可能评分。

基于内容的图书推荐系统:将文章间的引用关系作为协同推荐。

5.3 并行式混合设计

并行式混合设计同时用到几个推荐系统,利用一种特殊的混合机制将它们的输出结果整合在一起(如交叉加权切换策略)。

5.3.1 交叉式混合

交叉式混合策略在用户交互界面这个层面上将不同推荐系统的结果组合在一起,各种方法所得到的结果被一起呈现。

5.3.2 加权式混合

加权式混合策略通过计算两个或多个推荐系统结果分数的加权和,将它们组合在一起。

5.3.3 切换式混合

切换式混合需要一个权威者根据用户记录或推荐结果的质量来决定在哪种情况下应用哪种推荐系统。

5.4 流水线混合设计

5.4.1 串联混合

串联混合将一组推荐方法按顺序排列,后面的推荐方法对前面的推荐结果做优化。因此,后面方法的推荐列表就会严格限定在前面方法已经推荐的物品范围内。

由于基于知识推荐方法产生的推荐列表要么是无序的,要么是有很多得分相同的物品,那么将这些推荐结果用另一种方法串联起来进行排序就是一种非常自然的选择。

5.4.2 分级混合

在分级呵呵设计中,一种推荐方法构建的模型被主推荐方法用来生成推荐结果。

  • 通过内容的协同

5.5 讨论和小结

混合设计的分类:

  • 整体式设计:优势在于,如果从特征层面上看,只需要很少有效的额外知识。它们一般只需要一些额外的预处理阶段,或对主要算法及其数据结构做很小的修改。
  • 并行式设计:是对已有实现方法改变最小的设计,因为它们只是做了附加的后处理阶段。尽管如此,它们还是增加了一些额外的运行复杂度,需要认真匹配不同并行算法计算的推荐得分。
  • 流水线式设计:是混合设计中最耗费精力的,因为它需要更深刻地领悟算法的功能,确保运行时的计算是高效的。然而,它一般在两种相互对立的推荐理论框架组合时才会表现得很好,比如协同过滤和基于知识的推荐。

5.6 书目注释

第6章 推荐系统的解释

6.1 介绍

推荐过程中提供解释的主要目的:

  • 透明性:解释能让推荐更加透明,目的时提供给用户信息,使其能够理解用来生成特定推荐的推理过程。
  • 正确性:解释可用于允许用户检查推荐结果的正确性。
  • 可信度:解释的目的就是在推荐中构建信任度,从而减少用户对推荐质量的不确定性。
  • 说服力:推荐系统中说服性解释的目的就是要改变用户的购买行为。
  • 有效性:指如何支持用户做出高质量的决策。
  • 效率:指系统能在多大程度上帮助用户减少决策代价。
  • 满意度:解释可以用来提高使用推荐系统的整体满意度。
  • 关联度:在会话式推荐系统中可能需要一些额外的信息。解释可以用来证明为什么需要从用户那里获取这些额外信息。
  • 可理解性:推荐系统可能永远都弄不清用户知道多少知识。帮助用户将已知的概念与推荐系统用到的概念贯通起来,可以使解释便于理解。
  • 教育:解释能培养用户更好地理解产品领域。

下面几个因素会影响到推荐系统在与接受方沟通时的解释生成:

  • 需要解释的信息项
  • 提供(接受)解释的目的
  • 接受方的模型,包括其行为与知识
  • 沟通的状态,指交换的信息,包括提供的推荐

6.2 基于约束的推荐系统中的解释

基于约束的推荐系统通常可以看做是专家系统的延伸。

6.2.1 实例

6.2.2 通过推到生成解释

6.2.3 可靠解释的分析与概述

6.2.4 可靠解释

6.3 基于实例推荐系统的解释

基于实例推荐系统解决问题的方法是识别出最能匹配用户查询的产品。

6.4 协同过滤推荐系统的解释

相比基于知识的推荐系统而言,协同过滤方法没有显式的推荐知识。协同过滤推荐系统实现解释的一种方法就是,按照人们可以理解的方式描述口口相传的方法式如何作用的。

协同过滤可以高度抽象为三个基本步骤:

  • 用户给用户评分
  • 协同过滤找到有着相似评分(即品味)的用户,称为邻近者。
  • 产品不是由用户评分,而是由用户的邻近者的混合评分决定。

6.5 小结

解释可以用来影响用户的期望和意愿,但同时也是一把双刃剑:

  • 一方面,解释可以帮助用户做出明智的购买决策
  • 另一方面,解释也可能被滥用,将用户推到只对卖方有利的方向上去。

第7章 评估推荐系统