《The YouTube video recommendation system》是一篇详细介绍YouTube视频推荐的论文,在整个系统中没有复杂的算法,使用了一些简单有效的策略,这也符合工业界的应用,在工业界,为了考虑算法复杂度,数据量,可维护性等等一些因素,在工业界中,通常会选择一些简单有效的方法。


以下是论文的核心内容:

目标

帮助用户找到高质量且符合用户兴趣的视频,最终实现的是Top-N推荐。

总的思想

利用用户的互动行为数据,推荐与互动过视频相似的视频。

相似视频的挖掘

1、概念

相似视频指的是:当给定视频推荐系统——(论文阅读笔记)YouTube的视频推荐系统_ci后,用户更有可能观看的视频组成的集合推荐系统——(论文阅读笔记)YouTube的视频推荐系统_ci_02,公式如下所示:

推荐系统——(论文阅读笔记)YouTube的视频推荐系统_ci_03

其中:

  • 推荐系统——(论文阅读笔记)YouTube的视频推荐系统_ide_04:种子视频
  • 推荐系统——(论文阅读笔记)YouTube的视频推荐系统_推荐_05:与视频推荐系统——(论文阅读笔记)YouTube的视频推荐系统_ide_04相似的视频的集合

2、方法

关联规则(Association Rule)

计算与给定的种子视频一起被观看的概率,概率越大,相似性越高。

3、相似性的计算

计算的方法:

推荐系统——(论文阅读笔记)YouTube的视频推荐系统_视频推荐_07

其中,推荐系统——(论文阅读笔记)YouTube的视频推荐系统_推荐_08称为正则化函数,通常可以取为:推荐系统——(论文阅读笔记)YouTube的视频推荐系统_视频推荐_09

计算出所有的与视频推荐系统——(论文阅读笔记)YouTube的视频推荐系统_ci相似的视频,根据相似性的值推荐系统——(论文阅读笔记)YouTube的视频推荐系统_推荐_11从候选集推荐系统——(论文阅读笔记)YouTube的视频推荐系统_ci_02中找到Top-N的相似视频。

推荐系统——(论文阅读笔记)YouTube的视频推荐系统_视频推荐_13可以表示成一个有向图,其中,权重为推荐系统——(论文阅读笔记)YouTube的视频推荐系统_推荐_11,如下所示:

推荐系统——(论文阅读笔记)YouTube的视频推荐系统_推荐_15

生成推荐的候选

1、一级

假设种子集合为推荐系统——(论文阅读笔记)YouTube的视频推荐系统_多级_16,由上述的相似性的方法挖掘出一些候选:

推荐系统——(论文阅读笔记)YouTube的视频推荐系统_ide_17

推荐系统——(论文阅读笔记)YouTube的视频推荐系统_推荐_18

这样的方法容易产生narrow recommendations,即推荐的视频与种子视频相似度极高,这对推荐来说不能满足多样性的要求。

2、二级

以一级产生的候选推荐系统——(论文阅读笔记)YouTube的视频推荐系统_ide_19作为种子,产生推荐系统——(论文阅读笔记)YouTube的视频推荐系统_ci_20

推荐系统——(论文阅读笔记)YouTube的视频推荐系统_视频推荐_21

推荐系统——(论文阅读笔记)YouTube的视频推荐系统_ide_22

3、多级

上述的结论推广至多级,形成最终的推荐结果为:

推荐系统——(论文阅读笔记)YouTube的视频推荐系统_ide_23

Ranking

ranking的指标主要有:

  • 视频质量
  • 用户特性

其他

  • 评价的方法:线上A/B Test
  • 评价的指标:CTR

参考文献

  • Davidson J, Liebald B, Liu J, et al. The YouTube video recommendation system[C]//Proceedings of the fourth ACM conference on Recommender systems. ACM, 2010: 293-296.


阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6