人工智能|推荐系统——工业界的推荐系统之冷启动

2024-05-09 22:28

本文主要是介绍人工智能|推荐系统——工业界的推荐系统之冷启动,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

UGC的物品冷启有哪些

  • ⼩红书上⽤户新发布的笔记。

  • B站上⽤户新上传的视频。

  • 今⽇头条上作者新发布的⽂章。

为什么要特殊对待新笔记?

  • 新笔记缺少与⽤户的交互,导致推荐的难度⼤、效果差。

  • 扶持新发布、低曝光的笔记,可以增强作者发布意愿。

优化冷启的目标

  • 精准推荐:克服冷启的困难,把新笔记推荐给合适的⽤户,不引起⽤户反感。

  • 激励发布:流量向低曝光新笔记倾斜,激励作者发布。

  • 挖掘⾼潜:通过初期⼩流量的试探,找到⾼质量的笔记,给与流量倾斜。

一、评价指标

作者侧指标

  • 发布渗透率、⼈均发布量反映出作者的发布积极性。

  • 冷启的重要优化⽬标是促进发布,增⼤内容池。

  • 新笔记获得的曝光越多,⾸次曝光和交互出现得越早,作者发布积极性越⾼。

⽤户侧指标

内容侧指标

二、冷启召回的困难

  • 缺少⽤户交互,还没学好笔记ID embedding,导致双塔模型效果不好。

  • 缺少⽤户交互,导致ItemCF 不适⽤。

ID embedding替代方案

多个召回池,让新笔记有更多曝光机会。

缺点1:只对刚刚发布的新笔记有效。

  • 取回某类⽬/关键词下最新的k篇笔记。

  • 发布⼏⼩时之后,就再没有机会被召回。

缺点2:弱个性化,不够精准。

三、聚类召回

训练内容相似度模型

四、Look-Alike人群扩散

  • 点击、点赞、收藏、转发——⽤户对笔记可能感兴趣。

  • 把有交互的⽤户作为新笔记的种⼦⽤户。

  • ⽤look-alike在相似⽤户中扩散。

五、物品冷启动:流量调控

工业界的做法

新笔记提权

新笔记保量

动态提权保量

保量的难点

差异化保量

六、冷启的AB测试

冷启的AB测试需要观测作者发布指标和⽤户消费指标。

各种AB测试的⽅案都有缺陷。设计⽅案的时候,问⾃⼰⼏个问题:

  • 实验组、对照组新笔记会不会抢流量?

  • 新笔记、⽼笔记怎么抢流量?

  • 同时隔离笔记、⽤户,会不会让内容池变⼩?

  • 如果对新笔记做保量,会发⽣什么?

用户侧实验

作者侧实验

方案一,缺点:新笔记和⽼笔记抢流量

方案二

  • 优点:新笔记的两个桶不抢流量,作者侧实验结果更可信。

  • 相同:新笔记和⽼笔记抢流量,作者侧AB测试结果与推全结果有些差异。

  • 缺点:新笔记池减⼩⼀半,对⽤户体验造成负⾯影响。

方案三

这篇关于人工智能|推荐系统——工业界的推荐系统之冷启动的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/974677

相关文章

linux系统中java的cacerts的优先级详解

《linux系统中java的cacerts的优先级详解》文章讲解了Java信任库(cacerts)的优先级与管理方式,指出JDK自带的cacerts默认优先级更高,系统级cacerts需手动同步或显式... 目录Java 默认使用哪个?如何检查当前使用的信任库?简要了解Java的信任库总结了解 Java 信

macOS彻底卸载Python的超完整指南(推荐!)

《macOS彻底卸载Python的超完整指南(推荐!)》随着python解释器的不断更新升级和项目开发需要,有时候会需要升级或者降级系统中的python的版本,系统中留存的Pytho版本如果没有卸载干... 目录MACOS 彻底卸载 python 的完整指南重要警告卸载前检查卸载方法(按安装方式)1. 卸载

Oracle数据库在windows系统上重启步骤

《Oracle数据库在windows系统上重启步骤》有时候在服务中重启了oracle之后,数据库并不能正常访问,下面:本文主要介绍Oracle数据库在windows系统上重启的相关资料,文中通过代... oracle数据库在Windows上重启的方法我这里是使用oracle自带的sqlplus工具实现的方

JWT + 拦截器实现无状态登录系统

《JWT+拦截器实现无状态登录系统》JWT(JSONWebToken)提供了一种无状态的解决方案:用户登录后,服务器返回一个Token,后续请求携带该Token即可完成身份验证,无需服务器存储会话... 目录✅ 引言 一、JWT 是什么? 二、技术选型 三、项目结构 四、核心代码实现4.1 添加依赖(pom

基于Python实现自动化邮件发送系统的完整指南

《基于Python实现自动化邮件发送系统的完整指南》在现代软件开发和自动化流程中,邮件通知是一个常见且实用的功能,无论是用于发送报告、告警信息还是用户提醒,通过Python实现自动化的邮件发送功能都能... 目录一、前言:二、项目概述三、配置文件 `.env` 解析四、代码结构解析1. 导入模块2. 加载环

linux系统上安装JDK8全过程

《linux系统上安装JDK8全过程》文章介绍安装JDK的必要性及Linux下JDK8的安装步骤,包括卸载旧版本、下载解压、配置环境变量等,强调开发需JDK,运行可选JRE,现JDK已集成JRE... 目录为什么要安装jdk?1.查看linux系统是否有自带的jdk:2.下载jdk压缩包2.解压3.配置环境

Linux查询服务器系统版本号的多种方法

《Linux查询服务器系统版本号的多种方法》在Linux系统管理和维护工作中,了解当前操作系统的版本信息是最基础也是最重要的操作之一,系统版本不仅关系到软件兼容性、安全更新策略,还直接影响到故障排查和... 目录一、引言:系统版本查询的重要性二、基础命令解析:cat /etc/Centos-release详

更改linux系统的默认Python版本方式

《更改linux系统的默认Python版本方式》通过删除原Python软链接并创建指向python3.6的新链接,可切换系统默认Python版本,需注意版本冲突、环境混乱及维护问题,建议使用pyenv... 目录更改系统的默认python版本软链接软链接的特点创建软链接的命令使用场景注意事项总结更改系统的默

在Linux系统上连接GitHub的方法步骤(适用2025年)

《在Linux系统上连接GitHub的方法步骤(适用2025年)》在2025年,使用Linux系统连接GitHub的推荐方式是通过SSH(SecureShell)协议进行身份验证,这种方式不仅安全,还... 目录步骤一:检查并安装 Git步骤二:生成 SSH 密钥步骤三:将 SSH 公钥添加到 github

Linux系统中查询JDK安装目录的几种常用方法

《Linux系统中查询JDK安装目录的几种常用方法》:本文主要介绍Linux系统中查询JDK安装目录的几种常用方法,方法分别是通过update-alternatives、Java命令、环境变量及目... 目录方法 1:通过update-alternatives查询(推荐)方法 2:检查所有已安装的 JDK方