推荐系统模型的实时性

2024-06-04 12:18
文章标签 系统 推荐 模型 实时性

本文主要是介绍推荐系统模型的实时性,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

模型的实时性与模型的训练方式紧密相关,模型的实时性由弱到强的训练方式分别是全量更新,增量更新和在线学习。
1.全量更新
模型在某个时间段内所有训练样本进行训练,全量更新是最常用的训练方式
2.增量更新
增量更新仅将新加入的样本“喂”给模型进行增量训练,从技术上讲,深度学习模型往往采用随机梯度下降SGD法及其变种进行学习,缺点是增量更新的模型往往无法找到全局最优点,因此在实际的推荐系统中,经常采用增量更新与全局更新结合的方式,在进行了几轮增量更新后,在业务量较小的时间窗口进行全局更新。
3.在线学习
是进行模型实时更新的主要方法,也就是在获得一个新的样本的同时更新模型,与增量更新一样,在技术上也是使用SGD训练方式实现,但由于需要在线上环境进行模型的训练和大量模型相关参数的更新和存储,工程上的要求比较高。在线学习另一个附带问题是模型的稀疏性不强,例如一个输入特征量达到几百W维的模型中,如果模型的稀疏性好,就可以在模型效果不受影响的前提下,仅让极小一部分的特征权重非0,从而让上线的模型体积很小(摒弃掉所有权重为0的特征),在这方面,兼顾训练效果和模型稀疏性,有大量相关研究,包括微软的FOBOS,谷歌的FTRL等。
在线学习的另一个方向是将强化学习与推荐系统结合,在DRN模型中,应用竞争梯度下降算法等。
4.局部更新
进行模型的局部更新,降低训练效率低的部分的更新频率,提高训练效率高的部分的更新频率,例如Facebook的GBDT+LR模型,GBDT训练效率低,更新周期长,这样Facebook采取每天训练一次GBDT,固定GBDT模型后,实时训练LR模型。模型局部更新的做法较多应用在“Embedding+神经网络”模型中,业界往往采用Embedding层单独预训练和EMbedding层以上的模型部分高频更新的混合策略。
5.客户端模型实时更新
能否在客户端就根据当前用户的行为历史更新模型呢?在推荐系统业界仍处于探索阶段,对于一些计算机视觉的模型,可以通过模型压缩的方式生成轻量级模型,部署于客户端,但对于推荐模型这类重量级模型,需要依赖服务端强大计算资源和丰富的特征数据进行模型服务。但客户端往往可以保存和更新模型一部分的参数和特征,比如当前用户的Embedding向量。这里的逻辑和动机是,模型往往要接受用户Embedding和物品Embedding两个关键的特征向量。对于物品Embedding的更新,一般需要全局的数据,因此只能在服务端进行更新,而对于用户Embedding,更多依赖用户自身的数据,这部分放在客户端,能实时把用户最近的行为数据反应的用的Embedding。例如用户Embedding是由用户点击过的物品Embedding进行平均得到,那么最先得到用户最新点击物品信息的客户端,就可以根据用户点击物品的Embedding实时更新用户Embedding,并保存在该Embedding,在下次推荐时,将更新后的用户Embedding传给服务器,服务器端可根据最新的用户Embedding返回实时推荐内容。

参考《深度学习推荐系统》

这篇关于推荐系统模型的实时性的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1030060

相关文章

Mac系统下卸载JAVA和JDK的步骤

《Mac系统下卸载JAVA和JDK的步骤》JDK是Java语言的软件开发工具包,它提供了开发和运行Java应用程序所需的工具、库和资源,:本文主要介绍Mac系统下卸载JAVA和JDK的相关资料,需... 目录1. 卸载系统自带的 Java 版本检查当前 Java 版本通过命令卸载系统 Java2. 卸载自定

CSS Anchor Positioning重新定义锚点定位的时代来临(最新推荐)

《CSSAnchorPositioning重新定义锚点定位的时代来临(最新推荐)》CSSAnchorPositioning是一项仍在草案中的新特性,由Chrome125开始提供原生支持需... 目录 css Anchor Positioning:重新定义「锚定定位」的时代来了! 什么是 Anchor Pos

Java SWT库详解与安装指南(最新推荐)

《JavaSWT库详解与安装指南(最新推荐)》:本文主要介绍JavaSWT库详解与安装指南,在本章中,我们介绍了如何下载、安装SWTJAR包,并详述了在Eclipse以及命令行环境中配置Java... 目录1. Java SWT类库概述2. SWT与AWT和Swing的区别2.1 历史背景与设计理念2.1.

基于Python实现一个简单的题库与在线考试系统

《基于Python实现一个简单的题库与在线考试系统》在当今信息化教育时代,在线学习与考试系统已成为教育技术领域的重要组成部分,本文就来介绍一下如何使用Python和PyQt5框架开发一个名为白泽题库系... 目录概述功能特点界面展示系统架构设计类结构图Excel题库填写格式模板题库题目填写格式表核心数据结构

Java日期类详解(最新推荐)

《Java日期类详解(最新推荐)》早期版本主要使用java.util.Date、java.util.Calendar等类,Java8及以后引入了新的日期和时间API(JSR310),包含在ja... 目录旧的日期时间API新的日期时间 API(Java 8+)获取时间戳时间计算与其他日期时间类型的转换Dur

Linux系统中的firewall-offline-cmd详解(收藏版)

《Linux系统中的firewall-offline-cmd详解(收藏版)》firewall-offline-cmd是firewalld的一个命令行工具,专门设计用于在没有运行firewalld服务的... 目录主要用途基本语法选项1. 状态管理2. 区域管理3. 服务管理4. 端口管理5. ICMP 阻断

Windows 系统下 Nginx 的配置步骤详解

《Windows系统下Nginx的配置步骤详解》Nginx是一款功能强大的软件,在互联网领域有广泛应用,简单来说,它就像一个聪明的交通指挥员,能让网站运行得更高效、更稳定,:本文主要介绍W... 目录一、为什么要用 Nginx二、Windows 系统下 Nginx 的配置步骤1. 下载 Nginx2. 解压

详解如何使用Python从零开始构建文本统计模型

《详解如何使用Python从零开始构建文本统计模型》在自然语言处理领域,词汇表构建是文本预处理的关键环节,本文通过Python代码实践,演示如何从原始文本中提取多尺度特征,并通过动态调整机制构建更精确... 目录一、项目背景与核心思想二、核心代码解析1. 数据加载与预处理2. 多尺度字符统计3. 统计结果可

如何确定哪些软件是Mac系统自带的? Mac系统内置应用查看技巧

《如何确定哪些软件是Mac系统自带的?Mac系统内置应用查看技巧》如何确定哪些软件是Mac系统自带的?mac系统中有很多自带的应用,想要看看哪些是系统自带,该怎么查看呢?下面我们就来看看Mac系统内... 在MAC电脑上,可以使用以下方法来确定哪些软件是系统自带的:1.应用程序文件夹打开应用程序文件夹

windows系统上如何进行maven安装和配置方式

《windows系统上如何进行maven安装和配置方式》:本文主要介绍windows系统上如何进行maven安装和配置方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不... 目录1. Maven 简介2. maven的下载与安装2.1 下载 Maven2.2 Maven安装2.