“啤酒与尿布”:零售业的购物篮分析与推荐系统--替代还是互为补充?

本文主要是介绍“啤酒与尿布”:零售业的购物篮分析与推荐系统--替代还是互为补充?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

啤酒与尿布”故事来源于零售卖场的购物篮分析,其算法出自1993年推出的Apriori算法,在数据分析界,购物篮分析称为Market Basket Analysis(MBA),属于关联分析Assoiceation Analysis的一个分支, 关联分析是数据挖掘的十大明星算法 。

几乎所有的数据分析教科书都喜欢使用“啤酒与尿布”作为案例,进行关联算法解析,因此将“啤酒与尿布”与关联分析进行划等号,某种程度上也说得过去。

近20年来,电商平台业务发展突飞猛进,基于关联分析(有时也称为相关性分析)的推荐系统得到了极大丰富及完善,由此产生了一个说法,即购物篮分析无用论,推荐系统可以完全替代购物篮分析。

对此,我本人有深刻体会,我撰写的新书《啤酒与尿布–神奇的购物篮分析新篇:零售业关联分析与应用 :(“Bear and Diapers”:The Assoiceation Analysis In Retail)》,被众多出版社鄙视,编辑们认为推荐系统已经取代购物篮分析,只要不是介绍大厂的推荐系统,一律退稿。

我认为,购物篮分析与推荐系统并不能相互替代,而是有着不同的应用场景,可以各自发展独特的作用。

我们知道,推荐系统的应用场景是线上电商平台的前端应用,追求在客户浏览页面时时分秒必争,将关联商品快速推荐给客户,形成购物车、促成购买。

购物篮分析是顾客购物完成后,根据购物篮商品组成分析顾客的消费场景,找出其中的商品关联规则,为后续的选品、场景制订、促销、陈列、顾客聚类提供依据。

推荐系统只能应用于线上电商平台,实体门店无法有效使用,即使某些实体店在试图将推荐系统嵌入到app中,效果并不佳。

购物篮分析可以应用于传统实体门店,比如沃尔玛的Retail Link,对于实体店来说,购物篮分析可能是实体店了解顾客需求的唯一途径。

购物篮分析也是电商平台的后端重要分析工具,以亚马逊为例,购物篮分析是重要销售分析工具。

亚马逊是当今国际上最大的电商交易平台,为了更好地服务电商平台上的卖家(供应商与品牌方),亚马逊推出了“亚马逊品牌分析服务(Amazon Brand Analytics Service,简称ABA)“,该服务产品主要面向卖家,可以为卖家提供有价值的经营分析数据,帮助卖家更好的组织市场营销及商品组合策略,其中的购物篮分析(MBA:Market Basket AnAlysis)是ABA的重要分析工具。

亚马逊的ABA与沃尔玛的Retail Link相同之处在于,除了常规的销售分析外,都提供了成熟的购物篮分析工具,值得注意的是,Retail Link与ABA中的购物篮分析中的购物篮分析指标体系、分析页面展现都基本一致。 代表了国际上线下与线上购物篮分析的最高境界、以及二大零售巨头对于购物篮分析实用性的深刻理解。

我会在后续的文章中,详细讲解Retail与ABA中购物篮分析的相关功能及设计思路。

二者不同之处在于,由于数据来源及覆盖面存在很大差异,ABA提供的服务功能更加丰富、强大。

亚马逊的ABA数据来源为电商平台中的顾客浏览、交易(购物篮)等全程轨迹数据。

沃尔玛的Retail Link 数据来源为沃尔玛下属4000家门店POS机交易数据,缺乏详细顾客信息及购买行为数据。

比如在购物篮分析中,Retail Link只能提供商品之间的频繁模式(Frequently bought togther),即哪些商品会经常一起被购买,按照推荐算法的含义,属于基于内容(content-based)的算法范畴。

而亚马逊的ABA 除了可以提供商品之间的关联关系,还可以提供是哪些顾客购买这些商品组合(Customers who bought this Item also bought),即 ABA中的购物篮分析不仅可以基于内容,还有基于顾客行为的协同过滤(collaborative filtering)算法。

除此之外,ABA还可以根据顾客的购买行为轨迹,对顾客的复购模式进行时间序列模式的数据挖掘及利用。

由于掌握了顾客在电商平台的浏览、购物等行为轨迹数据,ABA还可以提供顾客的商品比较与替代购买行为,这是线下的Retail Link所不具备的。

回头看看我们国内零售企业,无论是电商平台、还是实体门店,购物篮分析的应用近乎空白。

以电商平台为例,不管是某东、某宝,购物篮分析只是入门级的Apriori算法应用,只能称为装装样子。

而实体门店的购物篮分析全然是空白!

对比500强的第一、第二名,国内零售企业的购物篮分析空白代表了对于零售认知的缺乏!
在这里插入图片描述

这篇关于“啤酒与尿布”:零售业的购物篮分析与推荐系统--替代还是互为补充?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/177603

相关文章

python panda库从基础到高级操作分析

《pythonpanda库从基础到高级操作分析》本文介绍了Pandas库的核心功能,包括处理结构化数据的Series和DataFrame数据结构,数据读取、清洗、分组聚合、合并、时间序列分析及大数据... 目录1. Pandas 概述2. 基本操作:数据读取与查看3. 索引操作:精准定位数据4. Group

MySQL中EXISTS与IN用法使用与对比分析

《MySQL中EXISTS与IN用法使用与对比分析》在MySQL中,EXISTS和IN都用于子查询中根据另一个查询的结果来过滤主查询的记录,本文将基于工作原理、效率和应用场景进行全面对比... 目录一、基本用法详解1. IN 运算符2. EXISTS 运算符二、EXISTS 与 IN 的选择策略三、性能对比

MySQL 内存使用率常用分析语句

《MySQL内存使用率常用分析语句》用户整理了MySQL内存占用过高的分析方法,涵盖操作系统层确认及数据库层bufferpool、内存模块差值、线程状态、performance_schema性能数据... 目录一、 OS层二、 DB层1. 全局情况2. 内存占js用详情最近连续遇到mysql内存占用过高导致

深度解析Nginx日志分析与499状态码问题解决

《深度解析Nginx日志分析与499状态码问题解决》在Web服务器运维和性能优化过程中,Nginx日志是排查问题的重要依据,本文将围绕Nginx日志分析、499状态码的成因、排查方法及解决方案展开讨论... 目录前言1. Nginx日志基础1.1 Nginx日志存放位置1.2 Nginx日志格式2. 499

Linux系统中查询JDK安装目录的几种常用方法

《Linux系统中查询JDK安装目录的几种常用方法》:本文主要介绍Linux系统中查询JDK安装目录的几种常用方法,方法分别是通过update-alternatives、Java命令、环境变量及目... 目录方法 1:通过update-alternatives查询(推荐)方法 2:检查所有已安装的 JDK方

Linux系统之lvcreate命令使用解读

《Linux系统之lvcreate命令使用解读》lvcreate是LVM中创建逻辑卷的核心命令,支持线性、条带化、RAID、镜像、快照、瘦池和缓存池等多种类型,实现灵活存储资源管理,需注意空间分配、R... 目录lvcreate命令详解一、命令概述二、语法格式三、核心功能四、选项详解五、使用示例1. 创建逻

Olingo分析和实践之EDM 辅助序列化器详解(最佳实践)

《Olingo分析和实践之EDM辅助序列化器详解(最佳实践)》EDM辅助序列化器是ApacheOlingoOData框架中无需完整EDM模型的智能序列化工具,通过运行时类型推断实现灵活数据转换,适用... 目录概念与定义什么是 EDM 辅助序列化器?核心概念设计目标核心特点1. EDM 信息可选2. 智能类

Olingo分析和实践之OData框架核心组件初始化(关键步骤)

《Olingo分析和实践之OData框架核心组件初始化(关键步骤)》ODataSpringBootService通过初始化OData实例和服务元数据,构建框架核心能力与数据模型结构,实现序列化、URI... 目录概述第一步:OData实例创建1.1 OData.newInstance() 详细分析1.1.1

Olingo分析和实践之ODataImpl详细分析(重要方法详解)

《Olingo分析和实践之ODataImpl详细分析(重要方法详解)》ODataImpl.java是ApacheOlingoOData框架的核心工厂类,负责创建序列化器、反序列化器和处理器等组件,... 目录概述主要职责类结构与继承关系核心功能分析1. 序列化器管理2. 反序列化器管理3. 处理器管理重要方

使用Python构建一个高效的日志处理系统

《使用Python构建一个高效的日志处理系统》这篇文章主要为大家详细讲解了如何使用Python开发一个专业的日志分析工具,能够自动化处理、分析和可视化各类日志文件,大幅提升运维效率,需要的可以了解下... 目录环境准备工具功能概述完整代码实现代码深度解析1. 类设计与初始化2. 日志解析核心逻辑3. 文件处