“啤酒与尿布”:零售业的购物篮分析与推荐系统--替代还是互为补充?

本文主要是介绍“啤酒与尿布”:零售业的购物篮分析与推荐系统--替代还是互为补充?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

啤酒与尿布”故事来源于零售卖场的购物篮分析,其算法出自1993年推出的Apriori算法,在数据分析界,购物篮分析称为Market Basket Analysis(MBA),属于关联分析Assoiceation Analysis的一个分支, 关联分析是数据挖掘的十大明星算法 。

几乎所有的数据分析教科书都喜欢使用“啤酒与尿布”作为案例,进行关联算法解析,因此将“啤酒与尿布”与关联分析进行划等号,某种程度上也说得过去。

近20年来,电商平台业务发展突飞猛进,基于关联分析(有时也称为相关性分析)的推荐系统得到了极大丰富及完善,由此产生了一个说法,即购物篮分析无用论,推荐系统可以完全替代购物篮分析。

对此,我本人有深刻体会,我撰写的新书《啤酒与尿布–神奇的购物篮分析新篇:零售业关联分析与应用 :(“Bear and Diapers”:The Assoiceation Analysis In Retail)》,被众多出版社鄙视,编辑们认为推荐系统已经取代购物篮分析,只要不是介绍大厂的推荐系统,一律退稿。

我认为,购物篮分析与推荐系统并不能相互替代,而是有着不同的应用场景,可以各自发展独特的作用。

我们知道,推荐系统的应用场景是线上电商平台的前端应用,追求在客户浏览页面时时分秒必争,将关联商品快速推荐给客户,形成购物车、促成购买。

购物篮分析是顾客购物完成后,根据购物篮商品组成分析顾客的消费场景,找出其中的商品关联规则,为后续的选品、场景制订、促销、陈列、顾客聚类提供依据。

推荐系统只能应用于线上电商平台,实体门店无法有效使用,即使某些实体店在试图将推荐系统嵌入到app中,效果并不佳。

购物篮分析可以应用于传统实体门店,比如沃尔玛的Retail Link,对于实体店来说,购物篮分析可能是实体店了解顾客需求的唯一途径。

购物篮分析也是电商平台的后端重要分析工具,以亚马逊为例,购物篮分析是重要销售分析工具。

亚马逊是当今国际上最大的电商交易平台,为了更好地服务电商平台上的卖家(供应商与品牌方),亚马逊推出了“亚马逊品牌分析服务(Amazon Brand Analytics Service,简称ABA)“,该服务产品主要面向卖家,可以为卖家提供有价值的经营分析数据,帮助卖家更好的组织市场营销及商品组合策略,其中的购物篮分析(MBA:Market Basket AnAlysis)是ABA的重要分析工具。

亚马逊的ABA与沃尔玛的Retail Link相同之处在于,除了常规的销售分析外,都提供了成熟的购物篮分析工具,值得注意的是,Retail Link与ABA中的购物篮分析中的购物篮分析指标体系、分析页面展现都基本一致。 代表了国际上线下与线上购物篮分析的最高境界、以及二大零售巨头对于购物篮分析实用性的深刻理解。

我会在后续的文章中,详细讲解Retail与ABA中购物篮分析的相关功能及设计思路。

二者不同之处在于,由于数据来源及覆盖面存在很大差异,ABA提供的服务功能更加丰富、强大。

亚马逊的ABA数据来源为电商平台中的顾客浏览、交易(购物篮)等全程轨迹数据。

沃尔玛的Retail Link 数据来源为沃尔玛下属4000家门店POS机交易数据,缺乏详细顾客信息及购买行为数据。

比如在购物篮分析中,Retail Link只能提供商品之间的频繁模式(Frequently bought togther),即哪些商品会经常一起被购买,按照推荐算法的含义,属于基于内容(content-based)的算法范畴。

而亚马逊的ABA 除了可以提供商品之间的关联关系,还可以提供是哪些顾客购买这些商品组合(Customers who bought this Item also bought),即 ABA中的购物篮分析不仅可以基于内容,还有基于顾客行为的协同过滤(collaborative filtering)算法。

除此之外,ABA还可以根据顾客的购买行为轨迹,对顾客的复购模式进行时间序列模式的数据挖掘及利用。

由于掌握了顾客在电商平台的浏览、购物等行为轨迹数据,ABA还可以提供顾客的商品比较与替代购买行为,这是线下的Retail Link所不具备的。

回头看看我们国内零售企业,无论是电商平台、还是实体门店,购物篮分析的应用近乎空白。

以电商平台为例,不管是某东、某宝,购物篮分析只是入门级的Apriori算法应用,只能称为装装样子。

而实体门店的购物篮分析全然是空白!

对比500强的第一、第二名,国内零售企业的购物篮分析空白代表了对于零售认知的缺乏!
在这里插入图片描述

这篇关于“啤酒与尿布”:零售业的购物篮分析与推荐系统--替代还是互为补充?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/177603

相关文章

Nginx分布式部署流程分析

《Nginx分布式部署流程分析》文章介绍Nginx在分布式部署中的反向代理和负载均衡作用,用于分发请求、减轻服务器压力及解决session共享问题,涵盖配置方法、策略及Java项目应用,并提及分布式事... 目录分布式部署NginxJava中的代理代理分为正向代理和反向代理正向代理反向代理Nginx应用场景

Redis中的有序集合zset从使用到原理分析

《Redis中的有序集合zset从使用到原理分析》Redis有序集合(zset)是字符串与分值的有序映射,通过跳跃表和哈希表结合实现高效有序性管理,适用于排行榜、延迟队列等场景,其时间复杂度低,内存占... 目录开篇:排行榜背后的秘密一、zset的基本使用1.1 常用命令1.2 Java客户端示例二、zse

Redis中的AOF原理及分析

《Redis中的AOF原理及分析》Redis的AOF通过记录所有写操作命令实现持久化,支持always/everysec/no三种同步策略,重写机制优化文件体积,与RDB结合可平衡数据安全与恢复效率... 目录开篇:从日记本到AOF一、AOF的基本执行流程1. 命令执行与记录2. AOF重写机制二、AOF的

linux系统中java的cacerts的优先级详解

《linux系统中java的cacerts的优先级详解》文章讲解了Java信任库(cacerts)的优先级与管理方式,指出JDK自带的cacerts默认优先级更高,系统级cacerts需手动同步或显式... 目录Java 默认使用哪个?如何检查当前使用的信任库?简要了解Java的信任库总结了解 Java 信

MyBatis Plus大数据量查询慢原因分析及解决

《MyBatisPlus大数据量查询慢原因分析及解决》大数据量查询慢常因全表扫描、分页不当、索引缺失、内存占用高及ORM开销,优化措施包括分页查询、流式读取、SQL优化、批处理、多数据源、结果集二次... 目录大数据量查询慢的常见原因优化方案高级方案配置调优监控与诊断总结大数据量查询慢的常见原因MyBAT

分析 Java Stream 的 peek使用实践与副作用处理方案

《分析JavaStream的peek使用实践与副作用处理方案》StreamAPI的peek操作是中间操作,用于观察元素但不终止流,其副作用风险包括线程安全、顺序混乱及性能问题,合理使用场景有限... 目录一、peek 操作的本质:有状态的中间操作二、副作用的定义与风险场景1. 并行流下的线程安全问题2. 顺

macOS彻底卸载Python的超完整指南(推荐!)

《macOS彻底卸载Python的超完整指南(推荐!)》随着python解释器的不断更新升级和项目开发需要,有时候会需要升级或者降级系统中的python的版本,系统中留存的Pytho版本如果没有卸载干... 目录MACOS 彻底卸载 python 的完整指南重要警告卸载前检查卸载方法(按安装方式)1. 卸载

MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决

《MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决》MyBatis默认开启一级缓存,同一事务中循环调用查询方法时会重复使用缓存数据,导致获取的序列主键值均为1,... 目录问题原因解决办法如果是存储过程总结问题myBATis有如下代码获取序列作为主键IdMappe

Oracle数据库在windows系统上重启步骤

《Oracle数据库在windows系统上重启步骤》有时候在服务中重启了oracle之后,数据库并不能正常访问,下面:本文主要介绍Oracle数据库在windows系统上重启的相关资料,文中通过代... oracle数据库在Windows上重启的方法我这里是使用oracle自带的sqlplus工具实现的方

Java中最全最基础的IO流概述和简介案例分析

《Java中最全最基础的IO流概述和简介案例分析》JavaIO流用于程序与外部设备的数据交互,分为字节流(InputStream/OutputStream)和字符流(Reader/Writer),处理... 目录IO流简介IO是什么应用场景IO流的分类流的超类类型字节文件流应用简介核心API文件输出流应用文