漏斗分析：你可能低估了它的复杂度（逻辑细节及产品化）

2024-03-04 19:30

文章标签 分析逻辑复杂度细节可能低估产品化漏斗

本文主要是介绍漏斗分析：你可能低估了它的复杂度（逻辑细节及产品化），希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

来源：首席数据科学家

“ 漏斗分析应该是互联网中的最基础的分析了。”

与《RFM分析》《留存分析》《归因分析》《用户路径分析》不同的是，大部分互联网从业者，都听过漏斗分析。但对于漏斗分析的细节，你确定了解吗？漏斗分析可不只是简单的几个递减、转化率哦~下面，和大家一起聊聊具体的逻辑。

01

—

什么是漏斗分析

提到漏斗分析，大家都能想到下图：

从图中我们可以了解到漏斗分析的基础特征：（1）是分多层、多环节的（2）各环节是有转化率（或者流失）效应的（3）环节之间有先后顺序

总结一下，漏斗分析是分析用户从起始到终点环节，过程当中每一步环节的转化（或者流失）情况。通过漏斗，可以找出全链路业务的问题环节所在，从而进行针对性优化。

说到这里，大家可能也都是了解的。但是，如果谈到细节逻辑呢？比如，用户从漏斗中间环节进入，是否要计算？在给定的范围内如果发生了其他未定义的行为，该如何处理？等等。下面咱们来具体聊聊。

02

—

漏斗分析的计算逻辑

这里介绍一下漏斗分析的详细逻辑。

（1）明确时间范围等筛选条件

这是计算漏斗的第一步。

常用的筛选条件主要是时间范围及用户类型。当然，其他的筛选维度（比如设备类别等）理论上也是可以支持的，但时间范围的筛选是漏斗计算必不可少的。是统计近7天的漏斗转化，还是近30天的转化？等等。

确定好时间范围，将时间范围内的数据搂出来，是计算漏斗的首要前提。

（2）确定漏斗的划分阶段及条件

确定好了时间范围，接下来需要确定漏斗的整体阶段划分。

每个漏斗，至少需要包含两个阶段（不然称不上漏斗）。每个阶段，基本设定就是【事件类型】+【筛选条件】。

关于筛选条件，通常来讲都是针对当前阶段进行的限制。但有时多个阶段之间需要进行打通。拿电商的环节举例。有时分析师想看的是浏览、加购且下单了同一个sku的数据（因为有可能有用户浏览了A商品，但是加购下单了B商品，这种情况不是我们想统计的漏斗转化），那这时，在筛选条件这需进行特殊处理，即打通多个阶段之间的关联。

在神策中，是用【属性关联】的概念实现了多个阶段的筛选逻辑处理。

这一个步骤，相当于把用户全量行为中，符合本次漏斗的行为数据筛选出来，以备后续的计算。

（3）关于漏斗的类型

接下来，进入到漏斗流程的计算环节。

假设我们想看的转化流程是A→B→C→D→E。那么如果经过上面几个数据处理之后，有以下几个路径，我们该怎么处理呢？

路径1：A→B→C
路径2：C→D→E
路径3：A→B→D→E
路径4：A→B→X→C→D

在聊上面路径之前，先聊一下漏斗的分类：【封闭式漏斗】和【开放式漏斗】。

所谓封闭式漏斗，就是只有从整体漏斗的第一个阶段进入的路径，才统计在漏斗当中。因此在这种逻辑下，路径2就不会统计在我们漏斗分析中了，因为没有从第一阶段发起。通常情况下，我们进行漏斗分析，都是基于封闭式进行的，这样可以确保看到每个环节的真实转化。

所谓开放式漏斗，就是从整体漏斗中的任意一个环节进入的路径，均计入整体漏斗的统计。这种逻辑下，路径2是会统计到漏斗中的，哪怕是单独的发生一个环节（例如C）也会计入整体。这其实是广义的漏斗概念。但是很多场景下是有这个需求的（回头分享我正在做的针对大促场景项目，正是基于开放式的逻辑）。

因此，在封闭式漏斗下，路径3会处理为在B环节发生了流失；而在开放式漏斗中，路径3 其实是处理成了两个环节：A→B，D→E，然后分别计入到漏斗中。

路径1就不用赘述了，无论是啥类别，都是记为C环节的流失。那路径4呢？请继续看。

（4）两个相邻阶段之间的逻辑

到这里，我们还要关注一下两个相邻阶段之间的逻辑。主要包括其他环节干扰的处理，以及窗口期逻辑。

路径4的关键是两个阶段中间发生了其他的行为环节X。这个需要定义是否纳入计算。在神策中，这种环节是直接剔除的，因此认为路径4完成了漏斗；但是在GA中，进行了更灵活的处理，支持用户决定是否通过。

另外一个，就是决定是否要设置窗口期。所谓窗口期，即完成两个阶段之间的时间间隔。若大于某个阈值，即使符合我们上面的各类条件，也不认为是完成了漏斗转化。

（5）漏斗的统计

最后，就是计算各阶段的用户数量、进而计算一下转化率等，是水到渠成的事了，这里就不赘述了。关键还是上面环节的数据计算，比较复杂。

以上是漏斗分析中的主要计算逻辑。

03

—

产品化实现及行业案例

我们这里主要以Google analysis和神策分析为例，看一下两个典型BI产品中的漏斗分析，是如何设计的。

（1）Google Analysis

GA中的漏斗分析主要有两个：一个是在普通版中的漏斗分析，一个是在GA360（即付费版本）中的自定义漏斗分析。

关于漏斗分析，主要的功能配置项有以下：

谷歌分析的截图，实在是没有了，就有以下的参考图了：

（2）神策分析

神策分析，能调研的内容范围多一些。

首先看一下神策漏斗分析的报告页：

上面针对各个主要模块，进行了标注，就不详细展开了。总体来讲，产品设计的是比较合理的，用户既可以看到漏斗情况，又可以针对每个漏斗环节进行详细分析。

这里针对漏斗的计算逻辑，说一下，神策直接使用了【封闭式漏斗】，没有给用户可选的余地。这是个比较强的逻辑，但也比较通用吧。

下面是创建漏斗的过程：

神策在这里可以设定窗口期，但是针对的是整体漏斗第一步到最后一步的窗口，而不是任意两个阶段之间的。另外，在报告页，时间筛选时，用户可以不使用窗口期。

对于【关联属性】在上文中有截图了，个人觉得这个还是挺好的一个设计。但用户的理解需要一点基础才行。

以上是关于漏斗分析及产品化的一些分享，欢迎大家继续关注~

这篇关于漏斗分析：你可能低估了它的复杂度（逻辑细节及产品化）的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/774206。 23002807@qq.com

相关文章

Nginx分布式部署流程分析

Nginx分布式部署流程分析

《Nginx分布式部署流程分析》文章介绍Nginx在分布式部署中的反向代理和负载均衡作用,用于分发请求、减轻服务器压力及解决session共享问题,涵盖配置方法、策略及Java项目应用,并提及分布式事... 目录分布式部署NginxJava中的代理代理分为正向代理和反向代理正向代理反向代理Nginx应用场景

阅读更多...

Redis中的有序集合zset从使用到原理分析

Redis中的有序集合zset从使用到原理分析

《Redis中的有序集合zset从使用到原理分析》Redis有序集合(zset)是字符串与分值的有序映射,通过跳跃表和哈希表结合实现高效有序性管理,适用于排行榜、延迟队列等场景,其时间复杂度低,内存占... 目录开篇：排行榜背后的秘密一、zset的基本使用1.1 常用命令1.2 Java客户端示例二、zse

阅读更多...

Redis中的AOF原理及分析

Redis中的AOF原理及分析

《Redis中的AOF原理及分析》Redis的AOF通过记录所有写操作命令实现持久化,支持always/everysec/no三种同步策略,重写机制优化文件体积,与RDB结合可平衡数据安全与恢复效率... 目录开篇：从日记本到AOF一、AOF的基本执行流程1. 命令执行与记录2. AOF重写机制二、AOF的

阅读更多...

MyBatis Plus大数据量查询慢原因分析及解决

MyBatis Plus大数据量查询慢原因分析及解决

《MyBatisPlus大数据量查询慢原因分析及解决》大数据量查询慢常因全表扫描、分页不当、索引缺失、内存占用高及ORM开销,优化措施包括分页查询、流式读取、SQL优化、批处理、多数据源、结果集二次... 目录大数据量查询慢的常见原因优化方案高级方案配置调优监控与诊断总结大数据量查询慢的常见原因MyBAT

阅读更多...

分析 Java Stream 的 peek使用实践与副作用处理方案

分析 Java Stream 的 peek使用实践与副作用处理方案

《分析JavaStream的peek使用实践与副作用处理方案》StreamAPI的peek操作是中间操作,用于观察元素但不终止流,其副作用风险包括线程安全、顺序混乱及性能问题,合理使用场景有限... 目录一、peek 操作的本质：有状态的中间操作二、副作用的定义与风险场景1. 并行流下的线程安全问题2. 顺

阅读更多...

MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决

MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决

《MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决》MyBatis默认开启一级缓存,同一事务中循环调用查询方法时会重复使用缓存数据,导致获取的序列主键值均为1,... 目录问题原因解决办法如果是存储过程总结问题myBATis有如下代码获取序列作为主键IdMappe

阅读更多...

Java中最全最基础的IO流概述和简介案例分析

Java中最全最基础的IO流概述和简介案例分析

《Java中最全最基础的IO流概述和简介案例分析》JavaIO流用于程序与外部设备的数据交互,分为字节流（InputStream/OutputStream）和字符流（Reader/Writer）,处理... 目录IO流简介IO是什么应用场景IO流的分类流的超类类型字节文件流应用简介核心API文件输出流应用文

阅读更多...

MySQL设置密码复杂度策略的完整步骤(附代码示例)

MySQL设置密码复杂度策略的完整步骤(附代码示例)

《MySQL设置密码复杂度策略的完整步骤(附代码示例)》MySQL密码策略还可能包括密码复杂度的检查,如是否要求密码包含大写字母、小写字母、数字和特殊字符等,：本文主要介绍MySQL设置密码复杂度... 目录前言1. 使用 validate_password 插件1.1 启用 validate_passwo

阅读更多...

mybatisplus的逻辑删除过程

mybatisplus的逻辑删除过程

《mybatisplus的逻辑删除过程》：本文主要介绍mybatisplus的逻辑删除过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录myBATisplus的逻辑删除1、在配置文件中添加逻辑删除的字段2、在实体类上加上@TableLogic3、业务层正常删除即

阅读更多...

Android 缓存日志Logcat导出与分析最佳实践

Android 缓存日志Logcat导出与分析最佳实践

《Android缓存日志Logcat导出与分析最佳实践》本文全面介绍AndroidLogcat缓存日志的导出与分析方法,涵盖按进程、缓冲区类型及日志级别过滤,自动化工具使用,常见问题解决方案和最佳实... 目录android 缓存日志（Logcat）导出与分析全攻略为什么要导出缓存日志？按需过滤导出1. 按

阅读更多...