数据分析师如何建立数据分析里最常用的思维定式

2023-10-08 12:50

本文主要是介绍数据分析师如何建立数据分析里最常用的思维定式,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

“ 一套通用、认可的指标字典,将极大提升公司数据层面的效率,降低沟通成本。”

指标字典、指标体系,都是数据分析师很重要的一方面的工作。今天主要分享一下指标字典相关的内容。

在这里插入图片描述

什么是指标字典

我想,下面的场景,很多人应该并不陌生。

“老刘,咱们本月的成交额才100万啊,得继续努力啊!”

“what?这个月明明成交了150万啊,怎么会才100万?你的数据错了吧?”

“不可能啊,我是自己从数据库取得,100万!”

“我也是对过数啊,150万没错啊!”

到底谁错了?

其实俩人谁都没错,一个统计的是下单金额150万,一个统计的是支付金额100万。因此,是数据分析师或者数据PM错了,错在没有推行一套标准指标字典。

什么是指标字典?

简单地说,其实就是把公司常用的一些指标,通过有组织、有秩序的进行整理,形成公司内各个业务部门均统一认同的标准化体系。就像字典一样,对哪个指标有疑问,就去指标字典中查一查,对齐口径。

指标字典和指标体系有很多异同点。相同点,都是指标相关方面的内容。最大的差异点,就是指标字典可以理解为是一维的、打平的,是通过指标(或者维度)为索引进行检索内容;但指标体系是有业务组织的、成体系的,是有逻辑关系的。

在这里插入图片描述

指标字典的价值

指标字典的价值主要有以下几点。

(1)降低沟通成本,提升沟通效率

这个其实通过上面的案例就能体会到。如果公司内部的口径维持一致,说到“成交额”,就是指“下单金额”或者“支付金额”,就不会存在上面的争论了。

另外,也能确保公司战略的准确执行落地,大家按照一套标准、一套口径来,那么将减少很多不必要的麻烦。避免出现老板提的目标,最后落地的结果却换了一套计算方式。

(2)打破信息隔阂,减少公司重复性建设

其实很多指标的开发是需要成本的。比如“跳出率”、“页面停留时长”等等,背后的开发逻辑都比较复杂,计算成本也不低。其实很多指标反映的是很类似的业务内容,如果针对同一个业务内容,开发多个指标,有时候意义其实不大。

更别说有时候A部门开发了这个指标,由于信息隔阂,B部门又重新开发了一遍。但由于细节逻辑的差别,导致看似是同一个指标,但就是数据上有一点点差异。这种情况更让人抓狂。最好就是一个输出口径,不过这涉及了一套标准数仓的过程,后面再讲。

(3)是公司数据化建设的基础、数据平台搭建的基础

像搭建数仓、数据资产管理平台、BI分析平台,甚至是数据中台,都需要用到指标和维度,那就都需要指标字典作为基础。指标字典作为公司最标准、最规范的口径文档,将是这些平台中指标部分的关键性参考。

03

指标字典都包括哪些部分

一套标准的指标字典,其实包括两部分:指标部分和维度部分。这两部分独立开来是字典;叠加起来,能生成覆盖业务日常用的各种指标。

(1)指标部分

先上个例子。以下是百度统计里指标字典的指标(部分):

这里是对外呈现的,因此只简单的包括了两部分:指标名称和指标定义。但作为一个完善的指标字典,除此之外还要有以下的部分。

指标类型:比如基础指标(最最原始的单纯指标,不可以再细分了,比如订单数、订单金额)、复合指标(在基础指标的基础上通过各种运算生成,比如下单率=下单订单数/加购数)。
限定条件:描述指标的限定条件,比如限定用户都是新用户
限定维度:描述用户在查询该指标时,必须限定的维度,例如时间。
(2)维度部分

维度,是分析的角度、拆分方向。

为了便于理解,同样先上例子。还是百度统计。

这些维度,其实也是互联网常用的一些维度。

当指标叠加上维度,就能生成各种符合业务场景的指标了。例如,最常用的就是时间维度了,“近7天成交金额”,“近7天”就是时间维度,“成交金额”就是指标。也可以同时多个维度叠加指标。例如“iPhone近30天下单订单数”。怎么拆分,很清楚吧?

当然,不是所有的维度+指标都有价值,如何生成有价值的维度+指标,是后面指标体系要分享的。

04

如何搭建行之有效的指标字典

上面讲了这么多指标字典的价值,以及指标字典的内容。看似不麻烦啊,只要把指标和维度一梳理,写份文档不就得了?事实上,没有这么容易。

难点在于落地。如果编了一份字典,束之高阁,和没有也没区别。

那如何推进行之有效的指标字典呢?

(1)要贴合业务的应用场景,从业务出发,不能闭门造车

符合业务的应用才是最根本的出发点。比如公司整体关心的都是围绕成交来的,那指标字典的重点也应该是交易相关;业务关心的是服务体验,那指标体系的重点就是服务体验。

(2)要和各个业务部门进行充分沟通,争取达成公司内共识

很多时候,难以推进统一指标字典的原因,在于不同业务都想用对自己有利的计算指标。这就需要平衡。也需要一些自上而下的推动。说服业务按照你的规范来计算业绩、做统计分析,是个难点。

(3)后续维护好指标字典,推进指标字典的应用

维护也很难。因为不断有新的指标、新的需求产生,要在原有的基础上做好更新维护。同时,也要做好培训,让公司整体都用一套标准说话。

文章转载至 大数据网 :http://www.bt187.com/650.html

这篇关于数据分析师如何建立数据分析里最常用的思维定式的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/165402

相关文章

MyBatis-plus处理存储json数据过程

《MyBatis-plus处理存储json数据过程》文章介绍MyBatis-Plus3.4.21处理对象与集合的差异:对象可用内置Handler配合autoResultMap,集合需自定义处理器继承F... 目录1、如果是对象2、如果需要转换的是List集合总结对象和集合分两种情况处理,目前我用的MP的版本

JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法

《JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法》:本文主要介绍JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法,每种方法结合实例代码给大家介绍的非常... 目录引言:为什么"相等"判断如此重要?方法1:使用some()+includes()(适合小数组)方法2

SpringBoot 获取请求参数的常用注解及用法

《SpringBoot获取请求参数的常用注解及用法》SpringBoot通过@RequestParam、@PathVariable等注解支持从HTTP请求中获取参数,涵盖查询、路径、请求体、头、C... 目录SpringBoot 提供了多种注解来方便地从 HTTP 请求中获取参数以下是主要的注解及其用法:1

GSON框架下将百度天气JSON数据转JavaBean

《GSON框架下将百度天气JSON数据转JavaBean》这篇文章主要为大家详细介绍了如何在GSON框架下实现将百度天气JSON数据转JavaBean,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下... 目录前言一、百度天气jsON1、请求参数2、返回参数3、属性映射二、GSON属性映射实战1、类对象映

C# LiteDB处理时间序列数据的高性能解决方案

《C#LiteDB处理时间序列数据的高性能解决方案》LiteDB作为.NET生态下的轻量级嵌入式NoSQL数据库,一直是时间序列处理的优选方案,本文将为大家大家简单介绍一下LiteDB处理时间序列数... 目录为什么选择LiteDB处理时间序列数据第一章:LiteDB时间序列数据模型设计1.1 核心设计原则

Java+AI驱动实现PDF文件数据提取与解析

《Java+AI驱动实现PDF文件数据提取与解析》本文将和大家分享一套基于AI的体检报告智能评估方案,详细介绍从PDF上传、内容提取到AI分析、数据存储的全流程自动化实现方法,感兴趣的可以了解下... 目录一、核心流程:从上传到评估的完整链路二、第一步:解析 PDF,提取体检报告内容1. 引入依赖2. 封装

MySQL中查询和展示LONGBLOB类型数据的技巧总结

《MySQL中查询和展示LONGBLOB类型数据的技巧总结》在MySQL中LONGBLOB是一种二进制大对象(BLOB)数据类型,用于存储大量的二进制数据,:本文主要介绍MySQL中查询和展示LO... 目录前言1. 查询 LONGBLOB 数据的大小2. 查询并展示 LONGBLOB 数据2.1 转换为十

使用SpringBoot+InfluxDB实现高效数据存储与查询

《使用SpringBoot+InfluxDB实现高效数据存储与查询》InfluxDB是一个开源的时间序列数据库,特别适合处理带有时间戳的监控数据、指标数据等,下面详细介绍如何在SpringBoot项目... 目录1、项目介绍2、 InfluxDB 介绍3、Spring Boot 配置 InfluxDB4、I

Java整合Protocol Buffers实现高效数据序列化实践

《Java整合ProtocolBuffers实现高效数据序列化实践》ProtocolBuffers是Google开发的一种语言中立、平台中立、可扩展的结构化数据序列化机制,类似于XML但更小、更快... 目录一、Protocol Buffers简介1.1 什么是Protocol Buffers1.2 Pro

Python实现数据可视化图表生成(适合新手入门)

《Python实现数据可视化图表生成(适合新手入门)》在数据科学和数据分析的新时代,高效、直观的数据可视化工具显得尤为重要,下面:本文主要介绍Python实现数据可视化图表生成的相关资料,文中通过... 目录前言为什么需要数据可视化准备工作基本图表绘制折线图柱状图散点图使用Seaborn创建高级图表箱线图热