(CDA数据分析师学习笔记)第五章多维数据透视分析二

2024-04-15 10:44

本文主要是介绍(CDA数据分析师学习笔记)第五章多维数据透视分析二,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  1. 主表提供数据范围,在一对多的对应关系下,使用单项筛选器进行汇总计算时,应遵循:“一表出维度字段是附表,多表出度量字段是主表,一表筛选多表”。

一对一:应当是逻辑上的一对一,而非当前数据是一对一。

多对多: 尽量避免。可能出现度量值重复计算的可能。

  1. 一对多(多对一):如果是单项筛选器,当一表筛选多表、一表出维度、多表出度量才能得到正确的结果。双向筛选器时,应尽量一表筛选多表,此时是类型一规则,先将维度字段下相同的维度项按照合并同类项的方式合并到一起,在按照计算规则将不同维度项下对应的所有度量值进行汇总计算,最后得到计算结果。

当多表筛选一表时,此时是类型二规则,先对维度字段下不同维度项进行合并同类项处理,再找出每个维度项下包含的公共字段,然后将每个不同公共字段作为汇总度量字段的维度使用,再按照指定的汇总规则去计算每个不同公共字段信息对应的度量值。类型二规则下,指定的维度字段不直接对度量字段进行筛选,而是找出不同维度下包含的不同公共字段,用这些公共字段对度量值字段进行筛选。

类型二:举例子

区域id是维度字段,产品总销量是度量。据图可知产品id是每个维度下的公共字段。

计算过程:先将每个区域id项包含的不同产品id找到,作为维度,将每一个产品id下对应的度量字段(产品总销量)加总得出最终结果。

总结:尽量使用一对多,且“一表出维度,多表出度量,一表筛选多表”。

  1. 跨表筛选:前提是路径通畅,无论各个表间对应关系如何,都将按照类型二规则进行汇总。

图中5-16无法正常完成筛选,每个销售人员的订单金额都是14000。

  1. 在多表环境下,不相邻的两个表间往往可以形成多条不同的筛选路径,两表间包含多条筛选路径的情况称为交叉连接。但是真正影响筛选结果的往往只有一条,称为有效路径,其他不参与筛选的路径称为无效路径。在powerBI工具中有效路径用实线表示,无效路径用虚线表示。
  2. 出维度字段的是维度表,出度量字段的是事实表,维度字段筛选度量字段,维度表筛选事实表。多表连接环境下,维度表与事实表可以构成3种不同的连接模型,分别是星型、雪花型、星座型。

星型模型:一个事实表与多个维度表连接。

雪花模型:维度表与其他维度表连接再与事实表连接后构成的连接模型。

星座模型:多个事实表与某些维度表连接后构成的连接模型。

这篇关于(CDA数据分析师学习笔记)第五章多维数据透视分析二的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/905598

相关文章

Python实现获取带合并单元格的表格数据

《Python实现获取带合并单元格的表格数据》由于在日常运维中经常出现一些合并单元格的表格,如果要获取数据比较麻烦,所以本文我们就来聊聊如何使用Python实现获取带合并单元格的表格数据吧... 由于在日常运维中经常出现一些合并单元格的表格,如果要获取数据比较麻烦,现将将封装成类,并通过调用list_exc

Mysql数据库中数据的操作CRUD详解

《Mysql数据库中数据的操作CRUD详解》:本文主要介绍Mysql数据库中数据的操作(CRUD),详细描述对Mysql数据库中数据的操作(CRUD),包括插入、修改、删除数据,还有查询数据,包括... 目录一、插入数据(insert)1.插入数据的语法2.注意事项二、修改数据(update)1.语法2.有

SpringBoot实现接口数据加解密的三种实战方案

《SpringBoot实现接口数据加解密的三种实战方案》在金融支付、用户隐私信息传输等场景中,接口数据若以明文传输,极易被中间人攻击窃取,SpringBoot提供了多种优雅的加解密实现方案,本文将从原... 目录一、为什么需要接口数据加解密?二、核心加解密算法选择1. 对称加密(AES)2. 非对称加密(R

基于Go语言实现Base62编码的三种方式以及对比分析

《基于Go语言实现Base62编码的三种方式以及对比分析》Base62编码是一种在字符编码中使用62个字符的编码方式,在计算机科学中,,Go语言是一种静态类型、编译型语言,它由Google开发并开源,... 目录一、标准库现状与解决方案1. 标准库对比表2. 解决方案完整实现代码(含边界处理)二、关键实现细

详解如何在SpringBoot控制器中处理用户数据

《详解如何在SpringBoot控制器中处理用户数据》在SpringBoot应用开发中,控制器(Controller)扮演着至关重要的角色,它负责接收用户请求、处理数据并返回响应,本文将深入浅出地讲解... 目录一、获取请求参数1.1 获取查询参数1.2 获取路径参数二、处理表单提交2.1 处理表单数据三、

重新对Java的类加载器的学习方式

《重新对Java的类加载器的学习方式》:本文主要介绍重新对Java的类加载器的学习方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、介绍1.1、简介1.2、符号引用和直接引用1、符号引用2、直接引用3、符号转直接的过程2、加载流程3、类加载的分类3.1、显示

PostgreSQL 序列(Sequence) 与 Oracle 序列对比差异分析

《PostgreSQL序列(Sequence)与Oracle序列对比差异分析》PostgreSQL和Oracle都提供了序列(Sequence)功能,但在实现细节和使用方式上存在一些重要差异,... 目录PostgreSQL 序列(Sequence) 与 oracle 序列对比一 基本语法对比1.1 创建序

Spring Validation中9个数据校验工具使用指南

《SpringValidation中9个数据校验工具使用指南》SpringValidation作为Spring生态系统的重要组成部分,提供了一套强大而灵活的数据校验机制,本文给大家介绍了Spring... 目录1. Bean Validation基础注解常用注解示例在控制器中应用2. 自定义约束验证器定义自

C#实现高性能Excel百万数据导出优化实战指南

《C#实现高性能Excel百万数据导出优化实战指南》在日常工作中,Excel数据导出是一个常见的需求,然而,当数据量较大时,性能和内存问题往往会成为限制导出效率的瓶颈,下面我们看看C#如何结合EPPl... 目录一、技术方案核心对比二、各方案选型建议三、性能对比数据四、核心代码实现1. MiniExcel

SQL常用操作精华之复制表、跨库查询、删除重复数据

《SQL常用操作精华之复制表、跨库查询、删除重复数据》:本文主要介绍SQL常用操作精华之复制表、跨库查询、删除重复数据,这些SQL操作涵盖了数据库开发中最常用的技术点,包括表操作、数据查询、数据管... 目录SQL常用操作精华总结表结构与数据操作高级查询技巧SQL常用操作精华总结表结构与数据操作复制表结