(37)数仓搭建-DWS 层

2024-01-22 23:08
文章标签 搭建 37 数仓 dws

本文主要是介绍(37)数仓搭建-DWS 层,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

5.1 业务术语
1 )用户
用户以设备为判断标准, 在移动统计中,每个独立设备认为是一个独立用户 Android
系统根据 IMEI 号, IOS 系统根据 OpenUDID 来标识一个独立用户,每部手机一个用户。
2 )新增用户
首次联网使用应用的用户。如果一个用户首次打开某 APP ,那这个用户定义为新增用
户;卸载再安装的设备,不会被算作一次新增。新增用户包括日新增用户、周新增用户、月
新增用户。
3 )活跃用户
打开应用的用户即为活跃用户,不考虑用户的使用情况。每天一台设备打开多次会被计
为一个活跃用户。
4 )周(月)活跃用户
某个自然周(月)内启动过应用的用户,该周(月)内的多次启动只记一个活跃用户。
5 )月活跃率
月活跃用户与截止到该月累计的用户总和之间的比例。
6 )沉默用户
用户仅在安装当天(次日)启动一次,后续时间无再启动行为。该指标可以反映新增用
户质量和用户与 APP 的匹配程度。
7 )版本分布
不同版本的周内各天新增用户数,活跃用户数和启动次数。利于判断 APP 各个版本之
间的优劣和用户行为习惯。
8 )本周回流用户
上周未启动过应用,本周启动了应用的用户。
9 )连续 n 周活跃用户
连续 n 周,每周至少启动一次。
10 )忠诚用户
连续活跃 5 周以上的用户
11 )连续活跃用户
连续 2 周及以上活跃的用户
12 )近期流失用户
连续 n 2<= n <= 4 )周没有启动应用的用户。(第 n+1 周没有启动过)
13 )留存用户
某段时间内的新增用户,经过一段时间后,仍然使用应用的被认作是留存用户;这部分
用户占当时新增用户的比例即是留存率。
例如, 5 月份新增用户 200 ,这 200 人在 6 月份启动过应用的有 100 人, 7 月份启动过
应用的有 80 人,
8 月份启动过应用的有 50 人;则 5 月份新增用户一个月后的留存率是 50%
二个月后的留存率是 40% ,三个月后的留存率是 25%
14 )用户新鲜度
每天启动应用的新老用户比例,即新增用户数占活跃用户数的比例。
15 )单次使用时长
每次启动使用的时间长度。
16 )日使用时长
累计一天内的使用时间长度。
17 )启动次数计算标准
IOS 平台应用退到后台就算一次独立的启动; Android 平台我们规定,两次启动之间的
间隔小于 30 秒,被计算一次启动。用户在使用过程中,若因收发短信或接电话等退出应用
30 秒又再次返回应用中,那这两次行为应该是延续而非独立的,所以可以被算作一次使用
行为,即一次启动。业内大多使用 30 秒这个标准,但用户还是可以自定义此时间间隔。
5.2 系统函数
5.2.1 nvl 函数
1 )基本语法
NVL (表达式 1 ,表达式 2
如果表达式 1 为空值, NVL 返回值为表达式 2 的值,否则返回表达式 1 的值。
该函数的目的是把一个空值( null )转换成一个实际的值。其表达式的值可以是 数字型、
字符型和日期型 但是表达式 1 和表达式 2 的数据类型 必须为同一个类型
2 )案例实操
hive (gmall)> select nvl(1,0);
1
hive (gmall)> select nvl(null,"hello");
hello
5.2.2 日期处理函数
1 date_format 函数(根据格式整理日期)
hive (gmall)> select date_format('2020-06-14','yyyy-MM');
2020-06
2 date_add 函数(加减日期)
hive (gmall)> select date_add('2020-06-14',-1);
2020-06-13
hive (gmall)> select date_add('2020-06-14',1);
2020-06-15
3 next_day 函数
1 )取当前天的下一个周一
hive (gmall)> select next_day('2020-06-14','MO');
2020-06-15
说明:星期一到星期日的英文( Monday Tuesday Wednesday Thursday Friday Saturday Sunday
2 )取当前周的周一
hive (gmall)> select date_add(next_day('2020-06-14','MO'),-7);
2020-06-8
4 last_day 函数(求当月最后一天日期)
hive (gmall)> select last_day('2020-06-14');
2020-06-30
5.2.3 复杂数据类型定义
1 map 结构数据定义
map<string,string>
2 array 结构数据定义
array<string>
3 struct 结构数据定义
struct<id:int,name:string,age:int>
4 struct array 嵌套定义
array<struct<id:int,name:string,age:int>>

这篇关于(37)数仓搭建-DWS 层的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/634531

相关文章

如何使用Haporxy搭建Web群集

《如何使用Haporxy搭建Web群集》Haproxy是目前比较流行的一种群集调度工具,同类群集调度工具有很多如LVS和Nginx,本案例介绍使用Haproxy及Nginx搭建一套Web群集,感兴趣的... 目录一、案例分析1.案例概述2.案例前置知识点2.1 HTTP请求2.2 负载均衡常用调度算法 2.

一文详解如何在idea中快速搭建一个Spring Boot项目

《一文详解如何在idea中快速搭建一个SpringBoot项目》IntelliJIDEA作为Java开发者的‌首选IDE‌,深度集成SpringBoot支持,可一键生成项目骨架、智能配置依赖,这篇文... 目录前言1、创建项目名称2、勾选需要的依赖3、在setting中检查maven4、编写数据源5、开启热

如何搭建并配置HTTPD文件服务及访问权限控制

《如何搭建并配置HTTPD文件服务及访问权限控制》:本文主要介绍如何搭建并配置HTTPD文件服务及访问权限控制的问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、安装HTTPD服务二、HTTPD服务目录结构三、配置修改四、服务启动五、基于用户访问权限控制六、

pytest+allure环境搭建+自动化实践过程

《pytest+allure环境搭建+自动化实践过程》:本文主要介绍pytest+allure环境搭建+自动化实践过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录一、pytest下载安装1.1、安装pytest1.2、检测是否安装成功二、allure下载安装2.

使用vscode搭建pywebview集成vue项目实践

《使用vscode搭建pywebview集成vue项目实践》:本文主要介绍使用vscode搭建pywebview集成vue项目实践,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录环境准备项目源码下载项目说明调试与生成可执行文件核心代码说明总结本节我们使用pythonpywebv

Windows Server 2025 搭建NPS-Radius服务器的步骤

《WindowsServer2025搭建NPS-Radius服务器的步骤》本文主要介绍了通过微软的NPS角色实现一个Radius服务器,身份验证和证书使用微软ADCS、ADDS,具有一定的参考价... 目录简介示意图什么是 802.1X?核心作用802.1X的组成角色工作流程简述802.1X常见应用802.

Spring Cloud GateWay搭建全过程

《SpringCloudGateWay搭建全过程》:本文主要介绍SpringCloudGateWay搭建全过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录Spring Cloud GateWay搭建1.搭建注册中心1.1添加依赖1.2 配置文件及启动类1.3 测

SpringBoot快速搭建TCP服务端和客户端全过程

《SpringBoot快速搭建TCP服务端和客户端全过程》:本文主要介绍SpringBoot快速搭建TCP服务端和客户端全过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录TCPServerTCPClient总结由于工作需要,研究了SpringBoot搭建TCP通信的过程

Gradle下如何搭建SpringCloud分布式环境

《Gradle下如何搭建SpringCloud分布式环境》:本文主要介绍Gradle下如何搭建SpringCloud分布式环境问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录Gradle下搭建SpringCloud分布式环境1.idea配置好gradle2.创建一个空的gr

Linux搭建单机MySQL8.0.26版本的操作方法

《Linux搭建单机MySQL8.0.26版本的操作方法》:本文主要介绍Linux搭建单机MySQL8.0.26版本的操作方法,本文通过图文并茂的形式给大家讲解的非常详细,感兴趣的朋友一起看看吧... 目录概述环境信息数据库服务安装步骤下载前置依赖服务下载方式一:进入官网下载,并上传到宿主机中,适合离线环境