【华为数据之道学习笔记】3-1 基于数据特性的分类管理框架

2023-12-07 06:15

本文主要是介绍【华为数据之道学习笔记】3-1 基于数据特性的分类管理框架,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

        华为根据数据特性及治理方法的不同对数据进行了分类定义:内部数据和外部数据、结构化数据和非结构化数据、元数据。其中,结构化数据又进一步划分为基础数据、主数据、事务数据、报告数据、观测数据和规则数据。
对上述数据分类的定义及特征描述。
分类维度
数据分类名称
定义
特征
举例
按数据主权所属华为内部/外部数据
External Data(外部数据)
华为通过公共领域获取的数据
客观存在,其产生、修改不受我司影响
国际、币种、汇率
从数据存储特性分为结构化和非结构化数据
Internal Data(内部数据)
企业内部经营生产的数据
在企业的业务流程中产生或在业务管理规则中定故意,受企业经营影响
合同、项目、组织
Structured Data
(结构化数据)
可以存储在关系数据库里,用二维表结构来表达实现的数据
1)可以用关系数据库存储
2)先有数据结构,再产生数据
国家、币种、组织、产品、客户
Unstructured Data
(非结构化数据)
形式相对不固定,不方便用数据库二维逻辑表来表现的数据
1)形式多样,无法用关系数据库存储
2)数据量通常较大
网页、图片、视频、音频、XML
Reference Data
(基础数据)
用结构化的语言描述属性,用于分类或目录整编的数据,也称作参考数据
1)通常有一个有限的允许/可选值范围
2)静态数据,非常稳定,可以用作业务/IT的开关、职责/权限的划分或统计报告的维度
合同类型、职位、国家、币种
Master Data
(主数据)
具有高业务价值的,可以在企业内跨流程跨系统被重复使用的数据,具有唯一、准确、权威的数据源
1)通常是业务事件的参与方,可以在企业内跨流程、跨系统重复调用
2)取值不受限于预先定义的数据范围
3)在业务事件发生之前就客观存在,比较稳定
实体型组织、客户、人员基础配置
Transactional Data
(事务数据)
用于记录企业经营过程中产生的业务事件,其实质是主数据之间活动产生的数据
1)有较强的时效性,通常是一次性的
2)事务数据无法脱离主数据独立存在
BOQ、支付指令、主生产计划
Observational Data
(观测数据)
观测者通过观测工具获取观测对象行为/过程的记录数据
1)通常数据量较大
2)数据是过程性的,主要用作监控分析
3)可以由机器自动采集
系统日志、物联网数据、运输过程中国产生的GPS数据
Conditional Data
(规则数据)
结构化描述业务规则变量(一般为决策表、关联关系表、评分卡等形式)的数据,是实现业务规则的核心数据
1)规则数据不可实例化,只以逻辑实体形式存在
2)规则数据的结构在纵向和横向两个维度上相对稳定,变化形式多为内容刷新
3)规则数据的变更对业务活动的影响是大范围的
员工报销遵从性评分规则、出差补助规则
Report Data
(报告数据)
是指对数据进行处理加工后,用作业务决策依据的数据
1)通常需要对数据进行加工处理
2)通常需要将不同来源的数据进行清洗、转换、整合,以便更好地进行分析
3)维度、指标值都可归入报告数据
收入、成本
从描述数据的手段上分类
Meta-data
(元数据)
定义数据的数据,是有关一个企业所使用的物理数据、技术和业务流程、数据规则和约束以及数据的物理与逻辑结构的信息
是描述性标签,描述了数据(如数据库、数据元素、数据模型)、相关概念(如业务流程、应用系统、软件代码、技术架构)以及它们之间的联系(关系)
数据标准、业务术语、指标定义
不同分类的数据,其治理方法有所不同。如基础数据内容的变更通常会对现有流程、IT系统产生影响,因此基础数据的管理重点在于变更管理和统一标准管控。主数据的错误可能会导致成百上千的事务数据错误,因此主数据的管理重点是确保同源多用、重点进行数据内容的校验等。

这篇关于【华为数据之道学习笔记】3-1 基于数据特性的分类管理框架的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/464789

相关文章

MyBatis-Plus通用中等、大量数据分批查询和处理方法

《MyBatis-Plus通用中等、大量数据分批查询和处理方法》文章介绍MyBatis-Plus分页查询处理,通过函数式接口与Lambda表达式实现通用逻辑,方法抽象但功能强大,建议扩展分批处理及流式... 目录函数式接口获取分页数据接口数据处理接口通用逻辑工具类使用方法简单查询自定义查询方法总结函数式接口

SQL中如何添加数据(常见方法及示例)

《SQL中如何添加数据(常见方法及示例)》SQL全称为StructuredQueryLanguage,是一种用于管理关系数据库的标准编程语言,下面给大家介绍SQL中如何添加数据,感兴趣的朋友一起看看吧... 目录在mysql中,有多种方法可以添加数据。以下是一些常见的方法及其示例。1. 使用INSERT I

Python使用vllm处理多模态数据的预处理技巧

《Python使用vllm处理多模态数据的预处理技巧》本文深入探讨了在Python环境下使用vLLM处理多模态数据的预处理技巧,我们将从基础概念出发,详细讲解文本、图像、音频等多模态数据的预处理方法,... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

MySQL 删除数据详解(最新整理)

《MySQL删除数据详解(最新整理)》:本文主要介绍MySQL删除数据的相关知识,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录一、前言二、mysql 中的三种删除方式1.DELETE语句✅ 基本语法: 示例:2.TRUNCATE语句✅ 基本语

从入门到精通C++11 <chrono> 库特性

《从入门到精通C++11<chrono>库特性》chrono库是C++11中一个非常强大和实用的库,它为时间处理提供了丰富的功能和类型安全的接口,通过本文的介绍,我们了解了chrono库的基本概念... 目录一、引言1.1 为什么需要<chrono>库1.2<chrono>库的基本概念二、时间段(Durat

MyBatisPlus如何优化千万级数据的CRUD

《MyBatisPlus如何优化千万级数据的CRUD》最近负责的一个项目,数据库表量级破千万,每次执行CRUD都像走钢丝,稍有不慎就引起数据库报警,本文就结合这个项目的实战经验,聊聊MyBatisPl... 目录背景一、MyBATis Plus 简介二、千万级数据的挑战三、优化 CRUD 的关键策略1. 查

python实现对数据公钥加密与私钥解密

《python实现对数据公钥加密与私钥解密》这篇文章主要为大家详细介绍了如何使用python实现对数据公钥加密与私钥解密,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录公钥私钥的生成使用公钥加密使用私钥解密公钥私钥的生成这一部分,使用python生成公钥与私钥,然后保存在两个文

mysql中的数据目录用法及说明

《mysql中的数据目录用法及说明》:本文主要介绍mysql中的数据目录用法及说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、背景2、版本3、数据目录4、总结1、背景安装mysql之后,在安装目录下会有一个data目录,我们创建的数据库、创建的表、插入的

Spring 框架之Springfox使用详解

《Spring框架之Springfox使用详解》Springfox是Spring框架的API文档工具,集成Swagger规范,自动生成文档并支持多语言/版本,模块化设计便于扩展,但存在版本兼容性、性... 目录核心功能工作原理模块化设计使用示例注意事项优缺点优点缺点总结适用场景建议总结Springfox 是

Navicat数据表的数据添加,删除及使用sql完成数据的添加过程

《Navicat数据表的数据添加,删除及使用sql完成数据的添加过程》:本文主要介绍Navicat数据表的数据添加,删除及使用sql完成数据的添加过程,具有很好的参考价值,希望对大家有所帮助,如有... 目录Navicat数据表数据添加,删除及使用sql完成数据添加选中操作的表则出现如下界面,查看左下角从左