阿里巴巴倡导的数据中台,到底是什么东东

2023-12-05 17:18

本文主要是介绍阿里巴巴倡导的数据中台,到底是什么东东,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

几年前,数据中台的概念就开始在互联网企业里面流行,现在已经普及的差不多了。数据中台的概念由阿里提出,是为了应对像双十一这样的业务高峰、应对大规模数据的线性可扩展问题、应对复杂业务系统的解耦问题,而在技术、组织架构等方面采取的一些变革,其本质上还是一个平台,阿里称之为“共享服务平台(Shared Platform as Service,SPAS)”。

阿里巴巴倡导的数据中台,到底是什么东东

 

SPAS采用的是基于面向服务的架构SOA理念的 “去中心化”的服务架构,所有的服务都是以“点对点”的方式进行交互。阿里之所以选择“去中心化”的分布式服务架构,主要是考虑到扩展性。毕竟互联网公司的用户群体是整个互联网公众,首先要解决的就是系统的扩展性问题。因为一旦有更多的用户访问,平台若不能扩展,可能给平台带来灾难性的后果。

一、阿里的双中台架构

阿里数据业务双中台:主要由数据中台业务中台并肩构成了双中台,并肩扛起了所有前台业务。

阿里巴巴倡导的数据中台,到底是什么东东

 

  1. 业务中台:实现了后端业务资源到前台易用能力的转化。
  2. 数据中台:从后台及业务中台将数据流入,完成海量数据的存储、计算、产品化包装过程,构成企业的核心数据能力。

业务中台与数据中台,相辅相成,互相支撑,一起构建起了战场强大的后方炮火群。

二、为什么需要中台

在中台之前,早已经有了前台和后台的概念。前台是由各个应用组成的前端系统平台。前端系统直接触达用户,通过前台,企业与最终用户直接进行信息交互。例如,企业搭建的电子商务网站、门户网站、手机APP、微信公众号等都属于前台。后台是由各个业务管理系统组成的后端平台。每个后台业务系统管理了企业的一块业务,例如,财务系统、产品系统、客户管理系统、仓库物流管理系统等。基础设施、存储和计算平台作为企业的核心计算资源,也属于后台的一部分。

阿里巴巴倡导的数据中台,到底是什么东东

 

大多数企业的后台建设是为了满足各个业务管理的需求,所以多被称作管理信息系统。后台系统是为了解决企业管理的效率问题,并不是为了服务于前台。这类系统或是当年花大价钱外购,需要每年支付大量的服务费,并且版本老旧,定制化困难;又或是是花大价钱自建,年久失修,一身的补丁,同样变更困难;而且各个系统之间彼此相对独立,形成了一个一个“烟囱”,信息很难流通,即使系统间有集成,也只是两两系统之间做了接口,尽管有些企业建了数据中心和数据仓库,也仅仅是个集中存放数据的大数据库,形成了一个更大的“信息孤岛”。

所以,企业后台往往并不能很好地支撑前台快速创新响应用户的需求,而中台要解决的才是前台的创新问题。

三、中台能更好的支撑前台创新

中台连接了前台用户与后台核心资源,既可以将早已臃肿不堪的前台系统中的稳定通用业务能力“沉降”到中台层,为前台减肥,实施“大中台,小前台”战略,恢复前台的响应力,前台可以快速生成各种微应用;又可以将后台系统中需要频繁变化或是需要被前台直接使用的业务能力“提取”到中台层,赋予这些业务能力更强的灵活度和更低的变更成本,从而为前台提供更强大的“能力炮火”⽀援。

阿里巴巴倡导的数据中台,到底是什么东东

 

四、数据中台如何提供服务

数据中台提供三类服务:依赖接口的服务、依赖工具的服务和依赖数据的服务。在这三种服务中,笔者重点关注的是依赖于数据的服务,数据中台具有大数据分析能力,并将该能力通过接口服务等方式对外提供。这一点是数据中台与数仓的最大区别,数仓对外直接提供规整的数据分析能力,一般由BI工具或者大数据挖掘工具负责,而数据中台直接将数据封装成服务,以API等方式对外输出。数据中台原则上只提供通用的服务接口,个性化在业务层实现,简化上层业务使用,提升对业务需求的响应效率。

五、数据中台的本质

数据中台最核心的是OneData体系。这个体系实质上是一个数据管理体系,包括全局数据仓库规划、数据规范定义、数据建模研发、数据连接萃取、数据运维监控、数据资产管理工具等。为了帮助您理解数据仓库和数据中台的区别,我们把两者做个对比,先看一下数据仓库架构。

阿里巴巴倡导的数据中台,到底是什么东东

 

数据仓库是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合,出于分析性报告和决策支持目的而创建。

数据中台是一个数据集成平台,它不仅仅是为数据分析挖掘而建,它更重要的功能是作为各个业务的数据源,为业务系统提供数据和计算服务。数据中台的本质就是“数据仓库+数据服务中间件”。

中台构建这种服务时是考虑到可复用性的,每个服务就像一块积木,可以随意组合,非常灵活,有些个性化的需求在前台解决,这样就避免了重复建设,既省时、省力,又省钱。

六、如何创建数据中台

如何打通企业数据并以统一的标准进行建设,达到技术降本、应用提效、业务赋能的目标,将会成为众多企业面临的问题,而数据中台模式正是为解决该问题而生。全域数据采集与引入、标准规范数据架构与研发、连接与深度萃取数据价值、统一数据资产管理、统一主题式服务、赋能业务并闭环迭代,是数据中台建设的核心六个方面。

阿里巴巴倡导的数据中台,到底是什么东东

 

围绕“规划、治理、整合、共享”四步,将企业海量、多维的数据资产盘点、整合、分析、确保整个公司数据一致性和可复用性,为前台提供数据资产、数据定制创新、数据监测与数据分析等服务,最终实现数据资产的价值最大化。

这篇关于阿里巴巴倡导的数据中台,到底是什么东东的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/458435

相关文章

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

C#使用iText获取PDF的trailer数据的代码示例

《C#使用iText获取PDF的trailer数据的代码示例》开发程序debug的时候,看到了PDF有个trailer数据,挺有意思,于是考虑用代码把它读出来,那么就用到我们常用的iText框架了,所... 目录引言iText 核心概念C# 代码示例步骤 1: 确保已安装 iText步骤 2: C# 代码程

Pandas处理缺失数据的方式汇总

《Pandas处理缺失数据的方式汇总》许多教程中的数据与现实世界中的数据有很大不同,现实世界中的数据很少是干净且同质的,本文我们将讨论处理缺失数据的一些常规注意事项,了解Pandas如何表示缺失数据,... 目录缺失数据约定的权衡Pandas 中的缺失数据None 作为哨兵值NaN:缺失的数值数据Panda

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

python库pydantic数据验证和设置管理库的用途

《python库pydantic数据验证和设置管理库的用途》pydantic是一个用于数据验证和设置管理的Python库,它主要利用Python类型注解来定义数据模型的结构和验证规则,本文给大家介绍p... 目录主要特点和用途:Field数值验证参数总结pydantic 是一个让你能够 confidentl

JAVA实现亿级千万级数据顺序导出的示例代码

《JAVA实现亿级千万级数据顺序导出的示例代码》本文主要介绍了JAVA实现亿级千万级数据顺序导出的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 前提:主要考虑控制内存占用空间,避免出现同时导出,导致主程序OOM问题。实现思路:A.启用线程池

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性

C#实现千万数据秒级导入的代码

《C#实现千万数据秒级导入的代码》在实际开发中excel导入很常见,现代社会中很容易遇到大数据处理业务,所以本文我就给大家分享一下千万数据秒级导入怎么实现,文中有详细的代码示例供大家参考,需要的朋友可... 目录前言一、数据存储二、处理逻辑优化前代码处理逻辑优化后的代码总结前言在实际开发中excel导入很

MyBatis-plus处理存储json数据过程

《MyBatis-plus处理存储json数据过程》文章介绍MyBatis-Plus3.4.21处理对象与集合的差异:对象可用内置Handler配合autoResultMap,集合需自定义处理器继承F... 目录1、如果是对象2、如果需要转换的是List集合总结对象和集合分两种情况处理,目前我用的MP的版本