滴滴敏捷数据中台实践

2024-06-02 16:48
文章标签 数据 实践 敏捷 滴滴

本文主要是介绍滴滴敏捷数据中台实践,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 

场景描述:滴滴每天处理交通大数据超过4800TB,日均车辆定位数据超过150亿,每日处理路径规划请求400亿次,数据覆盖了交通路况、用户叫车信息、司机驾驶行为、车辆数据等多个维度。滴滴目前对15分钟后供需预测的准确度已经达到了85% 。

关键词:滴滴 数据中台

 

滴滴每天处理交通大数据超过4800TB,日均车辆定位数据超过150亿,每日处理路径规划请求400亿次,数据覆盖了交通路况、用户叫车信息、司机驾驶行为、车辆数据等多个维度。滴滴目前对15分钟后供需预测的准确度已经达到了85% 。

滴滴数据中台发展

业务发展驱动数据进化

滴滴数据中台建设围绕四个方面进行:

  • 业务信息化
  • 信息数据化
  • 数据资产化
  • 资产变现化

并且解决不同的问题。

 

中台数据体系建设的核心难点

产品方面:多场景,全链路的复杂需求

业务方面多团队,多目标的协作需求

 

滴滴精益数据管理体系

滴滴的数据中台从底向上构建了包括数据基础建设,敏捷数据资产,数据治理,数据交付体系。

 

两年来的建设成果:

  • 数据基础设施+系统工具链:开始对外输出
  • 数据文化 150+次改进复盘,周活1700到5000+
  • 敏捷数据治理 DataRank资产分从40到70
  • 精益数据生产D0级事故从非例行任务从10+降为1
  • DataGraph智能数据目录20%员工高频使用
  • 价值交付 NPS从19%到60%

滴滴数据系统构成

数据架构:

 

滴滴的数据架构体系包含了当前大数据领域主流的技术:

离线部分以Hadoop和Hive为主,实时计算部分Flink,Spark

OLAP领域使用了Hbase、Presto和Clickhouse。

智能数据目录

  • 统一的元数据检索能力,
  • 支持Hive、 报表等多种数据实体的统一搜索
  • 基于数据价值或热度的综合排序
  • 业务驱动的数据图谱
  • 众包协作的知识沉淀

 

 

精益数据生产

  • 数据基础质量
  • 稳定性建设
  • 数据上下游联动(全链路 SLA)
  • 埋点管理
  • 数据采集
  • 运维/质量监控
  • 90%复盘率

建立数据委员会,推进业务-运维-数据的 协同机制 一键埋点,用户行为轨迹全记录 数据采集秒级同步,准确性99.999% 数据链路全监控,自动定位关键节点。

如何定位需要的数据

  • 指标口径管理(数据字典)
  • 元数据(数据地图+OneSearch)
  • 资产价值评估体系(DataRank)
  • 数据开放
  • 数据安全规范

指标口径变动100%管控 所有元数据信息一键快速查询 精准评估每一张表的数据影响和价值 数据开放率99.04% 隐私数据全脱敏,完备的权限管控机制, 数据泄露0事故。

更快更简单的使用数据

  • 精细化建设
  • 分级保障
  • 数据图谱与数据中间层
  • 成本优化
  • 数据价值量化

核心数据5点产出(业内普遍7-8点),开发效率提升35% ,指导数据优化方向

标准化数据服务

 

实时数据集成服务

  • 采集集群总规模约300+
  • 数据源约4500+个
  • Agent 数量27000个
  • 峰值摄入数据条数2900w/s
  • 日均查询2千万次
  • 平均响应时间<1S
  • 稳定性99.996%

 

这篇关于滴滴敏捷数据中台实践的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1024529

相关文章

一文教你Python如何快速精准抓取网页数据

《一文教你Python如何快速精准抓取网页数据》这篇文章主要为大家详细介绍了如何利用Python实现快速精准抓取网页数据,文中的示例代码简洁易懂,具有一定的借鉴价值,有需要的小伙伴可以了解下... 目录1. 准备工作2. 基础爬虫实现3. 高级功能扩展3.1 抓取文章详情3.2 保存数据到文件4. 完整示例

使用Java将各种数据写入Excel表格的操作示例

《使用Java将各种数据写入Excel表格的操作示例》在数据处理与管理领域,Excel凭借其强大的功能和广泛的应用,成为了数据存储与展示的重要工具,在Java开发过程中,常常需要将不同类型的数据,本文... 目录前言安装免费Java库1. 写入文本、或数值到 Excel单元格2. 写入数组到 Excel表格

在 Spring Boot 中实现异常处理最佳实践

《在SpringBoot中实现异常处理最佳实践》本文介绍如何在SpringBoot中实现异常处理,涵盖核心概念、实现方法、与先前查询的集成、性能分析、常见问题和最佳实践,感兴趣的朋友一起看看吧... 目录一、Spring Boot 异常处理的背景与核心概念1.1 为什么需要异常处理?1.2 Spring B

python处理带有时区的日期和时间数据

《python处理带有时区的日期和时间数据》这篇文章主要为大家详细介绍了如何在Python中使用pytz库处理时区信息,包括获取当前UTC时间,转换为特定时区等,有需要的小伙伴可以参考一下... 目录时区基本信息python datetime使用timezonepandas处理时区数据知识延展时区基本信息

Qt实现网络数据解析的方法总结

《Qt实现网络数据解析的方法总结》在Qt中解析网络数据通常涉及接收原始字节流,并将其转换为有意义的应用层数据,这篇文章为大家介绍了详细步骤和示例,感兴趣的小伙伴可以了解下... 目录1. 网络数据接收2. 缓冲区管理(处理粘包/拆包)3. 常见数据格式解析3.1 jsON解析3.2 XML解析3.3 自定义

SpringMVC 通过ajax 前后端数据交互的实现方法

《SpringMVC通过ajax前后端数据交互的实现方法》:本文主要介绍SpringMVC通过ajax前后端数据交互的实现方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价... 在前端的开发过程中,经常在html页面通过AJAX进行前后端数据的交互,SpringMVC的controll

Pandas统计每行数据中的空值的方法示例

《Pandas统计每行数据中的空值的方法示例》处理缺失数据(NaN值)是一个非常常见的问题,本文主要介绍了Pandas统计每行数据中的空值的方法示例,具有一定的参考价值,感兴趣的可以了解一下... 目录什么是空值?为什么要统计空值?准备工作创建示例数据统计每行空值数量进一步分析www.chinasem.cn处

如何使用 Python 读取 Excel 数据

《如何使用Python读取Excel数据》:本文主要介绍使用Python读取Excel数据的详细教程,通过pandas和openpyxl,你可以轻松读取Excel文件,并进行各种数据处理操... 目录使用 python 读取 Excel 数据的详细教程1. 安装必要的依赖2. 读取 Excel 文件3. 读

Spring Boot 整合 SSE的高级实践(Server-Sent Events)

《SpringBoot整合SSE的高级实践(Server-SentEvents)》SSE(Server-SentEvents)是一种基于HTTP协议的单向通信机制,允许服务器向浏览器持续发送实... 目录1、简述2、Spring Boot 中的SSE实现2.1 添加依赖2.2 实现后端接口2.3 配置超时时

Spring 请求之传递 JSON 数据的操作方法

《Spring请求之传递JSON数据的操作方法》JSON就是一种数据格式,有自己的格式和语法,使用文本表示一个对象或数组的信息,因此JSON本质是字符串,主要负责在不同的语言中数据传递和交换,这... 目录jsON 概念JSON 语法JSON 的语法JSON 的两种结构JSON 字符串和 Java 对象互转