回响科技二面面试题解答

2024-01-30 15:28

本文主要是介绍回响科技二面面试题解答,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

面试题

1、你们的数仓中DWD层为什么要划分数据域?划分数据域之后会对ADS层造成什么影响?是可以提效还是可扩展性强?你们是如何考虑的呢?
2、AZkaban和dolphinScheduler的区别是什么?如果选型会从哪几个方面来考虑呢?
3、数仓中数据的幂等性如何实现?就是如何保证数仓中的数据不丢失和不重复?
4、零点漂移问题如何解决?
5、你们是如何统一指标口径?
6、某电商平台业务线的A运营组比如说提了一个GIV的计算公式,说不包含优惠卷的价格,就是不包含平台成本,平台补贴,B运营组又提了一个需求是GIV要包含平台补贴,这个时候如何去协调和沟通?
7、数据抽取工具分别有哪些优缺点?适用于哪些场景?

回答

1划分数据域,方便对业务环节进行拆解且清晰,能够快速定位找寻,ads 用的是主题域,划分后ads 会依赖跨域数据,如果底层数据域变动会影响ads 指标或标签,所以对于指标提现建议放到dws 做指标沉淀复用且方便找寻,对于ads 数据仍然是依赖但采用大宽表小宽表方法存储,大宽表即核心标签指标存放地方,能给后续ads 做到复用同时也是核心内容直接引用资产,但这样仍然会耦合,耦合点在于如果ads 大宽表不能产出下游也会等待,所以最好办法是对于核心大宽表拆解到2级主题存放

3更多是想问实时数据情况吧,参考kafka ack 与幂等以及Flink exactly once ,这里八股文就不解释了,说下离线的 离线抽取丢数情况还是有的,最简单办法还是扫count 即数据源和ods 如果不匹配则告警,如果是全量可以用表行数波动来判断,增量得和库匹配去写脚本了,至于重复则设置主键唯一dqc

5指标口径拉齐,从整体看与数分沟通,数分负责业务口径审批及对接,数仓负责技术口径审批及维护,对当前指标按照数据 主题域拆解归类生成指标域,指标域也由负责主题同学负责,同时建设指标上下线流程(流程在学习路线元数据指标那节课),并且建设指标中心去维护录入指标

6 核心问题在于指标多个业务方不统一情况,继续接5题的回答,生成指标中心后统一拉业务方负责人一起沟通确定指标业务口径,如后续更改则需要在审批指标时候抄送另外一方业务,让他们有告知,但如果业务方态度强硬可上升leader ,让负责人清楚目前指标状况和达成统一的好处,如果负责人也态度强硬并对自己leader 的leader 举报,则可以再退而求其次 单独开发for 这个部门,但这个口子能不开就不开。

这篇关于回响科技二面面试题解答的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/660681

相关文章

一文解密Python进行监控进程的黑科技

《一文解密Python进行监控进程的黑科技》在计算机系统管理和应用性能优化中,监控进程的CPU、内存和IO使用率是非常重要的任务,下面我们就来讲讲如何Python写一个简单使用的监控进程的工具吧... 目录准备工作监控CPU使用率监控内存使用率监控IO使用率小工具代码整合在计算机系统管理和应用性能优化中,监

荣耀嵌入式面试题及参考答案

在项目中是否有使用过实时操作系统? 在我参与的项目中,有使用过实时操作系统。实时操作系统(RTOS)在对时间要求严格的应用场景中具有重要作用。我曾参与的一个工业自动化控制项目就采用了实时操作系统。在这个项目中,需要对多个传感器的数据进行实时采集和处理,并根据采集到的数据及时控制执行机构的动作。实时操作系统能够提供确定性的响应时间,确保关键任务在规定的时间内完成。 使用实时操作系统的

从戴尔公司中国大饭店DTF大会,看科技外企如何在中国市场发展

【科技明说 | 科技热点关注】 2024戴尔科技峰会在8月如期举行,虽然因事未能抵达现场参加,我只是观看了网上在线直播,也未能采访到DTF现场重要与会者,但是通过数十年对戴尔的跟踪与观察,我觉得2024戴尔科技峰会给业界传递了6大重要信号。不妨简单聊聊:从戴尔公司中国大饭店DTF大会,看科技外企如何在中国市场发展? 1)退出中国的谣言不攻自破。 之前有不良媒体宣扬戴尔将退出中国的谣言,随着2

一些其他面试题

阿里二面:那你来说说定时任务?单机、分布式、调度框架下的定时任务实现是怎么完成的?懵了。。_哔哩哔哩_bilibili 1.定时算法 累加,第二层每一个格子是第一层的总时间400 ms= 20 * 20ms 2.MQ消息丢失 阿里二面:高并发场景下引进消息队列有什么问题?如何保证消息只被消费一次?真是捏了一把汗。。_哔哩哔哩_bilibili 发送消息失败

zookeeper相关面试题

zk的数据同步原理?zk的集群会出现脑裂的问题吗?zk的watch机制实现原理?zk是如何保证一致性的?zk的快速选举leader原理?zk的典型应用场景zk中一个客户端修改了数据之后,其他客户端能够马上获取到最新的数据吗?zk对事物的支持? 1. zk的数据同步原理? zk的数据同步过程中,通过以下三个参数来选择对应的数据同步方式 peerLastZxid:Learner服务器(Follo

java常用面试题-基础知识分享

什么是Java? Java是一种高级编程语言,旨在提供跨平台的解决方案。它是一种面向对象的语言,具有简单、结构化、可移植、可靠、安全等特点。 Java的主要特点是什么? Java的主要特点包括: 简单性:Java的语法相对简单,易于学习和使用。面向对象:Java是一种完全面向对象的语言,支持封装、继承和多态。跨平台性:Java的程序可以在不同的操作系统上运行,称为"Write once,

【Kubernetes】常见面试题汇总(三)

目录 9.简述 Kubernetes 的缺点或当前的不足之处? 10.简述 Kubernetes 相关基础概念? 9.简述 Kubernetes 的缺点或当前的不足之处? Kubernetes 当前存在的缺点(不足)如下: ① 安装过程和配置相对困难复杂; ② 管理服务相对繁琐; ③ 运行和编译需要很多时间; ④ 它比其他替代品更昂贵; ⑤ 对于简单的应用程序来说,可能不

【附答案】C/C++ 最常见50道面试题

文章目录 面试题 1:深入探讨变量的声明与定义的区别面试题 2:编写比较“零值”的`if`语句面试题 3:深入理解`sizeof`与`strlen`的差异面试题 4:解析C与C++中`static`关键字的不同用途面试题 5:比较C语言的`malloc`与C++的`new`面试题 6:实现一个“标准”的`MIN`宏面试题 7:指针是否可以是`volatile`面试题 8:探讨`a`和`&a`

Laravel 面试题

PHP模块 PHP7 和 PHP5 的区别,具体多了哪些新特性? 性能提升了两倍 结合比较运算符 (<=>) 标量类型声明 返回类型声明 try…catch 增加多条件判断,更多 Error 错误可以进行异常处理 匿名类,现在支持通过new class 来实例化一个匿名类,这可以用来替代一些“用后即焚”的完整类定义 …… 了解更多查看文章底部链接 PHP7 新特性 为什么 PHP

【吊打面试官系列-Redis面试题】说说 Redis 哈希槽的概念?

大家好,我是锋哥。今天分享关于 【说说 Redis 哈希槽的概念?】面试题,希望对大家有帮助; 说说 Redis 哈希槽的概念? Redis 集群没有使用一致性 hash,而是引入了哈希槽的概念,Redis 集群有 16384 个哈希槽,每个 key 通过 CRC16 校验后对 16384 取模来决定放置哪个槽, 集群的每个节点负责一部分 hash 槽。