【大数据面试题】020 你使用过哪些大数据平台?有什么区别?

2024-03-23 20:04

本文主要是介绍【大数据面试题】020 你使用过哪些大数据平台?有什么区别?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一步一个脚印,一天一道面试题。

因为大数据早已脱离了当初只要搭建 Hadoop 集群就算成功的蛮荒时代。为了各个大数据组件使用方便,国内的大企业都用上了大数据平台,这些平台会集成,图形化管理,升级各类组件。比如你可以图表的形式去了解集群状态,存储使用等。非常方便。然后现在的面试也很多会问有没有使用到公司在用的大数据平台。那这次也就简单说说咱们国内相对常见的大数据平台吧。

Ambari:

简单总结免费的,Apache 开源的大数据平台,2022年1月停止维护
实际使用:Ambari作为一款开源的集群管理工具,在Hadoop生态系统中被广泛应用,并且得到了很多企业和组织的认可和使用。
优点:提供了集中式的管理、监控和诊断功能,易于安装和配置,具有直观的可视化界面和配置工具,使得Hadoop集群的管理更加简单高效。
缺点:出问题,组件升级的时候要去自己排查,比较麻烦,而且已经停止维护了。

Cloudera:

简单总结:付费的,有问题可以找售后,所以也有不少大公司会买来用。
实际使用:Cloudera是一家大数据元老公司,其大数据平台被广泛应用于各种规模的企业,拥有大量的用户和案例。
优点:提供了全面的数据管理、处理和分析解决方案,包括CDH和Cloudera Manager等组件,具有丰富的功能和强大的技术支持,有很好的售后
缺点

阿里云大数据平台:

简单总结:许多互联网企业不好自己搭建集群,就找阿里云来做云集群,云计算。
实际使用:阿里云大数据平台以其稳定性、弹性扩展性和安全性而受到广泛欢迎,在国内外企业中应用广泛。
优点:提供了多种大数据计算和存储服务,如MaxCompute、DataWorks、实时计算等,具有高度的灵活性和可扩展性。
缺点:有些企业考虑数据安全等原因,不喜欢上云。

结合招聘要求,实际用的比较多的大数据平台除了上述 3 个,还有 微软Azure云平台星环大数据平台华为云腾讯云
这篇文章知识有限,多多见谅,有什么意见问题可以评论指出,谢谢。

我是 近未来,祝你变得更强!

这篇关于【大数据面试题】020 你使用过哪些大数据平台?有什么区别?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/839387

相关文章

Java中流式并行操作parallelStream的原理和使用方法

《Java中流式并行操作parallelStream的原理和使用方法》本文详细介绍了Java中的并行流(parallelStream)的原理、正确使用方法以及在实际业务中的应用案例,并指出在使用并行流... 目录Java中流式并行操作parallelStream0. 问题的产生1. 什么是parallelS

Linux join命令的使用及说明

《Linuxjoin命令的使用及说明》`join`命令用于在Linux中按字段将两个文件进行连接,类似于SQL的JOIN,它需要两个文件按用于匹配的字段排序,并且第一个文件的换行符必须是LF,`jo... 目录一. 基本语法二. 数据准备三. 指定文件的连接key四.-a输出指定文件的所有行五.-o指定输出

Linux jq命令的使用解读

《Linuxjq命令的使用解读》jq是一个强大的命令行工具,用于处理JSON数据,它可以用来查看、过滤、修改、格式化JSON数据,通过使用各种选项和过滤器,可以实现复杂的JSON处理任务... 目录一. 简介二. 选项2.1.2.2-c2.3-r2.4-R三. 字段提取3.1 普通字段3.2 数组字段四.

Linux kill正在执行的后台任务 kill进程组使用详解

《Linuxkill正在执行的后台任务kill进程组使用详解》文章介绍了两个脚本的功能和区别,以及执行这些脚本时遇到的进程管理问题,通过查看进程树、使用`kill`命令和`lsof`命令,分析了子... 目录零. 用到的命令一. 待执行的脚本二. 执行含子进程的脚本,并kill2.1 进程查看2.2 遇到的

详解SpringBoot+Ehcache使用示例

《详解SpringBoot+Ehcache使用示例》本文介绍了SpringBoot中配置Ehcache、自定义get/set方式,并实际使用缓存的过程,文中通过示例代码介绍的非常详细,对大家的学习或者... 目录摘要概念内存与磁盘持久化存储:配置灵活性:编码示例引入依赖:配置ehcache.XML文件:配置

Java 虚拟线程的创建与使用深度解析

《Java虚拟线程的创建与使用深度解析》虚拟线程是Java19中以预览特性形式引入,Java21起正式发布的轻量级线程,本文给大家介绍Java虚拟线程的创建与使用,感兴趣的朋友一起看看吧... 目录一、虚拟线程简介1.1 什么是虚拟线程?1.2 为什么需要虚拟线程?二、虚拟线程与平台线程对比代码对比示例:三

k8s按需创建PV和使用PVC详解

《k8s按需创建PV和使用PVC详解》Kubernetes中,PV和PVC用于管理持久存储,StorageClass实现动态PV分配,PVC声明存储需求并绑定PV,通过kubectl验证状态,注意回收... 目录1.按需创建 PV(使用 StorageClass)创建 StorageClass2.创建 PV

Redis 基本数据类型和使用详解

《Redis基本数据类型和使用详解》String是Redis最基本的数据类型,一个键对应一个值,它的功能十分强大,可以存储字符串、整数、浮点数等多种数据格式,本文给大家介绍Redis基本数据类型和... 目录一、Redis 入门介绍二、Redis 的五大基本数据类型2.1 String 类型2.2 Hash

Redis中Hash从使用过程到原理说明

《Redis中Hash从使用过程到原理说明》RedisHash结构用于存储字段-值对,适合对象数据,支持HSET、HGET等命令,采用ziplist或hashtable编码,通过渐进式rehash优化... 目录一、开篇:Hash就像超市的货架二、Hash的基本使用1. 常用命令示例2. Java操作示例三

Linux创建服务使用systemctl管理详解

《Linux创建服务使用systemctl管理详解》文章指导在Linux中创建systemd服务,设置文件权限为所有者读写、其他只读,重新加载配置,启动服务并检查状态,确保服务正常运行,关键步骤包括权... 目录创建服务 /usr/lib/systemd/system/设置服务文件权限:所有者读写js,其他