所以说读者们才是最优秀的 | 某读者喜提offer(+85%)后的分享

2024-09-06 19:38

本文主要是介绍所以说读者们才是最优秀的 | 某读者喜提offer(+85%)后的分享,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

点击上方蓝色字体,选择“设为星标

回复”资源“获取更多资源

这是小编的一个读者喜提offer后在群里做的分享,文中隐藏了读者的个人隐私信息,小编这里把他的面经分享出来供大家学习。 

群友们看到后都纷纷表示【我酸了,现在我就是个柠檬精系列】。

小编现在也是个柠檬精????????????????????????????????。

小编现在是群里最菜的了

 

  关于如何学习/准备面试的总结

首先说一说本人的情况

本人普通本科,非计算机专业(之前一直对这个耿耿于怀,后来想通了觉得很多从事软件开发的都是非计算机专业,之后的面试直接说我是非计算机专业,这一块的诚实很重要, 也没有必要瞒着,因为公司看中的是你的开发能力,能不能帮公司解决问题)。对于群里的大牛来说,看了之后肯定会笑话我,哈哈,不过我的能力就这么大,每年有进步就很开心。

怎么学习群主的帖子

群主基本每周都会对帖子有更新,我是一个比较细心的人,每天上班去公司要2个小时左右,然后在地铁上的时间都会在看群主的帖子,一是为了拓展见识,二是为了夯实基础知识。对于我公司开发项目有相似的帖子,会进行收藏,之后做好笔记,理解群主说这个技术栈的思路,为什么要这样搞,而不是单单的对里边的理论知识进行记忆,这一点很重要,特别是面试的时候能说出这些东西,都可以让面试官耳目一新。

我记得特别深刻的是群主在kafka和spark那一块的讲解,kafka怎么实现实时性(pagecage页缓存,顺序写磁盘,零复制技术等等),面试官问到这一块的时候,我都有说的很详细,然后面试官都会跟我说:嗯,你的基础能力很扎实。还有spark调优那一块,这个是我的强项。我把自己掌握和实践中用的方法用自己的语言总结了一部分(数据倾斜,内存溢出,开发调优,资源调优,shuffle调优等),每一个点都能够自己总结出一个例子出来,说给面试官听,之后面试官都会给出高度的评价。

注意事项

知识的学习要结合自己简历中的项目和技术架构,不能原封不动的抄袭;公司做的有哪些项目,那么安排上,再从群主的帖子里去找灵感,这一点很重要,你不能拿着没有做过的项目来套这些东西,因为一个项目会牵涉到业务场景,项目背景以及实现中的很多细节,乱编的项目肯定有考虑不到的地方,有一些细节都会被问出来,结果让面试官对你产生了怀疑。基于真实项目的技术架构,吸收帖子里边的一些思想,加上自己的思考,这样进步就会很快。

遇到的面试题

Java基础

JVM优化和多线程必问。

数仓必问

mapreduce的底层原理(shuffle重点);hivesql怎么转化为mapreduce;数据倾斜怎么处理(大表join大表,大小表join,参数调优等等);hive的优化;数仓分层细节,数仓建模;拉链表;缓慢变化维;星型模型和雪花模型区别;数据库三范式;事实表的分类;具体场景写sql。

Spark部分

spark的运行原理;spark数据倾斜;spark内存溢出;spark的调优;spark的rdd算子细节(map,mappartition,groupbykey,reducebykey等等很多,需要自己逐一的梳理);sparksql(sparksql怎么解析、dataframe、dateset);spark的内存模型;spark的shuffle原理,shuffle优化。

kafka部分

kafak负载均衡;kafka数据一致性;kafka的ack机制;kafka的exact once语义;kafka分区策略;kafka分区的目的等等。

zk部分

zk选举机制,zk用到的算法;zk的数据一致性;zk 节点宕机如何处理;负载均衡;zk一些接口。

hbase

读写原理;rowkey设计;热点问题;数据版本;habse的优化。

elasticsearch

es的读写原理;es的倒排索引;es的优化(重点必问);场景下的es提问。

自己的感受

感觉越往高级的面,就会倾向于问你组件调优以及架构方面的知识:如分布式;CAP理论;数据一致性以及知识掌握的全面性,这些部分都是我需要学习的地方,不说了,再说就感觉自己的水平很low了,哈哈。

然后就是写简历的时候不贪多,把每个项目的实现细节都给搞清楚,很容易就面过,基于此我基本每家单位的一面都能过,二面三面的时候一方面看知识的深度,另一方面靠自己的表达能力。最后就是感觉现在好多公司喜欢搞数据中台,数据治理这一块,这一块我在我们公司搞过一点,感觉可能也是一个加分项。

最后弱弱的给小编打个广告,后台回复【知识星球】,可以加到圈子里来。

未来一段时间都在持续更新面试题系列。

一站式大数据解决方案分析与设计实践 | BI无缝整合Apache Kylin

【对线面试官】阿里面试经历,有些人走一步看一步就挂了

一个计算机专业女孩的求学之路—七年之痒,痒之感悟

这篇关于所以说读者们才是最优秀的 | 某读者喜提offer(+85%)后的分享的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1142940

相关文章

Python中你不知道的gzip高级用法分享

《Python中你不知道的gzip高级用法分享》在当今大数据时代,数据存储和传输成本已成为每个开发者必须考虑的问题,Python内置的gzip模块提供了一种简单高效的解决方案,下面小编就来和大家详细讲... 目录前言:为什么数据压缩如此重要1. gzip 模块基础介绍2. 基本压缩与解压缩操作2.1 压缩文

Go语言代码格式化的技巧分享

《Go语言代码格式化的技巧分享》在Go语言的开发过程中,代码格式化是一个看似细微却至关重要的环节,良好的代码格式化不仅能提升代码的可读性,还能促进团队协作,减少因代码风格差异引发的问题,Go在代码格式... 目录一、Go 语言代码格式化的重要性二、Go 语言代码格式化工具:gofmt 与 go fmt(一)

Python虚拟环境与Conda使用指南分享

《Python虚拟环境与Conda使用指南分享》:本文主要介绍Python虚拟环境与Conda使用指南,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、python 虚拟环境概述1.1 什么是虚拟环境1.2 为什么需要虚拟环境二、Python 内置的虚拟环境工具

Python处理大量Excel文件的十个技巧分享

《Python处理大量Excel文件的十个技巧分享》每天被大量Excel文件折磨的你看过来!这是一份Python程序员整理的实用技巧,不说废话,直接上干货,文章通过代码示例讲解的非常详细,需要的朋友可... 目录一、批量读取多个Excel文件二、选择性读取工作表和列三、自动调整格式和样式四、智能数据清洗五、

JDK9到JDK21中值得掌握的29个实用特性分享

《JDK9到JDK21中值得掌握的29个实用特性分享》Java的演进节奏从JDK9开始显著加快,每半年一个新版本的发布节奏为Java带来了大量的新特性,本文整理了29个JDK9到JDK21中值得掌握的... 目录JDK 9 模块化与API增强1. 集合工厂方法:一行代码创建不可变集合2. 私有接口方法:接口

电脑系统Hosts文件原理和应用分享

《电脑系统Hosts文件原理和应用分享》Hosts是一个没有扩展名的系统文件,当用户在浏览器中输入一个需要登录的网址时,系统会首先自动从Hosts文件中寻找对应的IP地址,一旦找到,系统会立即打开对应... Hosts是一个没有扩展名的系统文件,可以用记事本等工具打开,其作用就是将一些常用的网址域名与其对应

SpringBoot请求参数接收控制指南分享

《SpringBoot请求参数接收控制指南分享》:本文主要介绍SpringBoot请求参数接收控制指南,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Spring Boot 请求参数接收控制指南1. 概述2. 有注解时参数接收方式对比3. 无注解时接收参数默认位置

Python通过模块化开发优化代码的技巧分享

《Python通过模块化开发优化代码的技巧分享》模块化开发就是把代码拆成一个个“零件”,该封装封装,该拆分拆分,下面小编就来和大家简单聊聊python如何用模块化开发进行代码优化吧... 目录什么是模块化开发如何拆分代码改进版:拆分成模块让模块更强大:使用 __init__.py你一定会遇到的问题模www.

Python解析器安装指南分享(Mac/Windows/Linux)

《Python解析器安装指南分享(Mac/Windows/Linux)》:本文主要介绍Python解析器安装指南(Mac/Windows/Linux),具有很好的参考价值,希望对大家有所帮助,如有... 目NMNkN录1js. 安装包下载1.1 python 下载官网2.核心安装方式3. MACOS 系统安

Java嵌套for循环优化方案分享

《Java嵌套for循环优化方案分享》介绍了Java中嵌套for循环的优化方法,包括减少循环次数、合并循环、使用更高效的数据结构、并行处理、预处理和缓存、算法优化、尽量减少对象创建以及本地变量优化,通... 目录Java 嵌套 for 循环优化方案1. 减少循环次数2. 合并循环3. 使用更高效的数据结构4