数智资源网
首页 首页 大数据 查看内容

大数据面试经验分享

木马童年 2020-10-14 12:35 12 0

今天为我们带来分享的是王同学,他总结了自己在面试中遇到的25道最经典的技术面试真题,还分享了一些他在面试时的思想感悟。接下来,让我们一起学习分享吧。 求职感悟 找工作前前后后大概花了一个月的时间,简单 ...

今天为我们带来分享的是王同学,他总结了自己在面试中遇到的25道最经典的技术面试真题,还分享了一些他在面试时的思想感悟。接下来,让我们一起学习分享吧。

求职感悟

找工作前前后后大概花了一个月的时间,简单从3个方面说一下我这段时间的个人感悟吧:

一、要有一个良好的心态

我是一个转行的人,转行到底有多难,懂的人都懂。虽然我和大家一起学习了大半年的时间,但我还是不能确定用人单位到底需要什么样的人才,自己学会的那些只是,能符合企业的需求吗?我有点心虚。

在班级里的好几位同学第一次面试时就拿到了offer之后,我也开始了自己的面试旅程,但很快,我也顺利的拿到了自己的offer。

所以,我觉得面试最重要的就是要有一个良好的心态,要对自己有信心,对自己掌握的知识有信心,那些做过的项目,吃过的苦,都不是白白浪费的。只要把自己最好的一面展现出来,不仅仅是技术能力,也包括精神面貌。

二、技术准备要做好

不用怀疑,海牛学院的技术水平肯定是符合行业标准的,甚至还有富余。主要关键还是在自己,看自己学会了多少。对于技术大可不必担心,只要好好学习,多多练习,在面试前对所学知识加深理解,同时不停地参加面试,积累经验,很快就会越来越熟悉且擅长起来。

在每次面对面试官千奇百怪的问题时,我还是挺尴尬的,但是每次面试过后,我都会去上网找资料,一边面试一边学习,这期间我也是不停的进步的,最终我还是达成了任务。

技术点主要是kafka、hive调优,Spark原理,写hiveSQL,ES的分片、查询、分页等,其中kafka是每个公司必问的技术点,一定要重点关注!数据结构和算法这个,小公司很少问,大中型公司可能会问一些,不会太深,一般是链表、排序算法。

三、其他要点

在HR面试方面,有些话术是需要注意一下的,比如会被问到“为什么离职”,还是必须要给出正面积极的回答的,不能做一个只会抱怨的人。

如果谈到薪资问题的时候,没太大自信或者对公司很期待的话,可以不说的太死,这样后续商量的机会就比较大,也尽量不和技术人员谈工资问题。

个人职业规划一定要准备好,最好是能了解目标公司,尽量契合面试公司的主要核心业务,同时也要尽可能的说出自己为此做了哪些准备。

四、技术面试题

关于这25道技术面试题嘛,都是我总结出来的非常经典的,经常会被问到的题目。答案我觉得还是自己先好好做一遍,然后再去网上找一下吧,或者翻书也行。如果你真的很重视这个面试,那你相信我,自己亲自好好做一遍这些题目,一定会非常有收获的,不要做一个仅仅只会收集答案的人。

1、Kafka直连模式和普通模式的区别

2、spark内部如何实现exactly once

3、Hbase如何避免数据倾斜

4、Kafka消费者是怎么找到指定的topic去消费的?

5、什么是倒排索引,那正排索引呢?

6、Hbase数据量特别大,怎么样提高查询效率?(二级索引)

7、Kafka如何确定分区数量

8、spark的内存模型

9、sparkSQL是如何划分stage的

10、集群配置相关:有多少节点,一天多少数据量,每台机器配置怎么样,总共多少内存和CPU,自己搭建过集群吗

11、由于业务需求变化,hive表的字段需要改变,怎么办

12、Kafka的producer如何在leader挂了情况下保证消息不丢失

13、Kafka的ISR机制

14、spark的原理

15、Kafka生产消息时,leader突然挂掉,而且没有ISR副本,从非ISR副本选举一个成为leader,是不是表示消息丢失了?怎么解决?

16、Kafka重复消费的问题?怎么避免?消费端怎么避免消息丢失?

17、es分页查询,数据量特别大,查询会很慢怎么办(深分页)

18、Kafka消费时,有个消费者突然挂掉,会怎样?partition 会怎样重新分配?

19、ES什么情况下使用查询,什么情况下使用过滤?

20、Kafka的认证你了解吗?

21、hive如何增加map和reduce的数量

22、Java接口怎么写

23、网页的dom和tool解析有什么差别?

24、zookeeper的选举算法?

25、ES写不进去数据了,但可以读;比如磁盘100G,还有20G剩余,这是什么原因

总结

以上就是王同学为我们带来的真实面试经验分享了,你学到了多少?

免责声明:内容来源于公开网络,若涉及侵权联系尽快删除!

数据结构 数据倾斜
0
为您推荐
HIVE数据仓库完美实战课程,资源教程下载

HIVE数据仓库完美实战课程,资源教程下载

课程名称【快速掌握HIVE视频教程】HIVE数据仓库完美实战课程课程目录├第一周:hive基…...

尚硅谷大数据Flink技术与实战,资源教程下载

尚硅谷大数据Flink技术与实战,资源教程下载

课程名称尚硅谷大数据Flink技术与实战课程目录理论_Flink基础 001__Flink理论_Flink…...

廖雪峰-2019大数据分析精品资料价值1980元,资源教程下载

廖雪峰-2019大数据分析精品资料价值1980元,资源教程

课程介绍:廖雪峰大神历时3个月打磨出来的《数据分析必备技能》的视频学习资料,由浅…...

尚硅谷-大数据项目之电商数仓教程下载

尚硅谷-大数据项目之电商数仓教程下载

课程介绍:本课程以国内电商巨头实际业务应用场景为依托,对电商数仓的常见实战指标以…...