30个常见的大数据面试题推荐，赶紧带回家

2024-11-22 09:09:43 • bianchengjichu • 阅读 185

经历了水深火热的大数据学习，终于拨开云雾见天明了，但你离成功总是还差了一步，那就是拿到大数据工程师的Offer。

在电脑旁奋斗了无数个日夜，代码敲了无数遍，项目整改了无数遍，只为了得到一份自己满意的高薪资高待遇的Offer。但这个收获不仅仅需要你学到娴熟的大数据技术，还需要在面试之前精心准备，了解自己要应聘的企业发展状况、自己应聘岗位的技术要求等等，除此之外，多看一些大数据面试题也是很有必要的，给自己涨涨经验。

1.scala语言有什么特点，什么是函数式编程？有什么优点

2.scala伴生对象有什么作用

3.scala并发编程是怎么弄得，你对actor模型怎么理解有何优点

4.Spark如何处理结构化数据，Spark如何处理非结构话数据？

5.Spark性能优化主要有哪些手段？

6.对于Spark你觉得他对于现有大数据的现状的优势和劣势在哪里？

7.对于算法是否进行过自主的研究设计？

8.简要描述你了解的一些数据挖掘算法与内容

9.怎么用spark做数据清洗

10.跟我聊聊spark的应用，商场里广告投放，以及黄牛检测

11.spark读取数据，是几个Partition呢？hdfs几个block就有几个Partition？

12.Mogodb和hbase的区别

13.开发中遇到的问题

14.HIVE的优化

15.linux的启动顺序

16.编译好的scala程序，运行时还需要scala环境吗

17.WriteajavaprogramtoimplementStackinjava.

18.Linkedlist和ArrayList的区别

19.hadoop中combiner的作用

20.用mr设计一个分组排重计数算法

21.用MapReduce找出存在公共好友的两个人

22.hdfs存储机制

23.MapReduce原理

24.hadoop运行原理

25.hadoop的namenode宕机,怎么解决

26.Hbase的特性,以及你怎么去设计rowkey和columnFamily,怎么去建一个table

27.Redis,传统数据库,hbase,hive每个之间的区别(问的非常细)

28.说下对hadoop的一些理解,包括哪些组件

29.详细讲解下你流式实时计算的项目部署以及收集的结果情况

30.实时流式计算框架,几个人,多长时间,细节问题,包括讲flume,kafka,storm的各个的组件组成,你负责那一块,如果需要你搭建你可以完成么?

30个常见的大数据面试题推荐，赶紧带回家

相关推荐

友情链接