若泽大数据 www.ruozedata.com

ruozedata


  • 主页

  • 归档

  • 分类

  • 标签

  • 发展历史

  • Suche

这是一篇热腾腾的面经

Veröffentlicht am 2018-08-27 | Bearbeitet am 2019-06-11 | in 面试真题 | Aufrufe:

伟梦:
1.主要还是项目?
基本上没问什么技术,我就说了一遍项目流程,
然后说几个优化点,比如上次讲的血案,我也顺带提了一下。
2.在大数据中,有没有什么是不足的,遇到过什么问题?

微盟:
1.SparkStreaming处理完一批次的数据,写偏移量之前挂了,数据怎么保证不重?
2.Maxwell的底层原理?
3.手写Spring?
4.遍历二叉树?
5.用过什么算法?
6.多线程方面,怎么实现一个主线程,等待其他子线程完成后再运行?
7.Maxwell和Cannal的比较?
8.direct比较receiver的优势?
9.原来是把数据传入到Hive,之后改了架构,怎么把Hive的数据导入到Hbase?
10.为什么用Kafka自己存储offset来替代checkpoint,怎么防止了数据双份落地,数据双份是指什么?
11.单例用过吗?

平安:
1.问项目,流程,业务?
2.数据量,增量?
3.几个人开发的,代码量多少?
4.你主要做什么的?
5.什么场景,用SparkSql分析什么东西?

总结:
基本上都是围绕项目来面,第一家问的比较少,而且都是关于项目;微盟的面试官做的项目,
跟简历上的项目,架构上基本一样,所以问的比较深,问我Maxwell的底层原理,对比Cannal有什么优势,
为什么选择它,这个我没回答上来,后来让手写Spring,算法,后来就让我走了;
平安也是基本围绕项目,业务,数据量,没问什么技术,而且我说了关于优化的点(面试官说不要说网上都有的东西)。

ruozedata WeChat Bezahlung
# 大数据面试题
01生产预警平台项目之项目概述
02生产预警平台项目之Flume-1.7.0源码编译导入eclipse

ruozedata

若泽数据优秀博客汇总
155 Artikel
31 Kategorien
74 schlagwörter
RSS
GitHub B站学习视频 腾讯课堂学习视频 官网
|
若泽数据
|