那些被问懵的Flink面试题

前言

1 Flink基础(适合初入职场)

  1. 简单介绍一下 Flink
  2. Flink相比传统的Spark Streaming区别?
  3. Flink的组件栈有哪些?
  4. Flink 的运行必须依赖 Hadoop组件吗?
  5. 你们的Flink集群规模多大?
  6. Flink的基础编程模型了解吗?
  7. Flink集群有哪些角色?各自有什么作用?
  8. 说说 Flink 资源管理中 Task Slot 的概念
  9. 说说 Flink 的常用算子?
  10. 说说你知道的Flink分区策略?
  11. Flink的并行度了解吗?Flink的并行度设置是怎样的?
  12. Flink的Slot和parallelism有什么区别?
  13. Flink有没有重启策略?说说有哪几种?
  14. 用过Flink中的分布式缓存吗?如何使用?
  15. 说说Flink中的广播变量,使用时需要注意什么?
  16. 说说Flink中的窗口?
  17. 说说Flink中的状态存储?
  18. Flink中的时间有哪几类
  19. Flink 中水印是什么概念,起到什么作用?
  20. Flink Table & SQL 熟悉吗?TableEnvironment这个类有什么作用
  21. Flink SQL的实现原理是什么?是如何实现 SQL 解析的呢?

2 Flink中级 (适合1~2年开发经验的人)

  1. Flink是如何支持批流一体的?
  2. Flink是如何做到高效的数据交换的?
  3. Flink是如何做容错的?
  4. Flink 分布式快照的原理是什么?
  5. Flink是如何保证Exactly-once语义的?
  6. Flink 的 kafka 连接器有什么特别的地方?
  7. 说说 Flink的内存管理是如何做的?
  8. 说说 Flink的序列化如何做的?
  9. Flink中的Window出现了数据倾斜,你有什么解决办法?
  10. Flink中在使用聚合函数 GroupBy、Distinct、KeyBy 等函数时出现数据热点该如何解决?
  11. Flink任务延迟高,想解决这个问题,你会如何入手?
  12. Flink是如何处理反压的?
  13. Flink的反压和Strom有哪些不同?
  14. Operator Chains(算子链)这个概念你了解吗?
  15. Flink什么情况下才会把Operator chain在一起形成算子链?
  16. 说说Flink1.9的新特性?
  17. 消费kafka数据的时候,如何处理脏数据?

3 Flink高级 (适合3年以上)

  1. Flink Job的提交流程
  2. Flink所谓"三层图"结构是哪几个"图"?
  3. JobManger在集群中扮演了什么角色?
  4. JobManger在集群启动过程中起到什么作用?
  5. TaskManager在集群中扮演了什么角色?
  6. TaskManager在集群启动过程中起到什么作用?
  7. Flink 计算资源的调度是如何实现的?
  8. 简述Flink的数据抽象及数据交换过程?
  9. Flink 中的分布式快照机制是如何实现的?
  10. 简单说说FlinkSQL的是如何实现的?

4 企业面试题(重点)

  1. 应用架构
  2. 压测和监控
  3. 有了Spark还为什么用 Flink
  4. checkpoint 的存储
  5. exactly-once 的保证
  6. 状态机制
  7. 海量 key 去重
  8. checkpoint 与 spark 比较
  9. watermark 机制
  10. exactly-once 如何实现
  11. CEP
  12. 三种时间语义
  13. 数据高峰的处理

小结

          好今天的Flink的题目就分享到这里,背过上面的那些题目害怕面试官提问?信自己,努力和汗水总会能得到回报的。我是大数据老哥,我们下期见~~~

答案获取:https://github.com/lhh2002/Framework-Of-BigData


©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 基础概念考察 一、 简单介绍一下 Flink Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行有...
    Tim在路上阅读 814评论 0 9
  • 基础概念考察 一、 简单介绍一下 Flink Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行有...
    Tim在路上阅读 16,108评论 0 8
  • 概述 2019 年是大数据实时计算领域最不平凡的一年,2019 年 1 月阿里巴巴 Blink (内部的 Flin...
    王知无阅读 3,264评论 2 11
  • 概述 2019 年是大数据实时计算领域最不平凡的一年,2019 年 1 月阿里巴巴 Blink (内部的 Flin...
    Yobhel阅读 1,857评论 0 33
  • 愿读到这篇文章的技术人早日明白并且脱离技术本身,早登彼岸。 一切技术最终只是雕虫小技。 大纲 本系列主题是大数据开...
    yoku酱阅读 417评论 0 1