Flink的若干问题思考(一)

一.Flink和spark在处理数据的思想上有什么区别?

1.在Flink的世界观中,一切数据皆是流。离线的数据是有界的流,实时的数据是无界的流。

2.在Spark的世界观中,一切数据皆是批,流是特殊的批。

总结:Flink更底层,需要有更好的编程能力,API发展迅速,未来可期;Spark发展的相对更加完善和成熟,随着Structured Streaming的到来,也弥补了实时性不强的弱点。

二.Flink有哪些特点?

1.事件驱动型:根据event触发计算,状态更新和其他外部操作。类比kafka的消息队列

2.既可以进行流处理也可以进行批处理。

3.API分层:


三.Flink的逻辑架构是什么?

Client:提交,更新和取消 Job 的客户端。

JobManager:应用程序执行的主进程(应用程序含JobGraph,logical dataflow graph,含类,库及其他资源的JAR包)。将JobGraph转化成可并发执行的ExecutionGraph,请求slots资源,分发执行图到TaskManeger并协调checkpoint。

TaskManager:具体的工作进程,包含了一定数量的slots;TaskManager需要注册slots,资源才能被JobManager调用。

四.提交一个Flink任务几种方式?

1.启动yarn-session

./yarn-session.sh  -n 2 -s 2  -jm 1024  -tm 1024  -nm test  -d

2.取消yarn-session任务

yarn application --list (查询application的ID)

yarn application --kill  application_1577588252906_0001

3.直接执行job

./flink run –m yarn-cluster -c com.baidu.wc.WordCount  FlinkTutorial-1.0-SNAPSHOT-jar-with-dependencies.jar  --host lcoalhost  –port 4444

注释:

-n(--container):TaskManager数量。

-s(--slots):  每个TaskManager的slot数量。

-jm:JobManager的内存(单位MB)。

-tm:每个taskmanager的内存(单位MB)。

-nm:yarn 的appName(现在yarn的ui上的名字)。

-d:后台执行


五.如何在linux后台停止一个Flink的job任务?

flink  list  查任务ID

flink cancel 任务ID

六.Flink的图有哪几层?都是在哪个阶段提出来的?

Flink 中的执行图可以分成四层:StreamGraph -> JobGraph ->ExecutionGraph -> 物理执行图。

StreamGraph: 用户根据StreamAPI 编写代码生成的最初的图,用来表示程序的拓扑结构。    

JobGraph:StreamGraph经过优化后生成了JobGraph,提交给 JobManager 的数据结构。主要的优化为,将多个符合条件的节点 chain 在一起作为一个节点,这样可以减少数据在节点之间流动所需要的序列化/反序列化/传输消耗。

ExecutionGraph:JobManager 根据 JobGraph 生成ExecutionGraph。ExecutionGraph是JobGraph的并行化版本,是调度层最核心的数据结构。 

物理执行图:JobManager 根据 ExecutionGraph 对 Job 进行调度后,在各个TaskManager 上部署 Task 后形成的“图”,并不是一个具体的数据结构。    

七.Flink中如何优化shuffle?

将产生shuffle的任务放在同一个slot中 执行,减少IO消耗。


八.Flink中设置的并行度优先等级?

代码中算子设置的并行度>代码中全局设置的并行度>web页面配置参数>conf配置文件中设置

九. 为什么多个task可以合并成一个task?

具有one-to-one操作和并行度相同的相邻算子可以合并task

十.如何判断一个程序中需要多少个slot?

一段程序需要的slot数量一般设置成所有任务中设置的最大并行度数。

©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,539评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,911评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,337评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,723评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,795评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,762评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,742评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,508评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,954评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,247评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,404评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,104评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,736评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,352评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,557评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,371评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,292评论 2 352