Flink内存模型的思考

背景

从2022-08-07晚上开始该任务触发延时告警,此处省略几十条。

定位问题

该线上Flink提交参数如下,其余参数均是1.0版本的默认值

-D state.backend.incremental=true
--taskManagerMemory=10240

--taskManagerMemory=10240 等价于 taskmanager.memory.process.size=10gb

从上图能够看出数据流入变的特别小(kafka topic流入数据一直是稳定的10MB/s),Flink任务数据延时一直是上升趋势,那么一定是程序遇到了性能瓶颈。

从上图能够看到源kafka topic 每个分区的消息滞后几十万条

从grafana监控并不能定位Flink程序哪个调用栈出现了性能瓶颈,打个火焰图看看,如下图:


从上面的火焰图可以分析该程序大部分时间都是 rocksdb 在进行写数据与压缩数据,由于subtask子任务较多也占用了很多网络资源进行shuffle,由此得出结论rocksdb内存不够导致磁盘的IO增多,网络传输也是一个性能瓶颈点,我们如何在不增加总体内存的背景下增加rocksdb内存以及网络内存?通过以下配置参数调整内存比例:

-D state.backend.rocksdb.memory.fixed-per-slot=1gb
-D taskmanager.memory.network.max=2gb
-D taskmanager.memory.network.fraction=0.2

运行一段时间后发现该任务还是会有数据延迟,继续定位问题发现该任务的主要瓶颈在于window算子的数据倾斜,如下图所示:


数据倾斜问题一直是分布式计算的难点,如果不处理的话一味的 加资源 起不到任何的效果,反而是对资源的浪费。

数据倾斜由于不是本篇文章分享的重点,如何解决数据倾斜放在下一篇文章分享。

疑问

观测线上Flink 1.10任务带来的思考:

  1. 通过 taskmanager.memory.process.size=10gb 该参数设置Container内存为10GB,通过Web UI监控发现tm内存远远达不到10GB到底其他的内存哪里去了呢?
  2. Flink的内存是如何划分的呢?
  3. Flink每一块内存到底有什么作用呢?

Flink内存模型

要想深入了解上面几个问题不得不从Flink的内存模型入手,首先得提一下Flink框架源码所使用的开发语言 Java ,说到 Java 首先会联想到JVM,相比于 JVM 内存控制Flink框架对于内存的管理更加的丰富,并且让开发者更加精细化的控制Flink程序的每个模块内存,首先我们来看下官放给出的Flink内存模型如下图:

Flink内存主要分为两部分:container内存、flink内存,其中内存类型和Spark内存类型一样分为堆内(heap)和堆外(off-heap),各模块内存使用场景及配置参数说明如下:


内存计算公式如下:

  • JVM Metaspace Memory:默认256MB
  • JVM Overhead Memory:默认整个container内存的0.1
    实际计算:1024M 0.1 < 192 M ? 192 M : (1024M 0.1 > 1Gb ? 1Gb : 1024M * 0.1) = 192 M
    因此默认内存为192MB
  • Flink Memory:Container Memory - JVM Metaspace - JVM Overhead
  • Network Memory: Flink Memory * 0.1
  • Manager Memory:Flink Memory * 0.4
  • 堆内内存:Flink Memory - Network Memory - Manager Memory

示例

线上 LBS 任务配置如下:

-D state.backend.rocksdb.memory.fixed-per-slot=1gb
-D state.backend.incremental=true
--taskManagerMemory=10240
-D taskmanager.memory.network.max=2gb
-D taskmanager.memory.network.fraction=0.2
-D taskmanager.numberOfTaskSlots=2

实际内存计算如下:

  1. Flink Memory = 10240 - 256 - 1024 = 8960MB
  2. Network Memory = 8960 * 0.2 = 1792MB
  3. Manager Memory = 8960 * 0.4 = 3584MB
  4. Task Heap Memory = 8960 - 1792 - 3584 - 128 - 128 = 3328MB/3.25GB

每个模块内存如下图:


Flink Web UI如下图:


JVM Heap Memory 实际分配比公式计算出来的结果要多10MB左右,大差不差的能够计算出Flink内存的分布方便开发者根据自身任务的情况调整每一个模块的内存比例以及总体内存。至于差距的这部分内存我也会继续找原因,有知道的大佬评论区可以告诉我哪里计算的有问题。

成果

该任务优化后一直处于较为稳定的状态,再没有收到过延时告警

总结

  1. 该篇文章能够让我们清楚线上Flink问题的定位流程是什么样的
  2. 基于Flink内存模型能够清楚Flink每一块内存的分配
  3. Flink每一块内存的作用。
  4. 加资源并不能解决所有任务的性能问题

参考文章:

火焰图的生成

Flink内存设置的一些分享

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,457评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,837评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,696评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,183评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,057评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,105评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,520评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,211评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,482评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,574评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,353评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,213评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,576评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,897评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,174评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,489评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,683评论 2 335

推荐阅读更多精彩内容