node label

导读

实际的环境部署中，经常会出现不同的机器类型，比如有些机器是计算型的，有些则是内存型；另一种场景是在大集群中，有时候需要指定有些机器预留给特定的用户用，从而避免其它用户的任务对其造成影响；node label节点标签就是解决这类问题的一种好的方式。运维人员可以根据节点的特性将其分为不同的分区来满足业务多维度的使用需求。

特性

一个Node Manager节点只能属于一个label，如果一个资源节点没有配置label，则其属于一个不存在的DEFAULT分区;
label一共有两种模式:exclusive和non-exclusive，non-exclusive的资源节点同时归属于DEFAULT分区，当用户申请DEFAULT分区的资源时，non-exclusive上的资源也能分配给改应用；
用户可以为每个队列配置可以访问的分区，默认是只可以访问DEFAULT分区；
可以设置每个队列访问特定分区的资源比率；
node label以及队列和node label的相关配置支持动态更新；

配置

默认情况下系统时没有开启node label标签功能的，可以在yarn-site.xml中修改下列配置来开启label特性。

Property	Value
yarn.node-labels.fs-store.root-dir	hdfs://namenode:port/path/to/store/node-labels/
yarn.node-labels.enabled	true

操作说明

查询label: yarn cluster -lnl
添加label: yarn rmadmin -addToClusterNodeLabels [label1,label2,label3] (label splitted by ",")
删除label: yarn rmadmin -removeFromClusterNodeLabels [label1,label2,label3] (label splitted by ",")
添加节点标签:yarn rmadmin -replaceLabelsOnNode [node1[:port]=label1,label2 node2[:port]=label1,label2]
查询节点列表: yarn node -list -all
查询单个节点状态: yarn node -state <nodeId>

CapacityScheduler的label特性

配置参数

Property	Value
yarn.scheduler.capacity.<queue-path>.capacity	设置队列的容量大小
yarn.scheduler.capacity.<queue-path>.accessible-node-labels	队列可以访问的label列表,如"spark,flink",通过逗号分隔，另外队列均可以访问没有标签的node;默认继承父队列的accessible labels；如果只允许访问无标签的node，配置为一个空格
yarn.scheduler.capacity.<queue-path>.accessible-node-labels.<label>.capacity	队列对某个label的容量设置，对于同一个label属于同一个父队列下面的capacity总和必须为100
yarn.scheduler.capacity.<queue-path>.accessible-node-labels.<label>.maximum-capacity	队列对某个label资源的最大访问容量，默认是100
yarn.scheduler.capacity.<queue-path>.default-node-label-expression	队列默认的访问label，如果请求中未设置label，则设置为该值；默认为空，表现允许访问无label的节点

配置实例

<property>
<name>yarn.scheduler.capacity.root.queues</name>
<value>engineering,marketing</value>
</property>

<property>
<name>yarn.scheduler.capacity.root.engineering.capacity</name>
<value>50</value>
</property>

<property>
<name>yarn.scheduler.capacity.root.marketing.capacity</name>
<value>50</value>
</property>

<property>
<name>yarn.scheduler.capacity.root.engineering.accessible-node-labels</name>
<value>GPU</value>
</property>

<property>
<name>yarn.scheduler.capacity.root.marketing.accessible-node-labels</name>
<value>GPU</value>
</property>

<property>
<name>yarn.scheduler.capacity.root.engineering.default-node-label-expression</name>
<value>GPU</value>
</property>

<property>
<name>yarn.scheduler.capacity.root.engineering.accessible-node-labels.GPU.capacity</name>
<value>50</value>
</property>

<property>
<name>yarn.scheduler.capacity.root.marketing.accessible-node-labels.GPU.capacity</name>
<value>50</value>
</property>

<property>
<name>yarn.scheduler.capacity.root.engineering.default-node-label-expression</name>
<value>GPU</value>
</property>

提交应用指定label
ApplicationSubmissionContext.setNodeLabelExpression(..)指定应用所有container的node label.
ResourceRequest.setNodeLabelExpression(..)设置某个具体的ResourceRequest的label信息
setAMContainerResourceRequest.setNodeLabelExpression设置am请求的node label

FairScheduler Label

当前FairScheduler暂时还不支持node label特性，具体请查看YARN-2497，当前我们自己先基于hadoop-2.7.2版本支持了label特性。新增特性包括：

支持queue设置可访问的accessible label
支持配置队列的default node label

参数例子

<allocations> 
         <queue name="spark">
                <minResources>1066889mb, 629vcores</minResources>
                <maxResources>1066889mb, 629vcores</maxResources>
                <maxRunningApps>40</maxRunningApps>
                <maxAMShare>0.35</maxAMShare>
                <accessibleNodeLabels>GPU,LJH</accessibleNodeLabels>
                <defaultNodeLabelExpression>LJH</defaultNodeLabelExpression>
                <aclSubmitApps>*</aclSubmitApps>
                <aclAdministerApps>sirius</aclAdministerApps>
                <weight>1.0</weight>
        </queue>
         <queue name="router">
                <minResources>1066889mb, 629vcores</minResources>
                <maxResources>1066889mb, 629vcores</maxResources>
                <maxRunningApps>40</maxRunningApps>
                <maxAMShare>0.35</maxAMShare>
                <aclSubmitApps>*</aclSubmitApps>
                <aclAdministerApps>router</aclAdministerApps>
                <weight>1.0</weight>
        </queue>
</allocations>

具体patch内容请邮件联系liujianhuiouc@163.com

最后编辑于：2017.12.06 02:24:50

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 219,539评论 6赞 508
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,594评论 3赞 396
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 165,871评论 0赞 356
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,963评论 1赞 295
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,984评论 6赞 393
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,763评论 1赞 307
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,468评论 3赞 420
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,357评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,850评论 1赞 317
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 38,002评论 3赞 338
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,144评论 1赞 351
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,823评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,483评论 3赞 331
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 32,026评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,150评论 1赞 272
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,415评论 3赞 373
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 45,092评论 2赞 355

node label

导读

特性

配置

操作说明

CapacityScheduler的label特性

配置参数

FairScheduler Label

推荐阅读更多精彩内容