006.Azkaban-3.x Two-Server模式搭建

环境准备

1. two-server模式简介

web-server和executor-server是两个单独的进程,但都运行在同一个机器上,调度任务只能分配到该机器上执行,元数据存储在MySQL中,MySQL可以在其他机器上。

2. two-server模式安装

(1) 目录规划

azkaban-db-0.1.0-SNAPSHOT.tar.gzazkaban-exec-server-0.1.0-SNAPSHOT.tar.gzazkaban-web-server-0.1.0-SNAPSHOT.tar.gz这3个压缩包上传到/opt/azkaban-3.76.0目录下(这里因为我编译的azkaban是3.76.0版本的),azkaban-3.76.0这个目录需要手动创建,然后解压3个安装包,并统一改名,去掉-0.1.0-SNAPSHOT后缀,这些操作完成之后,我的azkaban安装目录是这样的:

/opt
    /azkaban-3.76.0
        /azkaban-db
        /azkaban-exec-server
        /azkaban-web-server

修改azkaban-3.76.0的所有者和所属组:

chown -R root:root /opt/azkaban-3.76.0

我是用root用户搭建,所以所有者和所属组都是root,这里需要手动修改一遍的原因是,假如你使用用户A上传的压缩包,然后使用用户B(用户B具有较大权限,例如root)解压缩之后,整个目录下的目录或者文件的所有者或所属组可能既不是用户A,也不是用户B,所以还是手动修改一下。

(2) 配置环境变量

[root@magic azkaban-3.76.0]# vim /etc/profile

export AZKABAN_WEB_SERVER_HOME=/opt/azkaban-3.76.0/azkaban-web-server
export AZKABAN_EXEC_SERVER_HOME=/opt/azkaban-3.76.0/azkaban-exec-server
export PATH=$AZKABAN_WEB_SERVER_HOME/bin:$AZKABAN_EXEC_SERVER_HOME/bin:$PATH

[root@magic azkaban-3.76.0]# source /etc/profile

(3) 准备数据库

在MySQL中创建azkaban用户和数据库

mysql> CREATE DATABASE azkaban;
Query OK, 1 row affected (0.01 sec)

mysql> CREATE USER 'azkaban'@'%' IDENTIFIED BY 'azkaban';
Query OK, 0 rows affected (0.01 sec)

mysql> GRANT SELECT,INSERT,UPDATE,DELETE ON azkaban.* to 'azkaban'@'%' WITH GRANT OPTION;
Query OK, 0 rows affected (0.01 sec)

mysql> FLUSH PRIVILEGES;
Query OK, 0 rows affected (0.00 sec)

MySQL需要开启innodb_large_prefix,MySQL-5.7默认开启,在/etc/my.cnf配置innodb_large_prefix = 1并重启MySQL服务后可以手动开启。

修改create-all-sql-0.1.0-SNAPSHOT.sql文件中的内容(该文件在azkaban-db目录下),给每个建表语句增加ENGINE=InnoDB ROW_FORMAT=DYNAMIC,例如:

CREATE TABLE active_executing_flows (
  exec_id     INT,
  update_time BIGINT,
  PRIMARY KEY (exec_id)
);

修改为:

CREATE TABLE active_executing_flows (
  exec_id     INT,
  update_time BIGINT,
  PRIMARY KEY (exec_id)
) ENGINE=InnoDB ROW_FORMAT=DYNAMIC;

注意,将create-all-sql-0.1.0-SNAPSHOT.sql中的所有建表语句执行以上修改。

执行SQL脚本,初始化Azkaban数据库:

mysql> use azkaban;
Database changed

# 查看执行过程,确保每个表都成功创建
mysql> source /opt/azkaban-3.76.0/azkaban-db/create-all-sql-0.1.0-SNAPSHOT.sql;
Query OK, 0 rows affected (0.04 sec)

Query OK, 0 rows affected (0.05 sec)

......

(4) web-server 安装

<1> 生成 keystore 和 truststore 文件

说明:如果需要使用http协议访问Azkaban-web-ui,这一步可以忽略

参考 Azkaban-3.x 生成 keystore 和 truststore 文件

azkaban-web-server目录中创建key,将生成的3个文件放到key目录下

<2> 修改 azkaban-web-server/conf/azkaban.properties

修改azkaban.properties(无论是web-server的还是exec-server的),都要注意以下几点

  1. 每行的末尾不要留空格
  2. 时区一定是Asia/Shanghai
  3. 所有的路径写成绝对路径
  4. 各个配置项参考Azkaban-3.x 配置信息说明
azkaban.name=azkaban-3.76.0
azkaban.label=two-server-mode
azkaban.color=#FF3601
azkaban.default.servlet.path=/index
azkaban.project.dir=/opt/azkaban-3.76.0/azkaban-web-server/projects
project.temp.dir=/opt/azkaban-3.76.0/azkaban-web-server/temp
azkaban.jobtype.plugin.dir=/opt/azkaban-3.76.0/azkaban-web-server/plugins/jobtypes
web.resource.dir=/opt/azkaban-3.76.0/azkaban-web-server/web
default.timezone.id=Asia/Shanghai
viewer.plugin.dir=/opt/azkaban-3.76.0/azkaban-web-server/plugins/viewer
cache.directory=/opt/azkaban-3.76.0/azkaban-web-server/cache
velocity.dev.mode=false

azkaban.use.multiple.executors=true

user.manager.class=azkaban.user.XmlUserManager
user.manager.xml.file=/opt/azkaban-3.76.0/azkaban-web-server/conf/azkaban-users.xml
lockdown.create.projects=false
lockdown.upload.projects=false

executor.port=12321

# 使用http协议访问web-ui的jetty相关配置,只需要以下4行
# 使用http协议访问web-ui时的端口
jetty.port=18081
# 如果使用http协议访问web-ui,此值为false,使用https协议访问web-ui,此值为true
jetty.use.ssl=true
jetty.maxThreads=25
jetty.connector.stats=true

# 如果使用https协议访问web-ui,则需要以上4条和以下5条配置,同时jetty.use.ssl需要为true,步骤一也是必须的
jetty.password=azkaban
jetty.keypassword=azkaban
jetty.trustpassword=azkaban
jetty.keystore=/opt/azkaban-3.76.0/azkaban-web-server/key/keystore
jetty.truststore=/opt/azkaban-3.76.0/azkaban-web-server/key/truststore

# mysql相关配置
database.type=mysql
mysql.port=3306
mysql.host=magic
mysql.database=azkaban
mysql.user=azkaban
mysql.password=azkaban
mysql.numconnections=100

# 邮箱设置,此邮箱将在调度任务执行成功或失败后发送通知邮件到指定的通知邮箱
mail.sender=xxx@163.com
mail.host=smtp.163.com
mail.user=xxx@163.com
mail.password=xxxxxx

# 以下两个配置分别指定任务执行失败或失败后发送到哪个邮箱进行通知
# 可以页面配置,无需在这里写死
# job.failure.email=
# job.success.email=

说明:azkaban.use.multiple.executors=true这一行必须配置,因为3.76.0版本(我不确认是从哪个版本开始)已经不支持two-server模式了,不加这一行启动web-server会报错:

2019/08/23 15:08:44.437 +0800 ERROR [StdOutErrRedirect] [Azkaban] java.lang.IllegalArgumentException: azkaban.use.multiple.executors must be true. Single executor mode is not supported any more.

我们虽然开启了多executor模式,但是只启动一个executor,并且executor和web-server在同一台机器上,这也就相当于是two-server模式了。

<3> 修改 azkaban-web-server/conf/log4j.properties

# 默认为INFO, Console 需要修改
log4j.rootLogger=INFO, server
log4j.logger.azkaban=INFO, server
log4j.appender.server=org.apache.log4j.RollingFileAppender
log4j.appender.server.layout=org.apache.log4j.PatternLayout
# 修改为绝对路径
log4j.appender.server.File=/data/log/azkaban/azkaban-webserver.log
log4j.appender.server.layout.ConversionPattern=%d{yyyy/MM/dd HH:mm:ss.SSS Z} %p [%c{1}] [Azkaban] %m%n
# 修改为1024MB,默认为102400MB,显然是不合理的
log4j.appender.server.MaxFileSize=1024MB
log4j.appender.server.MaxBackupIndex=2
log4j.appender.Console=org.apache.log4j.ConsoleAppender
log4j.appender.Console.layout=org.apache.log4j.PatternLayout
log4j.appender.Console.layout.ConversionPattern=%d{yyyy/MM/dd HH:mm:ss.SSS Z} %p [%c{1}] [Azkaban] %m%

<4> 创建/opt/azkaban-3.76.0/azkaban-web-server/plugins/triggers目录

mkdir -p /opt/azkaban-3.76.0/azkaban-web-server/plugins/triggers

(5) exec-server 安装

解压azkaban-exec-server-0.1.0-SNAPSHOT.tar.gz安装包,改名为azkaban-exec-server

<1> 修改azkaban-exec-server/conf/azkaban.properties

azkaban.webserver.url=https://magic:8443
azkaban.jobtype.plugin.dir=/opt/azkaban-3.76.0/azkaban-exec-server/plugins/jobtypes
azkaban.project.dir=/opt/azkaban-3.76.0/azkaban-exec-server/projects
default.timezone.id=Asia/Shanghai

database.type=mysql
mysql.port=3306
mysql.host=magic
mysql.database=azkaban
mysql.user=azkaban
mysql.password=azkaban
mysql.numconnections=100

executor.port=12321
executor.connector.stats=true
executor.maxThreads=50
executor.flow.threads=30
executor.global.properties=/opt/azkaban-3.76.0/azkaban-exec-server/conf/global.properties

<2> 修改 azkaban-exec-server/conf/log4j.properties

将其中的存放日志的路径由相对路径改为绝对路径,logs目录手动创建

log4j.rootLogger=INFO, server
log4j.logger.azkaban=INFO, server
log4j.appender.server=org.apache.log4j.RollingFileAppender
log4j.appender.server.layout=org.apache.log4j.PatternLayout
log4j.appender.server.File=/data/log/azkaban/azkaban-execserver.log
log4j.appender.server.layout.ConversionPattern=%d{yyyy/MM/dd HH:mm:ss.SSS Z} %p [%c{1}] [Azkaban] %m%n
log4j.appender.server.MaxFileSize=1024MB
log4j.appender.server.MaxBackupIndex=2
log4j.appender.Console=org.apache.log4j.ConsoleAppender
log4j.appender.Console.layout=org.apache.log4j.PatternLayout
log4j.appender.Console.layout.ConversionPattern=%d{yyyy/MM/dd HH:mm:ss.SSS Z} %p [%c{1}] [Azkaban] %m%n

3. web-server和exec-server启停脚本的修改

自带的启停脚本很一些不足之处需要修改

(1) 日志相关问题

启动web-server和exec-server,在哪个目录下执行启动服务,就会生成一个.out日志文件,例如:

[root@magic bin]# ./start-exec.sh 
[root@magic bin]# ll
total 24
# executions目录、temp目录、executorServerLog文件和executor.port文件是在启动服务后生成的
drwxr-sr-x 2 root root 4096 Dec 20 16:56 executions
-rw-r--r-- 1 root root    5 Dec 20 16:56 executor.port
-rw-r--r-- 1 root root 2329 Dec 20 16:56 executorServerLog__2019-12-20+16:56:44.out
drwxrwxr-x 2 root root 4096 Dec 20 10:37 internal
-rwxr-xr-x 1 root root  214 Aug 21 02:10 shutdown-exec.sh
-rwxr-xr-x 1 root root  207 Dec 20 16:56 start-exec.sh
drwxr-xr-x 2 root root 4096 Dec 20 16:56 temp

由于我们已经指定了日志文件存储在/data/log/azkaban目录下:

[root@magic bin]# cd /data/log/azkaban/
[root@magic azkaban]# ll
total 16
-rw-r--r-- 1 root root 14664 Dec 20 16:56 azkaban-execserver.log

于是,修改azkaban-web-server的bin/start-web.sh和azkaban-exec-server的bin/start-exec.sh

start-exec.sh:

#!/bin/bash

script_dir=$(dirname $0)

# ${script_dir}/internal/internal-start-executor.sh "$@" >executorServerLog__`date +%F+%T`.out 2>&1 &
${script_dir}/internal/internal-start-executor.sh "$@" >/dev/null 2>&1 &

start-web.sh:

#!/bin/bash

script_dir=$(dirname $0)

# ${script_dir}/internal/internal-start-web.sh >webServerLog__`date +%F+%T`.out 2>&1 &
${script_dir}/internal/internal-start-web.sh >/dev/null 2>&1 &

(2) exec-server的临时文件

启动exec-server,在哪个目录下执行启动服务,就会生成executions目录、temp目录和executor.port文件这些临时的目录或文件,然后停止服务后,也不会删除这些临时目录或文件,于是:

/opt/azkaban-3.76.0/azkaban-exec-server目录下新建tmp目录用于存放这些临时目录或文件;

修改azkaban-exec-server的bin/start-exec.sh,修改为:

script_dir=/opt/azkaban-3.76.0/azkaban-exec-server/tmp
cd ${script_dir}

# pass along command line arguments to the internal launch script.
../bin/internal/internal-start-executor.sh "$@" >/dev/null 2>&1 &

修改azkaban-exec-server的bin/shutdown-exec.sh,修改为:

#!/usr/bin/env bash
# Shutdown script for azkaban executor server
set -o nounset

script_dir=$(dirname $0)
base_dir="${script_dir}/.."
source "${script_dir}/internal/util.sh"
common_shutdown "executor" ${base_dir}

# 新增了这一行,停止服务后删除临时目录或文件
rm -rf /opt/azkaban-3.76.0/azkaban-exec-server/tmp/*

(3) 激活executor

启动exec-server之后,需要手动激活executor,否则web-server无法启动,于是修改azkaban-exec-server的bin/start-exec.sh为:

#!/bin/bash

script_dir=/opt/azkaban-3.76.0/azkaban-exec-server/tmp
cd ${script_dir}

# pass along command line arguments to the internal launch script.
../bin/internal/internal-start-executor.sh "$@" >/dev/null 2>&1 &


# 这里休眠3s是为了给exec-server启动后提供一些准备时间
sleep 3s
# 然后再激活executor
curl http://magic:12321/executor?action=activate

4. 启动服务

(1) 必须先启动exec-server

[root@magic azkaban-exec-server]$ bin/start-exec.sh

(2) 启动web-server

[root@magic azkaban-web-server]$ bin/start-web.sh

(3) 查看进程

[root@magic azkaban-web-server]$ jps
13096 AzkabanWebServer
13130 Jps
13051 AzkabanExecutorServer

(4) 访问 WEB-UI

http访问:http://hostname:${jetty.port}

https访问:https://hostname:${jetty.port}

使用azkaban用户登录,密码是azkaban

至此,Azkaban-3.x two-server 模式就搭建成功了!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,658评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,482评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,213评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,395评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,487评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,523评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,525评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,300评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,753评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,048评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,223评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,905评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,541评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,168评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,417评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,094评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,088评论 2 352

推荐阅读更多精彩内容