Azkaban-3.x two-server 模式搭建

环境准备

1. two-server模式简介

web-server和executor-server是两个单独的进程,但都运行在同一个机器上,调度任务只能分配到该机器上执行,元数据存储在MySQL中,MySQL可以在其他机器上。

2. two-server模式安装

(1) 目录规划

azkaban-db-0.1.0-SNAPSHOT.tar.gzazkaban-exec-server-0.1.0-SNAPSHOT.tar.gzazkaban-web-server-0.1.0-SNAPSHOT.tar.gz这3个压缩包上传到/opt/azkaban-3.76.0目录下(这里因为我编译的azkaban是3.76.0版本的),azkaban-3.76.0这个目录需要手动创建,然后解压3个安装包,并统一改名,去掉-0.1.0-SNAPSHOT后缀,这些操作完成之后,我的azkaban安装目录是这样的:

/opt
    /azkaban-3.76.0
        /azkaban-db
        /azkaban-exec-server
        /azkaban-web-server

修改azkaban-3.76.0的所有者和所属组:

chown -R root:root /opt/azkaban-3.76.0

我是用root用户搭建,所以所有者和所属组都是root,这里需要手动修改一遍的原因是,假如你使用用户A上传的压缩包,然后使用用户B(用户B具有较大权限,例如root)解压缩之后,整个目录下的目录或者文件的所有者或所属组可能既不是用户A,也不是用户B,所以还是手动修改一下。

(2) 配置环境变量

[root@magic azkaban-3.76.0]# vim /etc/profile

export AZKABAN_WEB_SERVER_HOME=/opt/azkaban-3.76.0/azkaban-web-server
export AZKABAN_EXEC_SERVER_HOME=/opt/azkaban-3.76.0/azkaban-exec-server
export PATH=$AZKABAN_WEB_SERVER_HOME/bin:$AZKABAN_EXEC_SERVER_HOME/bin:$PATH

[root@magic azkaban-3.76.0]# source /etc/profile

(3) 准备数据库

在MySQL中创建azkaban用户和数据库

mysql> CREATE DATABASE azkaban;
Query OK, 1 row affected (0.01 sec)

mysql> CREATE USER 'azkaban'@'%' IDENTIFIED BY 'azkaban';
Query OK, 0 rows affected (0.01 sec)

mysql> GRANT SELECT,INSERT,UPDATE,DELETE ON azkaban.* to 'azkaban'@'%' WITH GRANT OPTION;
Query OK, 0 rows affected (0.01 sec)

mysql> FLUSH PRIVILEGES;
Query OK, 0 rows affected (0.00 sec)

MySQL需要开启innodb_large_prefix,MySQL-5.7默认开启,在/etc/my.cnf配置innodb_large_prefix = 1并重启MySQL服务后可以手动开启。

修改create-all-sql-0.1.0-SNAPSHOT.sql文件中的内容(该文件在azkaban-db目录下),给每个建表语句增加ENGINE=InnoDB ROW_FORMAT=DYNAMIC,例如:

CREATE TABLE active_executing_flows (
  exec_id     INT,
  update_time BIGINT,
  PRIMARY KEY (exec_id)
);

修改为:

CREATE TABLE active_executing_flows (
  exec_id     INT,
  update_time BIGINT,
  PRIMARY KEY (exec_id)
) ENGINE=InnoDB ROW_FORMAT=DYNAMIC;

注意,将create-all-sql-0.1.0-SNAPSHOT.sql中的所有建表语句执行以上修改。

执行SQL脚本,初始化Azkaban数据库:

mysql> use azkaban;
Database changed

# 查看执行过程,确保每个表都成功创建
mysql> source /opt/azkaban-3.76.0/azkaban-db/create-all-sql-0.1.0-SNAPSHOT.sql;
Query OK, 0 rows affected (0.04 sec)

Query OK, 0 rows affected (0.05 sec)

......

(4) web-server 安装

<1> 生成 keystore 和 truststore 文件

说明:如果需要使用http协议访问Azkaban-web-ui,这一步可以忽略

参考 Azkaban-3.x 生成 keystore 和 truststore 文件

azkaban-web-server目录中创建key,将生成的3个文件放到key目录下

<2> 修改 azkaban-web-server/conf/azkaban.properties

修改azkaban.properties(无论是web-server的还是exec-server的),都要注意以下几点

  1. 每行的末尾不要留空格
  2. 时区一定是Asia/Shanghai
  3. 所有的路径写成绝对路径
  4. 各个配置项参考Azkaban-3.x 配置信息说明
azkaban.name=azkaban-3.76.0
azkaban.label=two-server-mode
azkaban.color=#FF3601
azkaban.default.servlet.path=/index
azkaban.project.dir=/opt/azkaban-3.76.0/azkaban-web-server/projects
project.temp.dir=/opt/azkaban-3.76.0/azkaban-web-server/temp
azkaban.jobtype.plugin.dir=/opt/azkaban-3.76.0/azkaban-web-server/plugins/jobtypes
web.resource.dir=/opt/azkaban-3.76.0/azkaban-web-server/web
default.timezone.id=Asia/Shanghai
viewer.plugin.dir=/opt/azkaban-3.76.0/azkaban-web-server/plugins/viewer
cache.directory=/opt/azkaban-3.76.0/azkaban-web-server/cache
velocity.dev.mode=false

azkaban.use.multiple.executors=true

user.manager.class=azkaban.user.XmlUserManager
user.manager.xml.file=/opt/azkaban-3.76.0/azkaban-web-server/conf/azkaban-users.xml
lockdown.create.projects=false
lockdown.upload.projects=false

executor.port=12321

# 使用http协议访问web-ui的jetty相关配置,只需要以下4行
# 使用http协议访问web-ui时的端口
jetty.port=18081
# 如果使用http协议访问web-ui,此值为false,使用https协议访问web-ui,此值为true
jetty.use.ssl=true
jetty.maxThreads=25
jetty.connector.stats=true

# 如果使用https协议访问web-ui,则需要以上4条和以下5条配置,同时jetty.use.ssl需要为true,步骤一也是必须的
jetty.password=azkaban
jetty.keypassword=azkaban
jetty.trustpassword=azkaban
jetty.keystore=/opt/azkaban-3.76.0/azkaban-web-server/key/keystore
jetty.truststore=/opt/azkaban-3.76.0/azkaban-web-server/key/truststore

# mysql相关配置
database.type=mysql
mysql.port=3306
mysql.host=magic
mysql.database=azkaban
mysql.user=azkaban
mysql.password=azkaban
mysql.numconnections=100

# 邮箱设置,此邮箱将在调度任务执行成功或失败后发送通知邮件到指定的通知邮箱
mail.sender=xxx@163.com
mail.host=smtp.163.com
mail.user=xxx@163.com
mail.password=xxxxxx

# 以下两个配置分别指定任务执行失败或失败后发送到哪个邮箱进行通知
# 可以页面配置,无需在这里写死
# job.failure.email=
# job.success.email=

说明:azkaban.use.multiple.executors=true这一行必须配置,因为3.76.0版本(我不确认是从哪个版本开始)已经不支持two-server模式了,不加这一行启动web-server会报错:

2019/08/23 15:08:44.437 +0800 ERROR [StdOutErrRedirect] [Azkaban] java.lang.IllegalArgumentException: azkaban.use.multiple.executors must be true. Single executor mode is not supported any more.

我们虽然开启了多executor模式,但是只启动一个executor,并且executor和web-server在同一台机器上,这也就相当于是two-server模式了。

<3> 修改 azkaban-web-server/conf/log4j.properties

# 默认为INFO, Console 需要修改
log4j.rootLogger=INFO, server
log4j.logger.azkaban=INFO, server
log4j.appender.server=org.apache.log4j.RollingFileAppender
log4j.appender.server.layout=org.apache.log4j.PatternLayout
# 修改为绝对路径
log4j.appender.server.File=/data/log/azkaban/azkaban-webserver.log
log4j.appender.server.layout.ConversionPattern=%d{yyyy/MM/dd HH:mm:ss.SSS Z} %p [%c{1}] [Azkaban] %m%n
# 修改为1024MB,默认为102400MB,显然是不合理的
log4j.appender.server.MaxFileSize=1024MB
log4j.appender.server.MaxBackupIndex=2
log4j.appender.Console=org.apache.log4j.ConsoleAppender
log4j.appender.Console.layout=org.apache.log4j.PatternLayout
log4j.appender.Console.layout.ConversionPattern=%d{yyyy/MM/dd HH:mm:ss.SSS Z} %p [%c{1}] [Azkaban] %m%

<4> 创建/opt/azkaban-3.76.0/azkaban-web-server/plugins/triggers目录

mkdir -p /opt/azkaban-3.76.0/azkaban-web-server/plugins/triggers

(5) exec-server 安装

解压azkaban-exec-server-0.1.0-SNAPSHOT.tar.gz安装包,改名为azkaban-exec-server

<1> 修改azkaban-exec-server/conf/azkaban.properties

azkaban.webserver.url=https://magic:8443
azkaban.jobtype.plugin.dir=/opt/azkaban-3.76.0/azkaban-exec-server/plugins/jobtypes
azkaban.project.dir=/opt/azkaban-3.76.0/azkaban-exec-server/projects
default.timezone.id=Asia/Shanghai

database.type=mysql
mysql.port=3306
mysql.host=magic
mysql.database=azkaban
mysql.user=azkaban
mysql.password=azkaban
mysql.numconnections=100

executor.port=12321
executor.connector.stats=true
executor.maxThreads=50
executor.flow.threads=30
executor.global.properties=/opt/azkaban-3.76.0/azkaban-exec-server/conf/global.properties

<2> 修改 azkaban-exec-server/conf/log4j.properties

将其中的存放日志的路径由相对路径改为绝对路径,logs目录手动创建

log4j.rootLogger=INFO, server
log4j.logger.azkaban=INFO, server
log4j.appender.server=org.apache.log4j.RollingFileAppender
log4j.appender.server.layout=org.apache.log4j.PatternLayout
log4j.appender.server.File=/data/log/azkaban/azkaban-execserver.log
log4j.appender.server.layout.ConversionPattern=%d{yyyy/MM/dd HH:mm:ss.SSS Z} %p [%c{1}] [Azkaban] %m%n
log4j.appender.server.MaxFileSize=1024MB
log4j.appender.server.MaxBackupIndex=2
log4j.appender.Console=org.apache.log4j.ConsoleAppender
log4j.appender.Console.layout=org.apache.log4j.PatternLayout
log4j.appender.Console.layout.ConversionPattern=%d{yyyy/MM/dd HH:mm:ss.SSS Z} %p [%c{1}] [Azkaban] %m%n

3. web-server和exec-server启停脚本的修改

自带的启停脚本很一些不足之处需要修改

(1) 日志相关问题

启动web-server和exec-server,在哪个目录下执行启动服务,就会生成一个.out日志文件,例如:

[root@magic bin]# ./start-exec.sh 
[root@magic bin]# ll
total 24
# executions目录、temp目录、executorServerLog文件和executor.port文件是在启动服务后生成的
drwxr-sr-x 2 root root 4096 Dec 20 16:56 executions
-rw-r--r-- 1 root root    5 Dec 20 16:56 executor.port
-rw-r--r-- 1 root root 2329 Dec 20 16:56 executorServerLog__2019-12-20+16:56:44.out
drwxrwxr-x 2 root root 4096 Dec 20 10:37 internal
-rwxr-xr-x 1 root root  214 Aug 21 02:10 shutdown-exec.sh
-rwxr-xr-x 1 root root  207 Dec 20 16:56 start-exec.sh
drwxr-xr-x 2 root root 4096 Dec 20 16:56 temp

由于我们已经指定了日志文件存储在/data/log/azkaban目录下:

[root@magic bin]# cd /data/log/azkaban/
[root@magic azkaban]# ll
total 16
-rw-r--r-- 1 root root 14664 Dec 20 16:56 azkaban-execserver.log

于是,修改azkaban-web-server的bin/start-web.sh和azkaban-exec-server的bin/start-exec.sh

start-exec.sh:

#!/bin/bash

script_dir=$(dirname $0)

# ${script_dir}/internal/internal-start-executor.sh "$@" >executorServerLog__`date +%F+%T`.out 2>&1 &
${script_dir}/internal/internal-start-executor.sh "$@" >/dev/null 2>&1 &

start-web.sh:

#!/bin/bash

script_dir=$(dirname $0)

# ${script_dir}/internal/internal-start-web.sh >webServerLog__`date +%F+%T`.out 2>&1 &
${script_dir}/internal/internal-start-web.sh >/dev/null 2>&1 &

(2) exec-server的临时文件

启动exec-server,在哪个目录下执行启动服务,就会生成executions目录、temp目录和executor.port文件这些临时的目录或文件,然后停止服务后,也不会删除这些临时目录或文件,于是:

/opt/azkaban-3.76.0/azkaban-exec-server目录下新建tmp目录用于存放这些临时目录或文件;

修改azkaban-exec-server的bin/start-exec.sh,修改为:

script_dir=/opt/azkaban-3.76.0/azkaban-exec-server/tmp
cd ${script_dir}

# pass along command line arguments to the internal launch script.
../bin/internal/internal-start-executor.sh "$@" >/dev/null 2>&1 &

修改azkaban-exec-server的bin/shutdown-exec.sh,修改为:

#!/usr/bin/env bash
# Shutdown script for azkaban executor server
set -o nounset

script_dir=$(dirname $0)
base_dir="${script_dir}/.."
source "${script_dir}/internal/util.sh"
common_shutdown "executor" ${base_dir}

# 新增了这一行,停止服务后删除临时目录或文件
rm -rf /opt/azkaban-3.76.0/azkaban-exec-server/tmp/*

(3) 激活executor

启动exec-server之后,需要手动激活executor,否则web-server无法启动,于是修改azkaban-exec-server的bin/start-exec.sh为:

#!/bin/bash

script_dir=/opt/azkaban-3.76.0/azkaban-exec-server/tmp
cd ${script_dir}

# pass along command line arguments to the internal launch script.
../bin/internal/internal-start-executor.sh "$@" >/dev/null 2>&1 &


# 这里休眠3s是为了给exec-server启动后提供一些准备时间
sleep 3s
# 然后再激活executor
curl http://magic:12321/executor?action=activate

4. 启动服务

(1) 必须先启动exec-server

[root@magic azkaban-exec-server]$ bin/start-exec.sh

(2) 启动web-server

[root@magic azkaban-web-server]$ bin/start-web.sh

(3) 查看进程

[root@magic azkaban-web-server]$ jps
13096 AzkabanWebServer
13130 Jps
13051 AzkabanExecutorServer

(4) 访问 WEB-UI

http访问:http://hostname:${jetty.port}

https访问:https://hostname:${jetty.port}

使用azkaban用户登录,密码是azkaban

至此,Azkaban-3.x two-server 模式就搭建成功了!

推荐阅读更多精彩内容