Airflow 中文文档:初始化数据库后端

96
ApacheCN_飞龙 595a1b60 08f6 4beb 998f 2bf55e230555
2018.11.28 20:09 字数 327

如果您想对Airflow进行真正的试驾,您应该考虑设置一个真正的数据库后端并切换到LocalExecutor。

由于Airflow是使用优秀的SqlAlchemy库与其元数据进行交互而构建的,因此您应该能够使用任何支持作为SqlAlchemy后端的数据库后端。 我们建议使用MySQLPostgres

注意

我们依赖更严格的MySQL SQL设置来获得合理的默认值。 确保在<cite>[mysqld]</cite>下的my.cnf中指定了<cite>explicit_defaults_for_timestamp = 1</cite>

注意

如果您决定使用Postgres ,我们建议您使用psycopg2驱动程序并在SqlAlchemy连接字符串中指定它。 另请注意,由于SqlAlchemy没有公开在Postgres连接URI中定位特定模式的方法,因此您可能希望使用类似于ALTER ROLE username SET search_path = airflow, foobar;的命令为您的角色设置默认模式ALTER ROLE username SET search_path = airflow, foobar;

将数据库设置为托管Airflow后,您需要更改配置文件$AIRFLOW_HOME/airflow.cfg的SqlAlchemy连接字符串。 然后,您还应该将“executor”设置更改为使用“LocalExecutor”,这是一个可以在本地并行化任务实例的执行程序。

 # initialize the database
airflow initdb

阅读全文/改进本文

ApacheCN
Gupao