logo

小白学苑PBCP

PBCP, 让大数据竞赛更简单!

工作流调度工具_Azkaban的使用

本节课学习如何使用Azkaban。

成功登录Azkaban后(http://IP地址:8081),主页面如下图所示:

在首页中有六个菜单,分别是:

  • projects:最重要的部分,创建一个工程,所有flows将在工程中运行。
  • scheduling:显示定时任务。
  • executing:显示当前运行的任务。
  • history:显示历史运行任务。
  • Flow Trigger Schedule:流定时触发器。
  • Documentation:Azkaban文档链接。

Projects部分主要负责创建和管理工程。首先了解一下相关的概念。

一个工程(project)包含一个或多个flows,一个flow包含多个job。job是你想在azkaban中运行的一个进程,它可以是简单的linux命令,可是java程序,也可以是复杂的shell脚本,当然,如果你安装相关插件,也可以运行插件。一个job可以依赖于另一个job,这种多个job和它们的依赖组成的图表叫做flow。

点击以下链接,直接查看相应的示例。

    会员登录