Azkaban Upload zip

最近在做Azkaban方面的工作,需要了解下Azkaban上传文件的存储机制。下面我们简要分析下Azkaban中的zip文件上传的过程:

上传流程

zip文件上传的时候首先缓存到temp文件夹下,然后上传到MySQL中,并更新相关信息。当上成功上传到MySQL后将删除本地缓存文件。
其中上传的相关表代码及过程如下:

上传代码

上传包括以下操作:
logger.info("Uploading file to db " + archive.getName());
logger.info("Uploading flow to db " + archive.getName());
logger.info("Changing project versions " + archive.getName());
logger.info("Uploading Job properties");
logger.info("Uploading Props properties");
由此可以看出,Azkaban上传zip的时候主要涉及到以下几个表:

1. project_files

Uploading file to db指的是将zip文件上传到project_files表中,具体操作代码以及流程如下:

Uploading file to db

sql语句如下:

"INSERT INTO project_files (project_id, version, chunk, size, file) values (?,?,?,?,?)";

上传过程按照CHUCK_SIZE(默认10M)将zip进行切片,然后上传,本文以一个59M的文件做实验,结果如下,可以看出分成(5*10+9):

上传59M文件实例

在project_files中,其存储zip文件的字段为file类型为longblob。

表结构

2.project_flows

在project_flows中,插入一条上传的信息:

操作project_flows代码

sql语句:

"INSERT INTO project_flows (project_id, version, flow_id, modified_time, encoding_type, json) values (?,?,?,?,?,?)";

查看更新的flow信息:

更新flow信息

3.project_versions

当上传新的文件,MySQL会在project_versions中记录本次上传的版本信息。同时,更新其在projects的版本信息。该版本信息记录的是当前执行的project版本,因为用户会上传多个版本,需要一个地方记录project的最新版本号,使得用户能够执行最新的上传版本。不过,用户每次执行flow的时候,只有在第一次才会从MySQL中获得版本信息,后面都是直接从内存的对象中获得版本。

更新版本信息

Sql语句:

"UPDATE projects SET version=?,modified_time=?,last_modified_by=? WHERE id=?";

当用户上传一个新的版本时,version自动加1:

版本加1
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 135,773评论 19 139
  • 什么是Azkaban Azkaban是一款基于Java编写的任务调度系统 任务调度:有四个任务脚A、B、C、D,其...
    PeTu阅读 36,803评论 28 27
  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 175,831评论 25 709
  • 上一篇是十月二十号发的。今天是十月三十号。隔了很多天没写东西,如果要概括这些天干了什么,嗯。不知道。 乱七八糟的生...
    一定要早起阅读 1,540评论 0 0
  • 小萌妹子在姐姐的影响下,也养成了爱看书的小爱好。最近特别喜欢看的一本书是瑞士画家艾伯丁的作品,《小鸟》,讲述的是一...
    讨讨阅读 16,705评论 0 7