浅谈数据管理工具Cloudera Navigator

cdh版本5.16.2, navigator版本2.15.2

1. 介绍what

Cloudera Navigator也是CDH企业版的工具之一,定位为一个数据管理工具。目前随着CDP版本的推广,该组件已开源。Hadoop大数据平台拥有存储与分析任何种类和规模数据的能力,并且将其开放给更多用户和分析工具。 但是,这同时也带来数据管理上的挑战:大量的业务用户想自助访问可发掘数据;管理员需要知道数据是怎么被用来优化分析性能的;安全团队需要看见数据的访问方式以及它们是怎么满足合规性的。一个大数据平台必须有能力在整个企业内解决数据管理以及合规性需求,但同时不能牺牲大数据本身的灵活性和优势。所以我们需要数据管理工具Navigator。


2. 架构how

Cloudera Manager会记录操作的整个生命周期,不论是在集群级别上的操作,还是主机、角色、服务、用户级别的,都会记录下来,比如下载parcel, 启动集群,以及安全相关的操作:增加用户、删除用户、登录状态。Cloudera Navigator 页面可以让管理员或者用户看到这些操作记录,也就是audit events。

Navigator主要由审计服务器和元数据服务器构成,审计服务包括时间戳、用户名、IP、服务名称和操作。元数据服务包括数据查询、标签、数据血缘分析等等。(姜黄色部分)



同时,Navigator Audit Server 和 Navigator Metadata Server 的运行状态,由Cloudera Management Service 监控和审计。(也就是下面棕色和黄色蓝色框框部分)

那么他们之间是如何运作的呢?Cloudera Manager Agent运行在集群中的每个节点上,该进程会:

• 监控本地的审计日志文件

• 发送日志里的events给Navigator Audit Server, 如果发送失败会不断的重试

• 当发送成功后,删除旧审计日志

通过以上,我们可以发现,也是工作中遇到的小坑,就是当我们把Navigator Audit Server服务关闭后,会导致大量的审计日志堆积,没有被发送,也没有被自动删除,因此解决方案就是需要定期清理的脚本。

Navigator Audit database 目前是用的mysql, 显然mysql的性能是无法满足多天审计日志分析的,当单机mysql出现瓶颈时,业内目前有两种方案可供借鉴:对 MySQL 进行分库分表处理,将一台 MySQL 的压力分摊到 MySQL 集群;对Navigator Audit Server进行 Federation,采用多套 Navigator Audit Server+ MySQL 的架构,在 Navigator Audit Server 前方设置代理,按照一定的规则,对请求进行分发(此处参考Hive Metastore的解决方案)。

6. 展望to Atlas

在CDP的版本中,原本由Navigator消费的元数据和审计日志,比如Hive, Impala, Spark和HBase的审计日志都需要被配置到Atlas来消费。Atlas替代Navigator将会带来这些新的变化:

1. 结合Ranger。

2. Atlas利用kafka来将元数据存储到Hbase和Solr中,利用了分布式存储提高可靠性和可拓展性

3. 可添加不同源的元数据。可以通过REST APIs,消费各种源发送来的元数据信息

4. Atlas提供业务术语表界面,该界面可用于管理业务术语,以及数据的定义

reference:

(1)https://cloud.tencent.com/developer/article/1078927

(2)http://39.100.211.182:7180/static/help/topics/cn_iu_audit_arch.html

(3)https://docs.cloudera.com/cdp-private-cloud/latest/upgrade-cdh/topics/atlas-migrating-new-to-cdh-users.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 221,635评论 6 515
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,543评论 3 399
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 168,083评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,640评论 1 296
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,640评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,262评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,833评论 3 421
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,736评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,280评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,369评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,503评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,185评论 5 350
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,870评论 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,340评论 0 24
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,460评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,909评论 3 376
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,512评论 2 359

推荐阅读更多精彩内容