【NIFI】1.NIFI入门

NIFI是什么

Apache NIFI是一个易于使用,功能强大且可靠的系统,用于处理分发数据 ,可以自动化管理系统间的数据流。
优点:

NIFI核心组件概念

NIFI思想可以完全契合FBP(Flow Based Programing)的设计思想,主要核心组件及其概念如下表所示:

NIFI组件 概念
FlowFile FlowFile代表通过系统移动的每个对象,对于每个对象,NiFi都会跟踪键/值对属性字符串及其零个或多个字节的关联内容的映射。FlowFile中有attribute和content
Processor 处理器是在系统之间进行数据路由,转换或中介的某种组合。处理器可以访问给定FlowFile及其内容流的属性。处理器可以在给定的工作单元中对零个或多个FlowFiles进行操作,并提交该工作或回滚。
Connection 连接提供了处理器之间的实际链接。这些充当队列,并允许各种进程以不同的速率进行交互。这些队列可以动态地进行优先级排序,并且可以在负载上设置上限,从而可以实现背压。
Flow Controller 流控制器维护有关进程如何连接以及管理所有进程使用的线程及其分配的知识。流控制器充当代理,促进处理器之间的FlowFiles交换。
Group 进程组是一组特定的进程及其连接,可以通过输入端口接收数据,并通过输出端口发送数据。以这种方式,过程组允许仅通过其他组件的组合来创建全新的组件。

NIFI优点:

NIFI架构

NIFI架构.jpg

Web Server:承载nifi基于http的命令和控制API
Flow Controller:整个操作的核心,为将要运行的组件提供线程,管理调度
Extensions:基于JVM运行,支持各类java的NiFi扩展
FlowFile Repository:跟踪存储FlowFile状态数据
Content Repository:存储FlowFile内容数据
Provenance Repository:源头存储库,存储所有事件数据

NiFi 集群架构

NIFI集群.jpg

NIFI集群零主模式
Cluster Coordinator:集群协调器,管理节点的添加删除等操作逻辑
Primary Node:主节点,用来运行一些不适合在从节点运行的组件
Zookeeper Client:zk节点

NiFi的性能

NiFi的设计目的是充分利用底层主机系统能力,这种资源的最大化在CPU和磁盘方面尤为明显。基于For IO,For CPU,For RAM优化。

NiFi 的关键特性

流管理:保证交付,数据缓冲 背压和压力释放,队列优先级,特殊流质量
易用性:可视化流程,流模板,数据起源跟踪,可以记录和重放细粒度历史记录缓冲区
灵活的缩放模型:水平扩展,扩展和缩小

NiFi入门

  • FlowFile:每条“用户数据”(即用户带入NiFi进行处理和分发的数据)均称为FlowFile。FlowFile由两部分组成:属性和内容。内容是用户数据本身。属性是与用户数据关联的键/值对。
  • processor:处理器是NiFi组件,负责创建,发送,接收,转换,路由,拆分,合并和处理FlowFiles。它是NiFi用户可用来构建其数据流的最重要的构建块。

运行开发环境,下载安装jdk
下载:NiFi官网 https://nifi.apache.org/download.html
修改默认端口:/conf/nifi.properties 137 nifi.web.http.port=58080
Linux 启动:进入安装目录 前台运行bin/nifi.sh run 后台运行 bin/nifi.sh start,查看nifi状态bin/nifi.sh status
作为服务进行安装bin/nifi.sh installbin/nifi.sh install [服务名],启动时service nifi start

常用的处理器

配置处理器

其他组件

数据流传入点(input-port):用于组与组之间的数据连接
数据流输出点(output-port):
组(process-group):
远程组(remote process-group):
聚合(funnel):将多connection的数据整合到一个connection
模板(template):将若干组件整合成一个组,从该组创建数据流模板,模板可以到处XML格式
便签(label):写备注信息
导航(Navigate):
操作区(Operate):

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,029评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,238评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,576评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,214评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,324评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,392评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,416评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,196评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,631评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,919评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,090评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,767评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,410评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,090评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,328评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,952评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,979评论 2 351

推荐阅读更多精彩内容

  • NiFi基本概念 概述 简单地说,NiFi是为了自动化系统之间的数据流而构建的。虽然术语“数据流”在各种环境中使用...
    菜鸟Coders阅读 7,287评论 0 3
  • Apache nifi 开发指南 版本:V 1.6 日期:2018年6月13日 [if !supportLists...
    行走的数据智能阅读 8,284评论 0 1
  • 1.NiFi简介 Apache Nifi是一个易用、强大、可靠的数据处理和分发系统。 主要功能:数据流程管理,设计...
    一个老冯阅读 929评论 0 0
  • 1.介绍 本开发人员指南的目的是为读者提供了解Apache NiFi扩展的开发方式所需的信息,并帮助他们解释开发组...
    小王爱写BUG阅读 965评论 0 1
  • 为了能够创建一个高效的NiFi数据数据流程,我们需要了解有哪些Processor类型可以使用。每个新的NiFi版本...
    一个老冯阅读 1,170评论 0 0