Apache NIFI CompareFuzzyHash

CompareFuzzyHash


编辑人(全网同名):酷酷的诚 邮箱:zhangchengk@foxmail.com


描述

将包含模糊哈希的属性与包含模糊哈希列表的文件进行比较,如果匹配成功,则将属性添加到FlowFile。

属性配置

在下面的列表中,必需属性的名称以粗体显示。任何其他属性(不是粗体)都被认为是可选的,并且指出属性默认值(如果有默认值),以及属性是否支持表达式语言。

属性名称 默认值 可选值 描述
Hash List source file 包含要验证的哈希的文件的路径
Hashing Algorithm ▪ssdeep
▪tlsh
哈希算法
Hash Attribute Name fuzzyhash.value 应该保存模糊哈希值的FlowFile属性的名称
Match threshold 相似性分数必须超过或等于匹配才被视为正确。有关TLSH和SSDEEP分数之间的差异以及它们与该属性的关系,请参阅其他信息。
Matching mode single ▪single
multi-match
定义处理器是应该尝试匹配尽可能多的条目(多次匹配)还是在第一个匹配项之后停止(单个)

连接关系

名称 描述
failure 任何无法匹配的FlowFile,例如(缺少属性)将被发送到此关系。
not-found 无法与现有哈希匹配的任何FlowFile将被发送到此关系。
found 成功与现有哈希匹配的任何FlowFile都将发送到此关系。

读取属性

没有指定。

写属性

名称 描述
XXXX.N.match <Hash Attribute Name>属性指定的属性相似的匹配。请注意:“XXX”被替换为<Hash Attribute Name>
XXXX.N.similarity 此流文件及其匹配的相同数字N之间的相似性得分。请注意:“XXX”被替换为<Hash Attribute Name>

状态管理

此组件不存储状态。

限制

此组件不受限制。

输入要求

此组件需要传入关系。

系统资源方面的考虑

没有指定。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。