参考网址:https://www.cnblogs.com/hei12138/p/7805475.html https://www.cnblogs...
1.什么是索引周期管理 定义:以时间为导向对数据进行应用策略操作。索引管理流程:热数据->暖数据->冷数据->数据归档->数据删除索引策略动作:...
1.grok表达式 Grok 是 Logstash 最重要的插件。你可以在 grok 里直接使用或应用预定义的表达式名称,grok 支持把预定义...
参考网址:官方文档、logstash示例 Logstash是一个开源数据收集引擎,具有实时管道功能。可以动态地将来自不同数据源的数据统一起来,并...
参考:http://opentsdb.net/docs/build/html/index.html、https://blog.csdn.net/...
Apache Flink是一个面向分布式数据流处理和批量数据处理的开源计算平台,它能够基于同一个Flink运行时,提供支持流处理和批处理两种类型...
1.Beam前世今生 分布式数据处理发展迅猛—> 新分布式数据处理技术越来越多 —>Hadoop MapReduce,Apache Spark,...
1.Lucene语法简介 Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,但它不...
Filebeat是本地文件的日志数据采集器,可监控日志目录或特定日志文件(tail file),并将它们转发给Elasticsearch或Log...
文集作者