本主要介绍在 Kafka 中如何配置 Kerberos 认证,文中所使用到的软件版本:Java 1.8.0_261、Kafka_2.12-2.6...
定义 对于一个处理无界数据流的 pipeline 而言,非常需要一个衡量数据完整度的指标,用于标识什么时候属于某个窗口的数据都已到齐,窗口可以执...
本章中,我们将通过对 What,Where,When,How 这 4 个问题的回答,逐步揭开流处理过程的全貌。 What:计算什么结果?也就是我...
数据的价值在其产生之后,将随着时间的流逝逐渐降低。因此,为了获得最大化的数据价值,尽可能实时、快速地处理新产生的数据就显得尤为重要。实时数据处理...
EventTimeTrigger EventTimeTrigger 的触发完全依赖 watermark,换言之,如果 stream 中没有 wa...
简介 数据集中的变量通常具有不同的量纲和数量级,当不同变量的取值相差较大时,如果直接使用原始值进行分析,就会突出取值较大的变量的作用,削弱取值较...
环形柱状图 环形柱状图只是把普通的柱状图进行了极坐标旋转,但是观感马上提升了一个 level,看一下效果决定要不要阅读全文~ 环形柱状图的 la...
简介 主成分分析(Principal Component Analysis,PCA)是一种无监督的数据降维方法,通过主成分分析可以尽可能保留下具...
效果预览: 本文介绍了 shiny 如何实现信息的增删改查,并将数据持久化到 SQLite 数据库中。 首先在 SQLite 数据库中新建表 u...