IP属地:北京
要开始一个 Flink 作业,通常需要如下依赖项:
业务场景 假设批量有一张商户表,表字段中有商户名称和商户分类两个字段。 批量需要将最新的商户名称和分类的映射关系推到hbase供实时使用。 原实...
近日阅读了黄有璨老师的《运营之光》,读下来感觉运营这个岗位也是不甚容易,对运营同学的工作有了些模糊的认识。现摘录书中部分印象深刻的片段,以便再回...
在Flink中,各个组件之间需要频繁交换数据和控制信息。Flink选择了基于Actor模型的Akka框架作为通信基础。 Akka是什么 Acto...
引言:市场格局的转变 在供应短缺的年代,是典型的卖方市场。为了保证稳定供货,买方会提前一段时间下单,也几乎没什么议价能力。卖方只需等着接单就行。...
实时批量融合计算时,一般需要批量将数据推送到hbase供实时使用。 本文将通过两个典型场景--累计场景与最新分区场景,讨论批量和实时衔接的设计方...
Flink中的序列化应用场景 程序通常使用(至少)两种不同的数据表示形式[2]:
引言 在海量数据的存储与检索中,如何在保持快速检索的同时,降低内存占用是个巨大的挑战。有没有一种既能快速检索又能节省内存的方案?布隆过滤器(Bl...
问题背景 在数据监控领域,数据质量决定了数据的可用性。然而频繁的数据质量问题源于多种诱因。 一般我们需要及时配置好监控,以便能在第一时间检测到异...