data_shl - 简书

IP属地：北京

浅议Flink lib包下的依赖项
要开始一个 Flink 作业，通常需要如下依赖项：

1279 0 0
Flink如何基于数据版本使用最新离线数据
业务场景假设批量有一张商户表，表字段中有商户名称和商户分类两个字段。批量需要将最新的商户名称和分类的映射关系推到hbase供实时使用。原实...

1112 0 0

杂谈：《运营之光》读后感
近日阅读了黄有璨老师的《运营之光》，读下来感觉运营这个岗位也是不甚容易，对运营同学的工作有了些模糊的认识。现摘录书中部分印象深刻的片段，以便再回...

818 0 0
浅议Flink中的通讯工具: Akka
在Flink中，各个组件之间需要频繁交换数据和控制信息。Flink选择了基于Actor模型的Akka框架作为通信基础。 Akka是什么 Acto...

1657 0 0
杂谈：业务说的场景金融是什么？
引言：市场格局的转变在供应短缺的年代，是典型的卖方市场。为了保证稳定供货，买方会提前一段时间下单，也几乎没什么议价能力。卖方只需等着接单就行。...

1342 0 0
实时离线融合计算的数据同步实践
实时批量融合计算时，一般需要批量将数据推送到hbase供实时使用。本文将通过两个典型场景--累计场景与最新分区场景，讨论批量和实时衔接的设计方...

1252 0 0
初探Flink的序列化
Flink中的序列化应用场景程序通常使用(至少)两种不同的数据表示形式[2]：

1184 0 0

布隆过滤器：极简存储，高效检索
引言在海量数据的存储与检索中，如何在保持快速检索的同时，降低内存占用是个巨大的挑战。有没有一种既能快速检索又能节省内存的方案？布隆过滤器（Bl...

1616 0 0
数据波动中的阈值设定：绝对值or百分比
问题背景在数据监控领域，数据质量决定了数据的可用性。然而频繁的数据质量问题源于多种诱因。一般我们需要及时配置好监控，以便能在第一时间检测到异...

1216 0 0