240 发简信
IP属地:北京
  • 浅议Flink lib包下的依赖项

    要开始一个 Flink 作业,通常需要如下依赖项:

  • Resize,w 360,h 240
    Flink如何基于数据版本使用最新离线数据

    业务场景 假设批量有一张商户表,表字段中有商户名称和商户分类两个字段。 批量需要将最新的商户名称和分类的映射关系推到hbase供实时使用。 原实...

  • Resize,w 360,h 240
    杂谈:《运营之光》读后感

    近日阅读了黄有璨老师的《运营之光》,读下来感觉运营这个岗位也是不甚容易,对运营同学的工作有了些模糊的认识。现摘录书中部分印象深刻的片段,以便再回...

  • Resize,w 360,h 240
    浅议Flink中的通讯工具: Akka

    在Flink中,各个组件之间需要频繁交换数据和控制信息。Flink选择了基于Actor模型的Akka框架作为通信基础。 Akka是什么 Acto...

  • Resize,w 360,h 240
    杂谈:业务说的场景金融是什么?

    引言:市场格局的转变 在供应短缺的年代,是典型的卖方市场。为了保证稳定供货,买方会提前一段时间下单,也几乎没什么议价能力。卖方只需等着接单就行。...

  • 实时离线融合计算的数据同步实践

    实时批量融合计算时,一般需要批量将数据推送到hbase供实时使用。 本文将通过两个典型场景--累计场景与最新分区场景,讨论批量和实时衔接的设计方...

  • Resize,w 360,h 240
    初探Flink的序列化

    Flink中的序列化应用场景 程序通常使用(至少)两种不同的数据表示形式[2]:

  • Resize,w 360,h 240
    布隆过滤器:极简存储,高效检索

    引言 在海量数据的存储与检索中,如何在保持快速检索的同时,降低内存占用是个巨大的挑战。有没有一种既能快速检索又能节省内存的方案?布隆过滤器(Bl...

  • 数据波动中的阈值设定:绝对值or百分比

    问题背景 在数据监控领域,数据质量决定了数据的可用性。然而频繁的数据质量问题源于多种诱因。 一般我们需要及时配置好监控,以便能在第一时间检测到异...

个人介绍
公中号:大数据咖啡屋