最近看了看Flink中state方面的知识,Flink中的state是啥?state的作用是啥?为什么Flink中引入了state这个概念?既然最近的项目需要用到state,...
最近看了看Flink中state方面的知识,Flink中的state是啥?state的作用是啥?为什么Flink中引入了state这个概念?既然最近的项目需要用到state,...
Kafka作为一个支持大数据量写入写出的消息队列,由于是基于Scala和Java实现的,而Scala和Java均需要在JVM上运行,所以如果是基于内存的方式,即JVM的堆来进...
kinesis简介(什么是Kinesis) Amazon Kinesis 可以轻松收集、处理和分析实时视频和数据流 1、使用 Kinesis可以捕获,处理,存储video s...
原文:点这里该文章原文是俄文,被人翻译成了英文,整体风格略显生硬。不喜欢看的,可以直接跳过,看最后我增加的结论。另外,感谢@张健同学(一个着迷于源码的小鲜肉)的大力帮助~翻译...
前言 写这篇文章的契机是前段时间在Flink社区大群里详细解答了一个问题。 我们每天都会与JVM堆打交道(之前哪篇文章的开头也是这个来着)。但作为大数据工程师,我们对JVM的...
前言:掌握Hbase的重要性不言而喻,掌握Hbase的设计原理更是重中之重。本文是对HBase原理进行讲解系列文章的开篇,本文尽量详细的从整体上介绍HBase的架构,并对每个...
Flink为流处理和批处理分别提供了DataStream API和DataSet API。在开发工作中这些API极大的便利了开发者开发大数据应用。DataStream 在经过...
一.理解状态 1.什么是状态 其实是某一个时刻,计算的结果,一般是operator/task,保存在内存,由于Flink分布式的运行,所以根据体系结构runtime,会设计到...
Update:Canal与Camus的结合使用,见https://www.jianshu.com/p/4c4213385368。 Canal是阿里开源的一个比较有名的Java...