rpc可以说是一个分布式系统最基础的组件了。这里解析一下spark的内部rpc框架。 RpcEndpoint RpcEndpoint 这个接口表示一个Rpc端点,只要继承了这...
IP属地:北京
rpc可以说是一个分布式系统最基础的组件了。这里解析一下spark的内部rpc框架。 RpcEndpoint RpcEndpoint 这个接口表示一个Rpc端点,只要继承了这...
1. 前言 上次写Python操作LevelDB时提到过,有机会要实现下SkipList。摘录下wiki介绍: 跳跃列表是一种随机化数据结构,基于并联的链表,其效率可比拟二叉...
本套系列博客从真实商业环境抽取案例进行总结和分享,并给出Spark商业应用实战指导,请持续关注本套博客。版权声明:本套Spark商业应用实战归作者(秦凯新)所有,禁止转载,欢...
在学习flink的时候看了本书《Stream Processing with Apache Flink》。里面对Flink checkpoint的原理讲得挺清楚的,后面内部分...
简单之美 | Apache Flink:特性、概念、组件栈、架构及原理分析http://shiyanjun.cn/archives/1508.html Apache Flin...
Apache Flink(下简称Flink)项目是大数据处理领域最近冉冉升起的一颗新星,其不同于其他大数据项目的诸多特性吸引了越来越多人的关注。本文将深入分析Flink的一些...
背景 用户/内容画像的对存储的要求其实是比较高的: 能批量更新(比如更新所有用户某个属性) 大量随机读取(甚至可能没有热点数据) 随机属性更新/添加 可持久化 易于横向扩展解...
InfluxDB是一个开源的时序数据库,使用GO语言开发,特别适合用于处理和分析资源监控数据这种时序相关数据。而InfluxDB自带的各种特殊函数如求标准差,随机取样数据,统...