所以~~ 为什么没有选择Iceberg😂
Hudi Timeline简析前言 Long time no see(鞠躬 最近终于开始尝试推广Hudi在部门内部的应用,作为流批一体计划的最后一块拼图,顺便复活许久未更的博客,希望今后至少能保持周更的节...
所以~~ 为什么没有选择Iceberg😂
Hudi Timeline简析前言 Long time no see(鞠躬 最近终于开始尝试推广Hudi在部门内部的应用,作为流批一体计划的最后一块拼图,顺便复活许久未更的博客,希望今后至少能保持周更的节...
2021年的最后几个小时了,抽空来写几笔。待会儿再揭晓年度最佳单曲。 健康 新冠疫情仍然没有趋缓的迹象。看着近期又开始上涨的确诊病例数,还有承载着不同生活轨迹的流调报告,有时...
给别人的歌,最终也会是给自己的歌。 一切为了辉煌的明天。 再见,祝好~ 2021年1月动画《奇蛋物语》(Wonder Egg Priority)片头曲https://y.qq...
公司运营免不了让我们数据做一些临时取数,这些取数有时候是重复的,或者可以做成可配置的。需要开发成界面,供他们选择,自然想到SpringBoot连接Hive,可以把取数做成一键...
1 RPC简介 RPC,全称为Remote Procedure Call,即远程过程调用,它是一个计算机通信协议。它允许像调用本地服务一样调用远程服务。它可以有不同的实现方式...
文首,思考一个问题:为什么需要 RPC 服务? 在传统的开发模式中,我们通常将系统的各个服务部署在单台机器,随着服务的扩展,这种方式已经完全无法满足系统大规模的扩展需要,分布...
文首,思考一个问题:为什么需要 RPC 服务? 在传统的开发模式中,我们通常将系统的各个服务部署在单台机器,随着服务的扩展,这种方式已经完全无法满足系统大规模的扩展需要,分布...
加油~~ 偶然看到 我叫丛培欣😄
2021-12-19【日精进打卡第1401天】 【知~学习】 《六项精进》 《大学》 【读书】 1、《董明珠传》OK 2、《从总账到总监》103 3、《活法》二遍OK 4、《经营者养成笔记》OK...
我的个人博客地址:http://swaiter.github.io根据RPC框架原理,手写一个mini版RPC 在实际后台服务开发中,RPC框架具有很大的优势,其中当前dub...
一个完整的极简后台框架,方便做小项目的时候可以快速开发。这里面多贴图片和代码,做个参考吧,代码可以下载下来自己看看,里面这套后台模板不错,喜欢的拿去。 先放几张图 项目介绍 ...
前言 由上篇博客我们知道了SparkSql整个解析流程如下: sqlText 经过 SqlParser 解析成 Unresolved LogicalPlan; analyze...
前言 近些年来,大数据领域“SQL化开发”的理念蔚然成风,这是因为SQL是一种通用、学习成本低的语言,并且还有较强的数据描述能力。不少大数据框架早已支持了SQL化开发,如Sp...
CatalystCatalyst是与Spark解耦的一个独立库,是一个impl-free的执行计划的生成和优化框架。目前与Spark Core还是耦合的,对此user邮件组里...
在前面的文章《spark基础(上篇)》和《spark基础(下篇)》里面已经介绍了spark的一些基础知识,知道了spark sql是spark中一个主要的框架之一。本文我们通...
本文首发于 vivo互联网技术 微信公众号 https://mp.weixin.qq.com/s/YPN85WBNcnhk8xKjTPTa2g作者:李勇 目录: 1.Spar...
@俩只猴 哈哈哈哈 自己的技术栈以及遇到的问题,完全被大佬cover住了
Chandy-Lamport分布式快照算法小记Prologue 前面陆陆续续写了几篇关于Flink的浅显的小文章,其中多次提到了“异步屏障快照(asychronous barrier snapshot, ABS)算法”这...
两个大佬~~
基于ClickHouse的用户行为(路径)分析实践前言 ClickHouse为用户提供了丰富的多参聚合函数(parametric aggregate function)和基于数组+Lambda表达式的高阶函数(higher-...
今天为小伙伴们做了ClickHouse入门的技术分享(确实好用),把做的PPT贴在下面当做今日份吧。 多图预警~ 紫薯布丁紫薯布丁紫薯布丁紫薯布丁紫薯布丁紫薯布丁紫薯布丁紫薯...