又见Rescale 笔者在很久之前的一篇文章(传送门[https://www.jianshu.com/p/f0a13f98dac2])中讲解过Flink的状态缩放(Resca...
又见Rescale 笔者在很久之前的一篇文章(传送门[https://www.jianshu.com/p/f0a13f98dac2])中讲解过Flink的状态缩放(Resca...
前言 本文前半部分的内容在很久之前讲过,但是最近又有交接到团队内的历史任务出现这方面导致的性能问题,故有必要再讲一次,并扩展一部分新内容。先通过两个例子来引入Java类型擦除...
前言 Elasticsearch不仅是强大的全文搜索引擎,在很多场景下(特别是TiDB、ShardingSphere等框架成熟之前)也被当做分布式HTAP数据库使用,在存储、...
重操旧业。 2024年4月动画《夜晚的水母不会游泳》第5话插曲https://y.qq.com/n/ryqq/songDetail/498420410?songtype=0[...
前言 单指令流多数据流(SIMD)及其衍生出来的向量化处理技术已经有了相当的历史,并且也是高性能数据库、计算引擎、多媒体库等组件的标配利器。笔者在两年多前曾经做过一次有关该主...
前言 大家已经了解,StarRocks的更新模型、主键模型等在Flush和Compaction过程中会产生历史版本数据,这些垃圾数据需要及时被清理,以防止存储空间浪费。而St...
前言 当我们自建大数据集群(如OLAP集群、实时计算集群、分布式存储集群、全文搜索集群等)的时候,除了硬件资源要合理配备外,在操作系统层面也要进行一些事前配置,让大数据组件能...
前言 我们知道,列式存储的数据组织形式使得它适合海量数据在线查询、分析的场景,而写入性能相对于读取性能似乎并不那么重要(传统的ORC / Parquet on Hive方案就...
因为跨年有霓虹出游计划,所以稍微打破一下传统,选在平安夜发布2023年度最佳单曲。 今年的Top 1是来自著名Indie乐团Mili的「Excαlibur」,同时是近十年来所...