
三年前来到公司大数据团队,算是入了大数据的坑。一开始对大数据的组件不是很了解,一路走来在不停地学习探索。上周遇到了一个问题,我们数据地图的服务在...
这是我在排查一个开源项目 Gravitino[https://github.com/apache/gravitino] 线上问题时的实战记录。起...
摘要 本文深入分析了 Apache Hive Metastore 中 ALTER TABLE 操作,重点探讨了不同场景下分区元数据的更新策略。通...
什么是 Gravitino 引用官方文档 Apache Gravitino 是一个高性能、地理分布式、联邦式元数据湖。它能够直接管理不同数据源、...
前置知识: RDD 与算子: RDD(类似 Stream) RDD(弹性分布式数据集)是 Spark 的核心抽象,代表一个分布式的、不可变的数据...
函数组合是一项把多个函数合并到一个函数的技术。你可以自己将多个独立的函数合并成一个函数(比如一个或多个 Java Lambda 表达式),但是对...
概要 MapReduce 是一个处理和生成大数据集的程序模型和相关实现。用户定义一个 map 函数:处理一个 key/value 对生成一组中间...
Java 函数式接口 这个术语首先出自于 Java 8。Java 里的函数式接口 指的是一个接口只包含一个抽象方法。也就是说函数式接口可以包含拥...
一个高阶函数是指 一个函数使用函数作为参数或者执行完返回函数。在高阶函数教程中我将列举几个 Java 高阶函数的例子。 集合排序 高阶函数的第一...