240 发简信
IP属地:四川
  • Resize,w 360,h 240
    Gravitino 与 Spark 集成 (纯源码分析)

    背景 在上一期介绍了 Gravitino 的概念以及解决了什么问题,现在介绍下 Gravitino 如何与 Spark 集成,毕竟 Spark ...

    4.2 23 0 1
  • Java G1 GC 调优实战总结 — 从内存占用到GC停顿优化

    一、背景介绍 某Java应用,堆内存5.6GB,GC停顿时间过长,年轻代GC也经常超过1秒,影响响应和系统稳定性。初始GC参数: 堆中年轻代占比...

    0.2 13 0 1
  • Resize,w 360,h 240
    【大数据】Kerberos 认证问题导致服务 OOM

    三年前来到公司大数据团队,算是入了大数据的坑。一开始对大数据的组件不是很了解,一路走来在不停地学习探索。上周遇到了一个问题,我们数据地图的服务在...

  • JDBC连接池被耗尽?一次SqlSession未关闭引发的排查记录

    这是我在排查一个开源项目 Gravitino[https://github.com/apache/gravitino] 线上问题时的实战记录。起...

  • 【Hive】Alter Table 逻辑

    摘要 本文深入分析了 Apache Hive Metastore 中 ALTER TABLE 操作,重点探讨了不同场景下分区元数据的更新策略。通...

  • Resize,w 360,h 240
    元数据湖-Gravitino 整体概况

    什么是 Gravitino 引用官方文档 Apache Gravitino 是一个高性能、地理分布式、联邦式元数据湖。它能够直接管理不同数据源、...

    0.2 49 0 1
  • Resize,w 360,h 240
    浅聊 Spark DAG

    前置知识: RDD 与算子: RDD(类似 Stream) RDD(弹性分布式数据集)是 Spark 的核心抽象,代表一个分布式的、不可变的数据...

  • Java 函数组合

    函数组合是一项把多个函数合并到一个函数的技术。你可以自己将多个独立的函数合并成一个函数(比如一个或多个 Java Lambda 表达式),但是对...

  • Resize,w 360,h 240
    【译】MapReduce: 在大规模机器上的简易数据处理

    概要 MapReduce 是一个处理和生成大数据集的程序模型和相关实现。用户定义一个 map 函数:处理一个 key/value 对生成一组中间...

个人介绍
我是一个爱健身程序员,对函数式编程,异步编程感兴趣。