240 发简信
IP属地:上海
  • Flink 源码解读(四) Flink DataSream 双流 Join 实现

    Flink DataStream 实现双流 Join 的主要方式有 WindowJoin、connect 和 IntervalJoin ,以下从...

  • github

    参考资料 利用git提交代码

  • Resize,w 360,h 240
    大数据开发工程师面试题

    1. mapreduce (1) mapreduce 流程 读取 HDFS 文件,每行解析成一个 <K,V> 对。 利用自定义的 map 函数,...

  • Kylin

    参考资料 介绍 使用

  • Resize,w 360,h 240
    Hive

    1. 简介 Hive是一款基于Hadoop的数据仓库工具,设计初衷就是使不擅长编程的数据分析人员也能参与到大数据中来,常用功能是数据提取转化加载...

  • Resize,w 360,h 240
    操作系统监控命令

    常用命令 top 命令输出结果 vmstat 命令输出结果 iostat 命令输出结果 free 命令输出结果 参考资料 Shell脚本查看li...

  • Scala

    实战代码 test-scala

  • Resize,w 360,h 240
    Kafka 调研

    1. 基本概念 2. 重要配置 2.1 有序性保证 对于有序性要求严格的场景,将 retries 时间设置为 Broker 主从切换时间,次数设...