240 发简信
IP属地:北京
  • Resize,w 360,h 240
    【Hive】MR 工作流程(数据流转)

    Hive是基于Hadoop的一个数据仓库工具。通过hive,我们可以方便地进行ETL的工作。Hive定义了一个类似于SQL的查询语言:HQL,能...

  • 【Hive】hql语法转MR任务

    Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能.说白了,hive就是MapReduce...

  • 四种优化 Apache Flink 应用程序的方法

    使用 Flink Tuples 当你使用类似于groupBy,join, 或者keyBy算子时,Flink 提供了多种用于在你的数据集上选择 k...