240 发简信
IP属地:广东
  • 120
    Apache Flink实战(一) - 初识Flink

    了解Flink是什么,Flink应用程序运行的多样化,对比业界常用的流处理框架,Flink的发展趋势,Flink生态圈,Flink应用场景及Flink如何进行高效的Flink...

  • 数仓--Theory--数仓的数据模型详解

    什么是数据模型 数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体及实体之间联系的形式,来表示现实世界中事务的相互关系的一种映射。在这里,数据模型表现得抽象得是实体...

  • 120
    Kafka+Spark Streaming如何保证exactly once语义

    在Kafka、Storm、Flink、Spark Streaming等分布式流处理系统中(没错,Kafka本质上是流处理系统,不是单纯的“消息队列”),存在三种消息传递语义(...

  • 120
    大数据技术,Spark之RDD,RDD超详细讲解(二)

    一、RDD的特性 Spark之所以成为目前比较主流的大数据处理技术,其中RDD的特性和机制占到很大比重,没有RDD的这些机制,Spark性能会大打折扣。总体而言,Spark采...