第2章 安装kafka 本章介绍Apache Kafka broker的入门知识,包括如何搭建Apache ZooKeeper集群, Kafka使用ZooKeeper为bro...
第2章 安装kafka 本章介绍Apache Kafka broker的入门知识,包括如何搭建Apache ZooKeeper集群, Kafka使用ZooKeeper为bro...
理想情况下,在Kubernetes上部署应用程序的开发人员不需要知道集群提供了什么存储技术,就像他们不需要知道用于运行pod的物理服务器的特征一样。基础架构的细节应该由运行集...
译者有话说 这是一本非常适合数据架构师或准数据架构师阅读的书!当前IT行业,越来越多的数据仓库基于云环境创建,越来越多的数据仓库要求实时性,越来越多的数仓新技术涌现,数据架构...
管道概念与设计 什么是管道? 管道描述了从源头系统到目标系统的数据流,并定义了在此过程中如何转换数据。 可以使用单个origin(初始)阶段表示源头系统,使用多个proces...
Spark The Definitive Guide(Spark权威指南) 中文版。本书详细介绍了Spark2.x版本的各个模块,目前市面上最好的Spark2.x学习书籍!!...
Spark The Definitive Guide(Spark权威指南) 中文版。本书详细介绍了Spark2.x版本的各个模块,目前市面上最好的Spark2.x学习书籍!!...
15.3 使用UDAFs构建自定义聚合 在前面的小节中,您快速回顾了聚合数据,在简单数据集上执行了聚合操作,并最终处理了真实的数据。在这些操作中,使用了包括max()、avg...
Streamsets简介及概述 StreamSets Data Collector是一个功能强大的企业级流处理平台,可以使用该平台来接入数据,处理数据,输出数据,支持来自各种...
关注公众号:登峰大数据,阅读Spark实战第二版(完整中文版),系统学习Spark3.0大数据框架! 如果您觉得作者翻译的内容有帮助,请分享给更多人。您的分享,是作者翻译的动...
关注公众号:登峰大数据,阅读Spark实战第二版(完整中文版),系统学习Spark3.0大数据框架! 如果您觉得作者翻译的内容有帮助,请分享给更多人。您的分享,是作者翻译的动...
本章包括: 获取关于AI历史的观点 理解机器学习与AI的关系 探索人工智能应用爆炸的驱动因素 人工智能(AI)并不是一项新技术。几十年来,计算机科学家尝试了不同的方法来达到计...