本文档基于Apache Flink 1.4版本。
Apache Flink是一个开源的分布式流和批量数据处理平台。Flink的核心是一个流媒体数据流引擎,它为数据流的分布式计算提供数据分布,通信和容错能力。Flink在流媒体引擎之上构建了批处理,本地迭代支持,内存管理和程序优化能力。
First Steps
- 概念:从Flink的数据流编程模型和分布式运行环境的基本概念开始。它们会帮助你理解文档的其它部分,包括设置和编程指南。推荐你首先阅读这两部分。
- 快速开始:在你的本地机器上运行一个示例程序或者学习一些示例。
- 编程指南:可以通过阅读基本API概念指南和DataStream API或者DataSet API来学习如何开发你的Flink程序。
部署
在生产环境运行Flink job之前,请阅读生产准备清单。
升级向导
对于使用旧版本Apache Flink的用户,我们推荐API升级指南。虽然所有被标记为公开的和稳定的API部分仍然被支持(公共API是向后兼容的),但是我们建议将应用程序迁移到新的合适接口上。
对于计划升级Flink的用户,我们建议阅读升级Apache Flink文档。
外部资源
Flink Forward: Talks from past conferences are available at the Flink Forward website and on YouTube. Robust Stream Processing with Apache Flink is a good place to start.
Training: The training materials from data Artisans include slides, exercises, and sample solutions.
Blogs: The Apache Flink and data Artisans blogs publish frequent, in-depth technical articles about Flink.