第一章初识Kafka

1.1 Kafka之前发布与订阅消息系统存在的问题

1、多个发布者之间直连

2、多个独立的队列系统

需要的是一个单一的集中式系统，可以用来发布通用类型的数据，规模也可以随着公司业务增长而增长。

1.2 Kafka登场

Kafka是为了解决上述问题而出现的一款基于发布与订阅的消息系统。

1.2.1 消息与批次

消息是Kafka的数据单元，相当于数据库的一个数据行或者是一条记录。由字节数组组成。

为提高效率，消息会被分批次写入Kafka。批次是一组消息。批次可以减少网络开销，但是会存在时间延迟，所以需要在时间延迟和吞吐量之间做出权衡。批次数据会被压缩。

1.2.2 模式

消息模式：

JSON、XML，简单易用、可读性好。

Avro 提供一种紧凑的序列号格式，模式与消息体是分开的，模式发生变化时不需要重新生成代码；还支持强类型和模式进化。

1.2.3 主题与分区

主题：相当于数据库的表

一个主题可以有一到多个分区

消息以追加方式写入分区，数据结构类似于Java的队列，先入先出顺序读取。由于一个主题一般有若干个分区，所以无法在整个主题范围内包装消息的顺序，但是可以保证在单个分区内的顺序。

1.2.4 生产者和消费者

生产者：默认情况下消息会被均衡的分布到主题所有分区上，并不关系特定消息会被写到哪个分区。某些情况下会把消息写到指定分区。通常是通过消息键和分区器来实现的。

消费者：订阅一个或多个主题，按照消息生成的顺序读取它们。消费者通过检查消息的偏移量来区分已经读取过的消息。偏移量是另一种元数据，是一个不断递增的整数值，在创建消息时，Kafka会把它添加到消息里。

消费者是消费者群组的一部分，会有一个或多个消费者共同读取同一个主题。

1.2.5 broker和集群

一个独立的Kafka服务器叫做broker。broker接收来自生产者的消息，为消息设置偏移量，并提及消息保存到磁盘。单个broker可以轻松处理数千个分区以及每秒百万级的消息量。

集群包含多个broker。有一个broker充当集群控制器的角色。在集群中，如果一个分区属于一个broker，那么该broker称为该分区的首领；如果一个分区分配给多个broker，会发生分区复制提供分区冗余，这样当一个broker失效其他broker可以接管。

1.2.6 多集群

基于以下原因，最好使用多集群

1、数据类型分离

2、安全需求隔离

3、多数据中心（灾备）

需注意：Kafka的消息复制只能在单集群里进行，不能在多集群之间进行。

Kafka提供了一个MirrorMaker的工具，可以用它来实现集群间复制。

1.3 为什么选择Kafka

1.3.1 多个生产者

可以无缝的支持多个生产者，不管客户端在使用单个主题还是多个主题。所以很适合从多个前端系统收集数据并以统一格式对外提供数据。

1.3.2 多个消费者

支持多个消费者从一个单独的消息流上读取数据，而且消费者之间互不影响。多个消费者可以组成一个消费群组，共享一个消息流，并保证整个群主对给定的消息只消费一次。

1.3.3 基于磁盘的数据存储

允许非实时消费，提供持久化到磁盘，根据设置的规则进行读取。

1.3.4 伸缩性

可灵活伸缩扩容。

1.3.5 高性能

通过横向扩展生产者、消费者、broker，Kafka可轻松处理巨大的消息流。处理大量数据的同时能保证亚秒级的消息延迟。

1.4 数据生态系统

Kafka为数据生态系统带来了循环系统，在基础设施各个组件之间传递消息，为所有客户端提供统一的接口。当提供消息模式的系统集成时，生产者与消费者之间不再有紧密的耦合，也不需再建立任何类型直连。

使用场景

1、活动跟踪。Kafka最初使用场景，收集前端用户交互的数据

2、传递消息。

3、度量指标和日志记录

4、提交日志

5、流处理。与Hadoop的map和reduce类似，不过是操作实时数据流

1.5 起源故事

Kafka是为了解决LinkedIn数据管道问题而生的。

1.5.4 命名

Jay Kreps大学上过很多文学课程，很喜欢Franz Kafka

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,496评论 6赞 501
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,407评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,632评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,180评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,198评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,165评论 1赞 299
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,052评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,910评论 0赞 274
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,324评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,542评论 2赞 332
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,711评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,424评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,017评论 3赞 326
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,668评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,823评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,722评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,611评论 2赞 353

第一章 初识Kafka