Kafka原理总结

构成：

1.producer:

producer直接发消息到broker，broker会返回一些topic的元数据信息，比如：这些元信息包括哪些机器是存活的，topic的leader partition都在哪，现阶段哪些leader partition是可以直接被访问的

2.consumers

1).high-level-api:维持了已消费消息的状态，每次消费的都是下一个消息；还支持以组的形式来消费topic；

2).simple-api:底层api，维持了一个和单一broker的连接，并且这个API是完全无状态的，每次请求需要指定offset值，可以通过设置offset值来重复读取

消费过的数据

3.broker:

1).partitions:

topic是以partition的形式存放的，可配置

2).replications:

备份机制，实现多个备份，防止单个broker挂了后，数据不会丢失

3).leaders:

partition的副本中只有一个会被选举为leader，用来进行读写

核心特性：

1.压缩：

kafka支持以集合为单位发送消息，在此基础上，kafka还支持对消息集合进行压缩，producer端可以通过GZIP或SNAPPY格式进行压缩，然后在

consumer端进行解压，在大数据处理上，性能瓶颈往往体现在网络上而不是CPU.

如何区别消息是否被压缩，kafka在消息头部添加了一个描述压缩属性的字节，这个字节的后两位表示消息压缩采用的编码，如果后两位是0，说明

没有被压缩

2.消息可靠性：

为了防止消息丢失、多次发送等情况，kafka采用如下处理：

1).producer端：producer会等待borker成功接收消息的反馈（可通过参数设置来控制等待时间），如果消息丢失或者broker挂了，producer会重新

发送（通过参数控制是否等待所有备份节点都收到消息）

2).consumer端：consumer收到消息，但是在处理过程中挂了，此时consumer会通过offset值重新找到上一个消息在进行处理.当然，consumer还

有权限控制这个offset值.

3.备份机制:

0.8版本新特性，一个备份数量为n的集群允许n-1个节点失败.在所有备份节点中，有一个节点作为lead节点，这个节点保存了其它备份节点列表，并维持各个备份间的状体同步

4.高效性相关设计：

4.1).消息的持久化

磁盘性能事实：磁盘驱动器的吞吐量跟寻到延迟是相背离的，也就是所，线性写的速度远远大于随机写，举例：在一个6 7200rpm SATA

RAID-5 的磁盘阵列上线性写的速度大概是600M/秒，但是随机写的速度只有100K/秒，两者相差将近6000倍

顺序I/O是为了提高读写硬盘的速度

4.2).常数时间性能保证

一个持久化的队列可以构建在对一个文件的读和追加上，kafka数据持久化就是两个文件，一个保存数据（.log文件），一个保存offset相关信

息（.index文件）

4.3).更多的效率考虑

1).为了减少大量小IO操作，kafka都是以消息块的形式来追加消息到log中的

2).为了减小过多的字节拷贝，kafka设计了标准字节消息，producer、consumer、broker共享这一中消息格式

Memory Mapped Files：内存映射文件->直接利用操作系统的Page来实现文件到物理内存的映射，省去了用户空间到内核空间的赋值开销

（调用文件的read会把数据先放到内核空间的内存中，然后再复制到用户空间的内存中）

注：Java NIO提供了MappedByteBuffer来实现内存映射

性能瓶颈：

1.网络传输

2.磁盘吞吐量

最后编辑于：2018.08.17 18:31:15

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,324评论 6赞 498
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,356评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,328评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,147评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,160评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,115评论 1赞 296
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,025评论 3赞 417
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,867评论 0赞 274
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,307评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,528评论 2赞 332
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,688评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,409评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,001评论 3赞 325
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,657评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,811评论 1赞 268
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,685评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,573评论 2赞 353

Kafka原理总结

推荐阅读更多精彩内容