Kafka原理总结

构成:

1.producer:

    producer直接发消息到broker,broker会返回一些topic的元数据信息,比如:这些元信息包括哪些机器是存活的,topic的leader partition都在哪,现阶段哪些leader partition是可以直接被访问的

2.consumers

    1).high-level-api:维持了已消费消息的状态,每次消费的都是下一个消息;还支持以组的形式来消费topic;

    2).simple-api:底层api,维持了一个和单一broker的连接,并且这个API是完全无状态的,每次请求需要指定offset值,可以通过设置offset值来重复读取    

                             消费过的数据

3.broker:

    1).partitions:

        topic是以partition的形式存放的,可配置

    2).replications:

        备份机制,实现多个备份,防止单个broker挂了后,数据不会丢失

    3).leaders:

        partition的副本中只有一个会被选举为leader,用来进行读写

核心特性:

    1.压缩:

            kafka支持以集合为单位发送消息,在此基础上,kafka还支持对消息集合进行压缩,producer端可以通过GZIP或SNAPPY格式进行压缩,然后在

            consumer端进行解压,在大数据处理上,性能瓶颈往往体现在网络上而不是CPU.

            如何区别消息是否被压缩,kafka在消息头部添加了一个描述压缩属性的字节,这个字节的后两位表示消息压缩采用的编码,如果后两位是0,说明

            没有被压缩

    2.消息可靠性:

            为了防止消息丢失、多次发送等情况,kafka采用如下处理:

            1).producer端:producer会等待borker成功接收消息的反馈(可通过参数设置来控制等待时间),如果消息丢失或者broker挂了,producer会重新

                                     发送(通过参数控制是否等待所有备份节点都收到消息)

            2).consumer端:consumer收到消息,但是在处理过程中挂了,此时consumer会通过offset值重新找到上一个消息在进行处理.当然,consumer还

                                    有权限控制这个offset值.

    3.备份机制:

            0.8版本新特性,一个备份数量为n的集群允许n-1个节点失败.在所有备份节点中,有一个节点作为lead节点,这个节点保存了其它备份节点列表,并维持各个备份间的状体同步

     4.高效性相关设计:

            4.1).消息的持久化

                    磁盘性能事实:磁盘驱动器的吞吐量跟寻到延迟是相背离的,也就是所,线性写的速度远远大于随机写,举例:在一个6 7200rpm SATA 

                                             RAID-5 的磁盘阵列上线性写的速度大概是600M/秒,但是随机写的速度只有100K/秒,两者相差将近6000倍

                    顺序I/O是为了提高读写硬盘的速度

            4.2).常数时间性能保证

                    一个持久化的队列可以构建在对一个文件的读和追加上,kafka数据持久化就是两个文件,一个保存数据(.log文件),一个保存offset相关信 

                   息(.index文件)

            4.3).更多的效率考虑

                    1).为了减少大量小IO操作,kafka都是以消息块的形式来追加消息到log中的

                    2).为了减小过多的字节拷贝,kafka设计了标准字节消息,producer、consumer、broker共享这一中消息格式

                        Memory Mapped Files:内存映射文件->直接利用操作系统的Page来实现文件到物理内存的映射,省去了用户空间到内核空间的赋值开销

                                                             (调用文件的read会把数据先放到内核空间的内存中,然后再复制到用户空间的内存中)

                                                                注:Java NIO提供了MappedByteBuffer来实现内存映射

性能瓶颈:

    1.网络传输

    2.磁盘吞吐量

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,324评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,356评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,328评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,147评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,160评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,115评论 1 296
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,025评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,867评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,307评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,528评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,688评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,409评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,001评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,657评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,811评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,685评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,573评论 2 353

推荐阅读更多精彩内容

  • 姓名:周小蓬 16019110037 转载自:http://blog.csdn.net/YChenFeng/art...
    aeytifiw阅读 34,721评论 13 425
  • Kafka入门经典教程-Kafka-about云开发 http://www.aboutyun.com/threa...
    葡萄喃喃呓语阅读 10,825评论 4 54
  • 4. 设计思想 4.1 动机 我们设计的 Kafka 能够作为一个统一的平台来处理大公司可能拥有的所有实时数据馈送...
    疯狂的橙阅读 1,077评论 1 4
  • 横县&宝华山 以茶相伴的下半生 学茶、习茶更离不开的是寻茶 寻找的是山也是水 好山好水出好茶 茶,大自然赐予...
    玥烨阅读 329评论 2 0
  • 第二天一大早起来,发现眼皮上又被咬了一个疱,都肿了,当即气急败坏地叫了起来:“妈...的!敢咬我的眼睛!”骂完自己...
    唐棣华阅读 352评论 0 2