KafKa-分布式消息队列

背景

不同的服务器为了平衡不能的处理能力,降低耦合,平衡两者的处理能力的不同,分布式消息队列就出现了

kafka 的设计动机

  • 数据的生产者和消费者的耦合度过高
  • 生产者和消费者的数据处理速率不同
  • 大量的并发的网络连接对后端消费不太友好

kafka可应用的领域

  • 消息中间件
  • 消息队列(不同于activemq 等单机消息队列)
  • 发布订阅系统
  • 消息总线

kafka 的特点

kafka是在大数据的背景下产生的,能应对海量的数据

  • 高性能
    (单机相同配置的情况下 kafka 比 rabbitmq 的性能高40-50倍)
  • 良好的扩展性
    因为kafka 是分布式的,相比较单节点的就会有可扩展和容错的特点
  • 数据的持久性
    数据消息会持久化到磁盘上

kafka的基本架构

  • kafka 架构是由producer、broker、consumer 三个组件构成
  • producer将数据写入broker,consumer将数据从broker中读出来
  • broker构成了连接producer和consumer的缓冲区
  • broker和consumer是通过zookeeper来作为协调的(kafka从0.9.0版本开始后,consumer不再依赖于zk)
  • 多个broker构成了一系列的数据存储系统,可以防止数据丢失
  • broker中的消息被分为多个topic
  • 同属于一个topic的消息被分为多个partition
  • kafka 不同于其他消息的push-push架构,而是push-pull架构
  • producer将数据push给broker,而broker上的数据是 consumer通过pull从broker上获取的
    这样设计的优势是:
    1、consumer 可以根据自己的需要从broker上获取,避免push形成的压力过大
    2、consumer可以自己读取消息,并记录自己的消息offset,大大降低了broker的压力

kafka各组件详解

kafka producer

在kafka中每条消息包含

  • topic
    划分消息的概念
  • key
    消息的主键,kafka会根据主键,将同一topic下的消息划分为不同的partition(默认时采用hash取模
    ),patition的数量是创建topic的时候静态制定的
  • messege
    消息的实体,可以是字符串,也可以是json ,avro,thrift等
kafka broker
  • 在kafka中一般会有多个broker,多个broker构成一个分布式的高容错集群
  • 将数据持久化到磁盘上
  • broker将topic分成好几个分区(partition),每个分区会有多个副本,这些partation只有一个leader,其他都是follower,只有leader对外服务,follower不对外服务,只保证和leader的数据一致,当leader宕机后,就会选举其他的leader
  • broker可以将同一partiton内部的消息是有序的,但无法保证全局的partition消息有序
  • broker会给每个partition一个offset(偏移量),offset由各自的consumer来维护,每次取消息告诉broker消息的offset
  • broker的消息在磁盘中的默认保存时7天,时间一到就会清除数据来释放磁盘
kafka consumer
  • consumer 自己保存offset,并向broker拉数据(不同于activemq,rabbitmq),
  • kafka允许consumer构成一个consumer group来提高效率
kafka zookeeper
  • broker与zookeeper
    broker将topic ,partition 等信息写入zookeeper ,zk来监控健康状态
  • consumer 与zookeeper
    consumer group通过zk 来保证每个consumer的负载均衡

kafka 关键技术点

可控的可靠性级别
  • producer向broker中写数据时,分为同步和异步,异步一般都可提高效率
  • 当producer向broker传输消息时,可靠性应答可通过参数 request.required.acks = ?来设定
    参数为0 时,当producer向broker 写数据时,无序确认就返回
    参数为1时,当producer向broker写数据时,当只要partition的leader写入成功后就放回
    参数为-1时,当producer向broker写数据时,所有patition的所有副本都写入成功就放回
数据的多副本
  • kafka 的broker的patition的复制先复制到leader上,然后在依次复制,当leader所在服务器出现异常时,选举机制就会选举别的follower为leader
kafka高效的持久化机制
  • kafka是直接将数据持久化磁盘而不是内存,这要求有高效的读写速度,实际上,数据写入磁盘时,顺序读写的速度远远高效于随机(写入快,寻址慢)
数据传输优化
可控的消息传递语义

在消息系统中,根据接收者可能受到重复消息的次数,将消息传递语义分为三种

  • at most once:发送者将消息发送之后 立刻返回,并不关心接收者是否接收
  • at least once:发送者将消息发送后,等待确认,如果没有受到确认,则重复发送
  • at exactly once:消费者只会处理消费一次(两端锁协议和支持幂等协议)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,287评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,346评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,277评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,132评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,147评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,106评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,019评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,862评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,301评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,521评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,682评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,405评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,996评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,651评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,803评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,674评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,563评论 2 352

推荐阅读更多精彩内容

  • 姓名:周小蓬 16019110037 转载自:http://blog.csdn.net/YChenFeng/art...
    aeytifiw阅读 34,721评论 13 425
  • 背景介绍 Kafka简介 Kafka是一种分布式的,基于发布/订阅的消息系统。主要设计目标如下: 以时间复杂度为O...
    高广超阅读 12,831评论 8 167
  • Kafka简介 Kafka是一种分布式的,基于发布/订阅的消息系统。主要设计目标如下: 以时间复杂度为O(1)的方...
    Alukar阅读 3,079评论 0 43
  • 1、冥想-放松-走出教室-电梯-开门...... 周围一片漆黑,只有一条长长的木板接拼成的索道桥。两边的围栏很高,...
    走路带风的女魔头阅读 363评论 1 0
  • 自从女儿进入高三的一年时间,我也好像从一个平时忙碌似坨螺的生活里突然抽身,陪读在以前我从来没有设想过这个问题。突然...
    耐奈阅读 111评论 2 1