kafka学习

image.png

Producer:消息生产者

Consumer:消息消费者

Topic:在逻辑上可以被认为是一个queue，每条消费都必须指定它的Topic，可以简单理解为必须指明把这条消息放进哪个queue里。为了使得Kafka的吞吐率可以线性提高，物理上把Topic分成一个或多个Partition，每个Partition在物理上对应一个文件夹，该文件夹下存储这个Partition的所有消息和索引文件。

Consumer Group(CG):这是kafka用来实现一个topic消息的广播（发给所有的consumer）和单播（发给任意一个consumer）的手段。一个topic可以有多个CG,但每个partion只会把消息发给该CG中的一个consumer。如果需要实现广播，只要每个consumer有一个独立的CG就可以了。要实现单播只要所有的consumer在同一个CG。用CG还可以将consumer进行自由的分组而不需要多次发送消息到不同的topic;

Broker:一台kafka服务器就是一个broker。一个集群由多个broker组成。一个broker可以容纳多个topic

Partition（分区）:为了实现扩展性，一个非常大的topic可以分布到多个broker（即服务器）上，一个topic又可以分为多个partition,每个partition是一个有序的队列。partition中的每条消息都会被分配一个有序的id(在kafka中称为offset，偏移量)。kafka只保证按一个partition中的顺序将消息发给consumer,不保证一个topic的整体（多个partition间）的顺序。
为了更好的理解Partition,举一个的例子，例如当有一条新消息到来时，先找到该消息的topic值，然后通过计算该消息的hash值，通过hash值确定该消息要存放到哪个Partition中去。Partition可以看成将原本完整的一个topic队列切分成好几个小的队列，这几个小的队列组合起来才是一个完整的topic。

Offset:Offset（偏移量），可以理解为ID,每个Partition中的offset是唯一的。kafka的存储文件都是按照offset.kafka来命名，用offset做名字的好处是方便查找。例如你想找位于2049的位置，只要找到2049.kafka的文件即可。当然the first offset就是0000000.kafka。

springboot+kafka的集成可以参考这篇文章，讲的相对详细。

上述文章没有提到消息确认，有关kafka消息确认的内容可以查看这篇文章

kafka学习

推荐阅读更多精彩内容