Kafka重启Consumer后抓不到数据的问题

使用kafka时,经常会遇到这样的问题:
重启某一消费者程序后,一条数据都抓不到了,但是队列中明明还有很多未被消费的消息,这是怎么回事呢?

先说原因,四个字:重复消费

下面进行详细分析:
“消费确认”是所有消息中间件都要解决的一个问题,在kafka中涉及到两个消费位置:
(1)当前取消息所在的consume offset;
(2)程序处理完毕发送ack(确认字符)后所确定的committed offset。
很显然,在异步模式下,committed offset要落后于consume offset。假如consumer挂了重启,那么它将从commited offset位置处开始重新消费,而不是consume offset位置,这也就意味着很可能重复消费,所以会导致一条数据也抓不到。

如何避免重复消费呢,大家知道,在Kafka客户端中,有三种消费确认策略:

         自动地、周期性地ack
         properties props = new Properties();
         props.put("enable.auto.commit", "true");
         props.put("auto.commit.interval.ms", "1000");
        consumer.commitSync()       //调用commitSync,手动同步ack。每处理完一条消息,commitSync一次
        consumer.commitASync()     //手动异步ack

自动地、周期地ack肯定会出现如上重复消费问题,那么依靠上面的consumer.commitSync(),我们每处理完一条消息,就发送一次commitSync(),这样是不是就可以解决重复消费呢?
答案是否定的。如下代码:

   ConsumerRecords<String, String> records = consumer.poll(1000);
   for (ConsumerRecord<String, String> record : records) {
       buffer.add(record);
   }
   if (buffer.size() > minBatchSize) {
       insertIntoDB(buffer);        //操作一存到db
       consumer.commitSync();       //操作二同步发送ack
       buffer.clear();
   }
}

操作一和操作二做不到原子操作,如果在操作一完成,但进行操作二的时候挂了,服务器再次重启,消息仍然会重复消费。
那么怎么解决这个问题呢?
答案就是自己保存commited offset,而不是依赖kafka的集群保存commited offset,把消息的处理和保存offset做成一个原子操作。
如何将消息的处理和保存offset做成一个原子操作呢,Kafka的官方文档列举了自己保存offset的两种使用场景:

image.png

要自己保存committed offset,就要做到以下几个操作:

Configure enable.auto.commit=false   //禁用自动ack
Use the offset provided with each ConsumerRecord to save your position. //每次取到消息,把对应的offset存下来
On restart restore the position of the consumer using seek(TopicPartition, long).//下次重启,通过consumer.seek函数,定位到自己保存的offset,从那开始消费

Kafka本身的机制只能保证消息不漏,即"at least once",而通过自己来保存committed offset,我们可以实现消费端的消息不重,即"exactly once",达到消息不重不丢的目的。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,444评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,421评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,363评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,460评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,502评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,511评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,280评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,736评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,014评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,190评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,848评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,531评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,159评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,411评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,067评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,078评论 2 352

推荐阅读更多精彩内容