kafka作为日志聚合平台的底层存储方案的实践

    看过一些介绍kafka的文章,并且在工作当中也接触过一些。给人的印象kafka是比较适合做消息中间件的,生产和消费速度都非常的快,大致的原因是因为技术上采用了顺序写入和MMFile。今天我想分享一下除了kafka可以作为消息中间件之外还可以作为日志聚合工具。传统的开源日志聚合工具有三种:

    1.ELK

    2.Graylog

    3.Fluentd

    ELK遇到的挑战是,当实时日志量很大超过了es实时处理能力的时候就会出现丢数据和es服务不可用的情况。另外遇到的一个问题是实时创建的segment需要定期merge,这个过程同样会给es带来很大的压力。有一种做法就是建很多ELK集群外面套层gateway服务做转发,但是不管怎样,都会带来很多运维工作。graylog更像是一个pipeline工具,通过管道处理之后存储还是es,所以同样会遇到上面的问题。另外graylog本身对日志的数量也有限制,我们有600个日志会需要创建很多graylog服务来分摊,这个是因为和graylog本身内部统一分发有关。

    在放弃了上述两种架构之后,我们重新梳理一下。es虽然很强大,但是也付出了很大的代价——实时建索引。实际上用户真正用到的日志量极少,我们却投入了大量的资源去创建根本使用不到的日志索引。根据用户使用场景当中提炼出来,我们更倾向于时序数据库做为日志存储,通过用户输入的时间做过滤查询日志,这样就可以限定到少部分的日志内容在返回给用户。通过调研hbase,influxdb,logdevice等等,最终我们选择了kafka作为底层存储。hbase需要单独设计rowkey,另外在并发和日志记录的上下级关系上都需要而外的设计,这样就增加了开发的复杂度,influxdb集群版本是需要付费的,logdevice一开始是首选的日志存储方案,但是因为是C++版本,在技术栈能力上也不要擅长,所以放弃了。另外需要分享的是,facebook研发logdevice的初衷和我们的场景很相似,网上也有专门的解释有兴趣的同学可以去看下。个人觉得在并发和搜索能力上logdevice相比kafka潜力要大很多,当然kafka通过源码级别的改造也能够满足,比如可以基于broker级别的日志过滤,读写分离等等。

下面也截图去一段官网上的说明,关于日志聚合工具上kafka具备的能力。

    在选型kafka作为底层存储之后,需要有个web console作为用户查看、搜索日志的平台。我们选用了一款开源软件logsniffer作为web console。其设计页面功能非常的丰富,支持tail,more,search,告警等功能。但是logsniffer底层是用文件式存储,在最初的运行过程当中,查询小日志量的文件是可以满足用户需求的,但是日志量稍微大一点,比如一个小时生成4-5G的文件,搜索起来就有点耗时了。经过对其底层存储的改造,在使用体验上速度明显快了很多,日志量大的采用多分区方式可以增加读取kafka并发能力。我们做了下对比,在单分区每小时产生4G大小左右的搜索,如果搜索内容不是和生僻的话,秒级都能在。对比用文件式存储几分钟都未必能返回结果。

    传统的日志收集平台都需要单独搭建日志存储服务,通过使用kafka作为存储服务之后,非常高性价比的日志聚合平台架构就浮现出来了。和传统的ELK平台相比,优点是不需要很多机器用来部署es+kibana,也不需要额外的运维人员对es做性能调优、运维和基于ELK的二次开发。缺点是搜索体验上不如ELK做的那么强大,当然基于kafka存储也可以在体验上有所改进,特别可以基于KSQL查询引擎提升用户的体验也可以在此让用户配置个性化告警功能,另外在统计分析上的缺失,这部分一种可靠的方式是将日志非实时的写入es当中再做分析也是一种选项。

    总结:kafka在作为日志存储做查询、搜索上能很好的满足用户需求,但是在日志分析上还有所欠缺。但是kafka本身基于MMFile机制造就高效的批量数据发送能力,未来用kafka作为存储研发日志分析功能未尝不值得一试。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,324评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,356评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,328评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,147评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,160评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,115评论 1 296
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,025评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,867评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,307评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,528评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,688评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,409评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,001评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,657评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,811评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,685评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,573评论 2 353

推荐阅读更多精彩内容