智联招聘基于Apache Pulsar打造企业级事件中心

Apache Pulsar于2018年9月正式成为Apache顶级项目,ApachePulsar是一个企业级的发布订阅(pub-sub)消息系统,最初由Yahoo开发,并于2016年底开源。Pulsar在Yahoo的生产环境运行了三年多,助力Yahoo的主要应用,如Yahoo Mail、Yahoo Finance、Yahoo Sports、Flickr、Gemini广告平台和Yahoo分布式键值存储系统Sherpa。自孵化之日起,其在开源社区就备受关注,社区的开发者一起合力往Pulsar里面贡献了大量的企业级特性。这些贡献将Pulsar从最初的一个消息系统演化成集消息、存储和函数式轻量化计算的流数据平台。 Apache Pulsar,相对其他传统消息中间件系统,有着根本性的不同。这些不同可以囊括为以下几点:

在消息模型和 API 层面上,Pulsar 基于日志这个存储抽象,统一了消息队列(Queue)和流处理(Streaming)这两种经典的消息中间件应用场景。用户只需要使用一套系统,通过不同的订阅(Subscription)模式,即可支持不同的应用场景,从根本上打通了应用和服务之间的数据孤岛,从而实现真正意义上的数据”中台“。

图1:Apache Pulsar对订阅模式的抽象

在架构层面上,Pulsar 使用了最前沿的将计算和存储相互分离的思路,将传统的消息中继(Broker)和消息存储(Storage)分开,从而将原有的消息中继(Broker)变成一层无状态化的服务层。将 Broker 变成无状态化之后,Broker 和存储可以相互独立扩展,同时 Broker 的失效恢复可以在极短的时间内完成,从而大大提高了服务的可用性。而且这种分层架构也让 Pulsar 可以很容易部署在 Kubernetes 这样的容器编排环境里面,最高效地使用云原生的基础架构。

图2:Apache Pulsar分层架构

在存储层面上,Pulsar 使用 Apache Bookkeeper 作为其日志存储系统,将存储粒度从传统的分区粒度,拉低到了分片(Segment)粒度。一旦存储粒度被细分之后,分区不再是物理绑定的了。分区更多的是逻辑层面上的概念,一个分区可以被切分成细粒度的分片,均匀打散到整个集群中;从而极大程度上最大化了数据放置的可能性,也降低了进行集群扩容、故障恢复等操作带来的复杂性。Tiered Storage特性可以将历史数据存储在更廉价的存储设备上(阿里云OSS, AWS S3等),保证了热数据的性能的前提下大大降低了企业存储历史数据的成本。

图3:Apache Pulsar 基于Segment的分片存储

图4:Apache Pulsar Tiered Storage的历史数据搬迁

智联招聘在2018年初就计划打造自己的平台级事件中心,实现事件的统一管理及存储。在这之前智联招聘使用RabbitMQ + Kafka等产品来支撑智联招聘消息系统以流式处理、批处理的支持,RabbitMQ主要支持在线业务的消息投递,Kafka主要应用在流式处理、批处理、日志处理等场景。在应用的过程中我们遇到了一些痛点:

两种产品带来的高维护成本

两套系统数据的一致性问题

数据存储分散且透明度不足

打造平台级的事件中心已经迫在眉睫,在经过大量的技术调研工作之后, Apache Pulsar的分层抽象、存储设计以及多租户、多订阅模式等特性吸引了我们。在经过充分的学习以及和Apache Pulsar团队核心人员沟通之后,最终技术选型也很圆满的告一段落,Apache Pulsar成为了我们打造平台级事件中心的首选。

多租户的特性为平台级事件中心提供了更好的事件管理方案,我们可以利用多租户特性做用户的资源隔离、权限控制等。可以通过维护一套平台级的服务来为智联招聘的全业务线服务,这大大的降低了运维的成本。接入方可以在事件平台申请自己的命名空间,这些都是对用户透明的,用户不用在为维护工作担忧。

图5:Apache Pulsar 多租户Topic 管理

Queue模式和Streaming模式的统一可以很好的支持在线业务工作队列需求以及流式处理、批处理的需求,事件的发送方只需要生产一份数据就可以供多个业务方、多种工作方式使用,不用在为数据的一致性担忧,显著的降低了系统的开销以及数据的核对工作。

图6:Apache Pulsar Queue模式与Streaming模式的统一

Retention机制可以很好的匹配事件回溯的需求,我们可以根据不同事件的重要程度或者在时间上的价值来评估Retention的策略,可以同时限制时间以及大小的策略在实际的应用场景也是非常的方便。

图7:Apache Pulsar 对消息保留以及消息过期的处理机制

Apache Pulsar自带的企业级特性跨机房复制也是可以非常好的为事件中心提供数据容灾能力的保证,我们可以通过这个特性将重要的事件保存在多个机房来提供数据的容灾能力。

TieredStorage特性为事件的冷数据存储提供了很好的支持,我们可以将那些需要长期保存的数据Offload至二级存储,比如阿里云的OSS,AWS S3等产品上。这可以大大降低冷数据的存储成本而不会影响热数据的性能,热数据我们都会使用双SSD来做Bookkeeper的Journal和Leger的存储,更好的保证了事件的写入和读取性能。

在这些特性之上,智联招聘通过对事件定义的严格控制以及配合Pulsar的Shema特性,可以做到在整个平台级的事件中心事件对用户透明性。用户可以在事件中心上查找平台上已经有的事件以及事件是如何定义的,平台也对事件的变更做出了明确的要求。这对数据产品也是非常有意义的。

平台级的事件中心可以为在线业务、流式计算、批处理甚至人工智能方向提供很好的基础能力支持,也是智联招聘2018年平台级的重要项目之一。在2018年8月份项目已经正式落地,逐步已经有业务方开始接入,截止目前事件中心每日提供5亿次事件投递服务,预计11月低接入量提升至20亿日均事件投递量。

智联招聘也在持续的为Apache Pulsar贡献新的特性比如Dead Letter Topic,Client Interceptors等很好的特性也会随着2.2.0版本的发布来服务Pulsar的用户。我们也在计划贡献Delay Messages等更多好的特性为社区服务,同时感谢streamlio在此过程中贡献的支持。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,362评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,330评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,247评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,560评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,580评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,569评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,929评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,587评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,840评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,596评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,678评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,366评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,945评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,929评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,165评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,271评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,403评论 2 342

推荐阅读更多精彩内容