每秒数万笔的核心交易系统运维金融日志智能运维实践

近年来,各商业银行业务规模迅速增长,作为底层的技术支撑,生产系统的集群规模也越来越大,运维难度也逐步增加。


银行应用运维现状

经过大量调研发现大部分商业银行尽管已实现了各业务系统软硬件方面的全网监控,也实现了统一运维管理,但还是处于被动运维管理模式,对信息系统的健康程度了解不够深入,也不能快速排查应用系统处理交易异常。

应用运维问题体现在以下三个方面

缺少对各业务应用交易的运行情况(交易量、成功率、平均响应时间)的监控,难以全面、准确、及时地掌握业务应用系统的运行情况;

无法自动发现应用拓扑关系和交易访问路径,并以此为基础实现故障应用系统的自动定位;

无法将操作系统、中间件、数据库、存储、网络、环境动力等IT基础设施专业事件与各应用系统的业务交易或系统交易事件关联起来进行自动故障树分析。

上述问题直接导致IT运维中出现专业事件处理量大、业务影响分析困难、故障根源定位慢、故障节点难以自动隔离恢复等问题。

因此,商业银行需要以业务应用交易为核心,升级整合传统的IT运维监控系统,建立以全局监控、自助化查询、快速处置为一体的整体解决方案。而其中,将生产系统所产生的日志进行集中归集,并利用日志进行监控和深度挖掘是最核心的环节。日志并非只是单纯的文本信息, 更是一笔数据财富,日志中会写入全局事件跟踪号、事件性能数据、诊断信息、交易唯一标识、交易响应时间以及错误代码等关键信息。通过实时、全面的采集和关联日志可以实现应用系统拓扑关系发现、交易事件关联分析、异常监测诊断以及数据报告展示,让运维管理人员直观方便的掌握业务系统的性能和健康度。



应用日志分析问题严峻

目前大部分中型以下商业银行还停留在人工处理日志层面,日志分析时需要逐台登录服务器搜索相关日志文件才能定位问题,工作量大,效率低,安全性差。



普遍存在以下几个痛点:

1. 日志数据量大,产生速度很快

通常日增量都在GB甚至TB级别以上,给备份、存储、审计、分析带来巨大的挑战。

2. 日志分散繁杂

通常散落在基础设施各处,且格式众多、复杂度高,给分析定位带来很大困难,只有经验丰富的管理员才能够熟练掌握,局限性大。

3. 缺少关联分析手段

只做事后分析利用,无法对问题进行更深层次的挖掘和分析。

4. 日志分析时效性低

面对海量日志,银行内部系统无法满足实时分析要求,且自建能力有限。



我们的解决方案

针对以上问题,东软SaCa DataInsight日志大数据平台产品提供了日志采集、预处理、存储、查询、分析、告警及可视化展现等一系列功能服务,支持系统全局监控、业务拓扑展现、交易日志关联、智能告警以及故障自愈等功能。需要特别说明的是,产品为了满足对海量日志的实时采集、查询及分析需求采用了分布式部署架构,在技术实现上可以支持灵活地按需部署。数据预处理、查询分析以及控制模块可以按需的分布在相同或者不同的服务器中,并且各模块内也可以根据数据处理规模来横向伸缩扩展。

根据案例实践

在日增量2-3TB数据量级下为满足秒级查询分析需求

给出如下部署架构建议


在海量日志查询分析方面,首先产品支持收集各类系统的日志数据按照统一的标准进行加工处理,存储。其次,通过平台自定义开发的关联引擎可以自动发现业务应用系统拓扑关系和交易访问路径,进行故障应用系统或故障应用节点的自动定位处理,更直观的展现各系统的交易量、成功率、响应时间等交易指标。最后,通过业务流程查询引擎,对比交易路径或应用拓扑图上不同应用系统的总量/分量交易指标的变化情况,将故障自动定位到某个应用系统甚至服务器节点,减少排除故障时间。

方案应用价值

SaCa DataInsight通过分析日志提供以下功能服务,完成对生产系统进行各维度的全天监控;同时,通过对历史日志的深度挖掘,可以帮助业务部门管理业务流向及配置、可以帮助商业银行客户自助解决日常工作中的问题、还可以帮助运维部门了解系统健康程度和故障原因,大大提高生产系统的整体运维效率。

日志自助查询


自助查询功能提供给各分支机构远程自助查询,减少自己工作量,数据权限控制不同分支机构对数据的可见性。

业务拓扑展现


通过提前对错误日志设定规则,大量报错会告警,并迅速定位问题。

交易关联瀑布图


通过日志关联与自动计算,可以把分散的日志按照交易为单位进行自动串联,并计算每个平台的交易耗时,直观展现业务处理时延。

主机远程控制


远程控制模块可以通过页面,去选择执行的远程命令,并直接查看执行结果;不需要值班人员熟悉命令执行的细节。

应用业务监控


通过对所有日志的左右键进行提取,并进行业务关联,可以自动监控不同平台、节点、服务状态,形成结果展现。

运维知识库

把每次问题的解决方案沉淀到知识库,在告警触发时,直接提供相关知识库链接,降低学习成本。

相关产品

SaCa DataInsight

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,992评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,212评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,535评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,197评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,310评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,383评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,409评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,191评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,621评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,910评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,084评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,763评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,403评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,083评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,318评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,946评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,967评论 2 351

推荐阅读更多精彩内容