由于最近线上故障频出,公司决定对现有各个核心系统做故障演练,来加强核心系统的健壮性和可用性。我们演练的场景很简单,模拟单机房挂掉,所有的服...
最近被问到如何理解 k8s 弹性伸缩的这样的问题,而我最初的回答很简单也很肤浅,我说:k8s 是 HPA 根据定义的 metric...
记一次16个小时的 beta 环境 zk 集群故障 最近公司的 beta 环境 zk 集群经历了一次大震荡,16个小时的恢复时间,听起来就感觉不...
我们在做日志收集方案选型的时候,ops 给的方案是日志先落盘,然后再做收集。这样做有一个好处,对应用没有影响,据说其他公司有通过网络收集日志的,...
这两年 IT 行业的技术更新越来越快,其中 DevOps、AIOps 是大家比较熟知的,它们帮助公司解决了传统运维的效率和成本问题,也是...
我在测试把 springboot 的程序部署到 tomcat 容器中发现springboot 的日志文件 catalina.out 没有生成,d...
Mr-Redis 是华为基于mesos开发的一个redis framework , 方便管理 redis 实例和集群 (github url: ...
最近随着 DC/OS 和 k8s 的流行,很多基础服务都不需要我们开发管理了 (例如服务发现),这样大家可以把更多精力放在业务上。下面我们列举一...
期待已久的容器 meetup 终于结束了,结果和期待中的还是有一些落差,落差主要是整个过程互动环节与技术交流时间比较少, 所以感觉收获有限。不过...