背景 kubelet报错notify_add_watch no space left on device如何解决 解决办法 yourvalue替...
共享gpu time slicing mps mig 启用mig 查看mig规格 创建gi 查看已创建gi 删除gpu0上的gi 创建ci 查看...
简介 源码 pkg/scheduler/backend/queue/scheduling_queue.go中 将backoffq中backoff...
源码 pkg/controller/replicaset/replica_set.go中 pkg/controller/controller_u...
背景 k8s secret是一种用于存储敏感信息的机制,但是它存在一些安全问题,因为他是内容固定且长期存在的 external-secrets是...
可监控 没有监控没办法衡量稳定性或者本次变更的影响,变更前需要建立核心指标并对其进行监控 可灰度 变更过程一定逐步放量,比如从0%10%,20%...
背景 早期版本hpa扩缩容的容忍度默认都是10%,剋用通过配置horizontal-pod-autoscaler-tolerance修改,但是无...
背景 gpu pod内执行nvidia-smi报错Failed to initialize NVML: Unknown Error如何解决参考h...
背景 kubectl get yourcrd yourname时候默认只输出name和namespace,查看其他信息时候需要kubectl g...