安装 kata gpu operator demo nvidia.com/AD102_GEFORCE_RTX_4090_D替换为你实际的显卡资源
安装 kata gpu operator demo nvidia.com/AD102_GEFORCE_RTX_4090_D替换为你实际的显卡资源
简单总结 kubevirt创建了一个apiservice,virtctl vnc testvm时候流量路径为virtctl->kube-apiserver->virt-api...
背景 kubevirt的vm每次重启由于pod ip变化会导致vm无法通往一种办法是cloudInitNoCloud中添加 另一种就是固定vm pod的ip 安装 前置步骤参...
背景 同事重装系统时候只保留了/etc/kubernetes目录以及/var/lib/etcd以及etcd快照,忘记保留/var/lib/kubelet/pki目录导致重装完...
安装 安装kubevirt 参考https://www.jianshu.com/p/b822baad228d[https://www.jianshu.com/p/b822ba...
安装 local-path kubevirt operator kubevirt virtctl cdi operator cdi demo datavolume virtu...
背景 使用kubebuilder进行crd开发的时候,往往需要添加一些marker,但是往往记不住,所以这里简单记录一下 简单记录 https://github.com/ku...
背景 kubelet有很多checkpoint文件,用于记录一些状态信息 简单介绍 cpu_manager_state 在/var/lib/kubelet目录下记录cpu m...
背景 以前pod依赖的资源比如gpu是否健康,pod状态信息无法体现,对排查问题不太友善新增这个特性,会在pod上新增字段体现pod依赖的资源比如gpu是否健康 apiser...
背景 k8s使用docker作为容器运行时runc log位于/run/containerd/io.containerd.runtime.v2.task/moby/{cont...
如何通过kubelet logs接口查询kubelet日志 背景 早期kubelet只代理pod log的查询,而查看kubelet,docker等的日志需要登录到节点上去查...
背景 kuheadm方式部署k8s, 生成的证书默认是1年有效期,ca是10年有效期在1.31前,需要修改kubeadm的代码才能实现自定义证书有效期和ca有效期在1.31后...
背景 同事对docker对root dir进行了迁移,换到了一个新的目录,对应是一个新的盘而lxcfss默认是挂载在/var/lib/lxcfs下的,使用的系统盘pod mo...
背景 同事对kubelet目录进行了迁移后,pvc供应无法正常工作,kubelet报错driver name rbd.csi.ceph.com not found in th...
背景 rbd挂载异常时候排查哪个client在map以及进行unmap报错rbd xxx is still being used,说明有client map了这个rbd或者有...
背景 k8s 1.34中MutableCSINodeAllocatableCount特性达到了Beta阶段解决了以前csidriver只在初始化时配置一个静态的maxvolu...
配置与状态查询 cma_roce_mode 查看roce模式,v1或v2 cma_roce_tos 设置 RoCE 流量的 TOS/DSCP 值,用于优先级标记 show_g...
创建项目 添加依赖 修改main.rs 内容如下 运行
背景 以前kubelet的cgroup driver和containerd的cgroup driver需要分别配置,容易引起问题k8s 1.28引入了34看KubeletCg...
安装 安装gateway api kubectl apply -f https://github.com/kubernetes-sigs/gateway-api/releas...