CEPH 新加host 添加OSD 故障 pg down

由于业务问题把ceph的集群进行调整,当时某一host因内存问题挂掉。借此机会把所有的osd,down--out--purge掉。

下面还是需要把这个host添加进集群。相当于新加一个host。

同事先在host上启动了一个osd。并且等几分钟后,又添加3个osd。此时集群挂掉。
出现pg down

查看log

image.png

最终定位原因,由于新加osd时,会在此host进行新osd所有pg都会创建出来。新加的osd会添加一部分,剩下的有本host上其他osd创建,最后转移到新的osd上。
由于同事添并不是统一添加osd。导致第一个osd上面的pg num过大。在新加osd后造成了上面的问题。导致pg down。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容