节点故障后运行OSD

在我的kubernetes集群(v1.14.7)中 集群更新后,一个节点无法正确恢复。 该节点的Rook OSD没有重新安排(如文档中所述) 因此,我尝试手动添加新的OSD。

我的ceph status返回此

here

和我的ceph osd tree返回此

here

我尝试使用ceph osd crush set osd.0 0.29199 root=default host=gke-dev-dev-110dd9ec-ntww

将新的osd与该节点链接

但返回: 错误提示:无法在位置{host = gke-dev-dev-110dd9ec-ntww,root = default}上设置项目ID 0名称'osd.0'重量0.29199:不存在

您是否知道如何解决此问题的线索? 预先感谢

liuxuefei184 回答:节点故障后运行OSD

这是我的建议,而不是立即尝试添加新的osd,而是修复/删除有缺陷的osd,然后应重新创建。

尝试一下:

1-标记osd:ceph osd标记为osd.0
2-从暗恋地图删除:ceph osd暗恋删除osd.0
3-删除大写字母:ceph auth del osd.0
4-删除OSD:ceph osd rm osd.0
5-删除部署:kubectl删除部署-n your-cluster-namespace rook-ceph-osd-0
6-修改osd ID和基础设备的config部分。
kubectl编辑configmap -n your-cluster-namespace rook-ceph-osd-nodename-config
删除{“ / var / lib / rook”:x}
7-通过删除rook-operator pod重新启动rook-operator pod
8-验证集群的运行状况:ceph -s; ceph osd树

希望这会有所帮助!

,

对于菜鸟用户:https://rook.io/docs/rook/master/ceph-osd-mgmt.html

需要说明的博客(中文读者):https://zhuanlan.zhihu.com/p/140486398

本文链接:https://www.f2er.com/2723109.html

大家都在问