Curve 停止mds
- 适用环境:
- 版本号: v2.6+
- CurveAdm版本:v0.2.0+
- 最后更新日期: 2023/09/30
- 层面: 管控面
- 运维级别: P1
- 所属产品: 存储
- 需求明细: 具体节点,具体的mds服务
- 验收标准: 该节点的mds服务停止成功,并且集群健康
- 参考步骤:
1. 查看集群服务状态和指定节点的mds状态:
$ curveadm status
注:如果指定的mds已经处于退出状态(Status为Exited状态),则不用重复操作。
2. 如果处于Up状态,则使用下述命令停止服务,
如果是停止某个指定的mds,使用--id选项:
$ curveadm stop --id <Id>
如果要停止某个节点上的所有的mds服务,使用如下命令:
$ curveadm stop --host <host> --role mds
如果要停止集群中所有的mds服务,使用如下命令:(一般不会进行操作)
注意:如果停止所有的mds,则导致集群不可用,请在进行下列操作前仔细确认是否要停掉所有的mds服务
$ curveadm stop --role mds
3. 再次查看集群服务状态,查看指定mds服务是否已经退出(Status为Exited状态):
$ curveadm status
4. 使用工具使用查看当前集群状态:
$ curve fs status cluster
当停止部分mds服务后,上述命令输出提示集群处于warn状态 Cluster health is: warn,符合预期。
如果停止部分mds服务后,上述命令输出提示集群处于error状态 Cluster health is: error,则表示集群出错,需要重新拉起刚才停掉的mds。
(一般不会做此操作)停掉所有的mds服务,集群应该处于error状态 Cluster health is: error。
- 参考影响:
情况1:停止部分mds
时间: 无
业务方: 无
影响主题: 无
用户:无
情况2:停掉所有的mds服务
时间:直至有mds服务启动之前,集群不可用
业务方:所有使用当前集群的业务方
影响主题:mds挂掉
用户:所有使用当前集群的用户
- 参考风险:
情况1:停止部分mds服务
数据面: 无
管控面: 无
恢复能力: 无需恢复
情况2:停掉所有mds服务
数据面: IO暂停
管控面: 管控面服务不可用
恢复能力: 无需恢复
参考回滚策略: 重新拉起mds
需求发起方: CURVE
接收方:
评审责任人: SRE负责人,SA负责人,CURVE负责人
用户通知责任人: 技术支持
执行责任人: CURVE/SA
测试回归责任人: CURVE
执行审核责任人: SA/CURVE/SRE