特性介绍
本特性通过ETCD分布式锁机制实现Kubernetes集群中Coordinator的主备倒换功能,确保系统高可用性。开启使用Coordinator主备倒换特性开关时,初始化时拉起两个Coordinator,通过ETCD分布式锁竞争来实现主备身份确认,当主Coordinator发生故障时,备用Coordinator能在一定时间间隔后自动接管工作。该特性只支持在大规模专家并行场景下使用。
开启Coordinator主备倒换并拉起服务时,系统在初始化阶段会触发一条告警(0xFC001004 Coordinator Service Exception Alarm)。此告警将随服务就绪而自动消失,属于正常现象,无需处理。
父主题: Coordinator主备倒换