启动Resilience-Controller
操作步骤
- 以root用户登录K8s管理节点,并执行以下命令,查看Resilience-Controller镜像和版本号是否正确。
- 将Resilience-Controller软件包解压目录(以“/home/ascend-resilience-controller”为例)下的yaml文件拷贝到K8s管理节点上任意目录(以“/home/ascend-resilience-controller”为例)。如果Resilience-Controller软件包在K8s管理节点上解压,可以不用进行拷贝操作。
cd /home/ascend-resilience-controller scp root@{软件包解压节点IP地址}:/home/ascend-resilience-controller/resilience-controller-*.yaml ./
- 如不修改组件启动参数,可跳过本步骤。否则,请根据实际情况修改yaml文件中Resilience-Controller的启动参数。启动参数请参见表1,可执行./resilience-controller -h查看参数说明。
- 执行以下命令,启动Resilience-Controller。
- 如果导入了KubeConfig证书,执行如下命令。
kubectl apply -f resilience-controller-without-token-{version}.yaml
- 如果没有导入KubeConfig证书,执行如下命令。
kubectl apply -f resilience-controller-*.yaml
启动示例如下所示:
root@ubuntu:/home/ascend-resilience-controller# kubectl apply -f resilience-controller-without-token-v3.0.0.yaml deployment.apps/resilience-controller created root@ubuntu:/home/ascend-resilience-controller# kubectl get pod -n mindx-dl NAME READY STATUS RESTARTS AGE ... resilience-controller-7667495b6b-hwmjw 1/1 Running 0 11s ...
- 如果导入了KubeConfig证书,执行如下命令。
参数说明
参数 |
类型 |
默认值 |
说明 |
---|---|---|---|
-version |
bool |
false |
Resilience-Controller二进制版本号。 |
-logLevel |
int |
0 |
日志级别:
|
-maxAge |
int |
7 |
日志备份时间限制,范围:[7,700],单位:天。 |
-logFile |
string |
/var/log/mindx-dl/resilience-controller/run.log |
日志文件。 说明:
单个日志文件超过20 MB时会触发自动转储功能,文件大小上限不支持修改。 |
-maxBackups |
int |
30 |
转储后日志文件保留个数上限,范围:(0,30],单位:个。 |
-h |
无 |
不涉及 |
显示帮助信息。 |
父主题: 常用操作