Ascend Operator
如果使用MindCluster Volcano组件作为调度器,需要先安装MindCluster Volcano组件,否则MindCluster Ascend Operator会启动失败。
操作步骤
- 以root用户登录K8s管理节点,并执行以下命令,查看MindCluster Ascend Operator镜像和版本号是否正确。
- 将MindCluster Ascend Operator软件包解压目录(以“/home/ascend-operator”为例)下的yaml文件拷贝到K8s管理节点上任意目录(以“/home/ascend-operator”为例)。如果MindCluster Ascend Operator软件包在K8s管理节点上解压,可以不用进行拷贝操作。
cd /home/ascend-operator scp root@{软件包解压节点IP地址}:/home/ascend-operator/ascend-operator-v{version}.yaml ./
- 如不修改组件启动参数,可跳过本步骤。否则,请根据实际情况修改yaml文件中MindCluster Ascend Operator的启动参数。启动参数请参见表1,可执行ascend-operator -h查看参数说明。
- 在管理节点的yaml所在路径,执行以下命令,启动MindCluster Ascend Operator。
kubectl apply -f ascend-operator-v{version}.yaml
启动示例如下:
root@ubuntu:/home/ascend-operator# kubectl apply -f ascend-operator-v5.0.1.1.yaml deployment.apps/ascend-operator-manager created serviceaccount/ascend-operator-manager created clusterrole.rbac.authorization.k8s.io/ascend-operator-manager-role created clusterrolebinding.rbac.authorization.k8s.io/ascend-operator-manager-rolebinding created customresourcedefinition.apiextensions.k8s.io/ascendjobs.mindxdl.gitee.com created ...
执行kubectl get pod -n mindx-dl命令,出现Running表示组件启动成功。
root@ubuntu:/home/ascend-operator# NAME READY STATUS RESTARTS AGE ... ascend-operator-7667495b6b-hwmjw 1/1 Running 0 11s

- 安装组件后,组件的Pod状态不为Running,可参考组件Pod状态不为Running章节信息。
- 安装组件后,组件的Pod状态为ContainerCreating,可参考集群调度组件Pod处于ContainerCreating状态章节信息。
- 启动组件失败,可参考启动集群调度组件失败,日志打印“get sem errno =13”章节信息。
- 组件启动成功,找不到组件对应的Pod,可参考组件启动yaml执行成功,找不到组件对应的Pod章节信息。
参数说明
参数 |
类型 |
默认值 |
说明 |
---|---|---|---|
-version |
bool |
false |
MindCluster Ascend Operator二进制版本号。 |
-logLevel |
int |
0 |
日志级别:
|
-maxAge |
int |
7 |
日志备份时间限制,取值范围为7~700,单位为天。 |
-logFile |
string |
/var/log/mindx-dl/ascend-operator/ascend-operator.log |
日志文件。 说明:
单个日志文件超过20 MB时会触发自动转储功能,文件大小上限不支持修改。转储后文件的命名格式为:ascend-operator-触发转储的时间.log,如:ascend-operator-2023-10-07T03-38-24.402.log。 |
-maxBackups |
int |
30 |
转储后日志文件保留个数上限,取值范围为(0,30],单位为个。 |
-enableGangScheduling |
bool |
true |
是否启用“gang”策略调度,默认开启。开启时根据任务指定的调度器进行任务调度。 |
-isCompress |
bool |
false |
当日志文件大小达到转储阈值时,是否对日志文件进行压缩转储(该参数后面将会弃用)。 |
-kubeconfig |
string |
空字符串 |
kubeconfig的路径,当程序运行于集群外时必须配置。 |
-h或者-help |
无 |
不涉及 |
显示帮助信息。 |
父主题: 手动安装