昇腾社区首页
中文
注册

安装前必读

在安装组件前,用户需详细阅读简介章节,了解集群调度各组件功能详细的说明,并根据要使用的特性选择安装相应的组件。

Elastic AgentTaskD组件需部署在容器内,详细安装步骤请参见制作镜像

使用约束

  • 请确保根目录有足够的磁盘空间,根目录的磁盘空间利用率高于85%会触发kubelet的资源驱逐机制,将导致服务不可用。磁盘空间要求说明请参见表1;驱逐策略请查看Kubernetes官方文档
  • 为保证MindCluster集群调度组件的正常安装及使用,同一集群下,不同训练服务器的系统时间请保持一致。
  • ARM架构和x86_64架构使用的集群调度组件镜像不能相互兼容。
  • K8s默认的证书有效期为365天,到期前需要用户自行更新。

组件部署说明

安装部署集群调度组件时,可以参考图1,将相应的集群调度组件或其他第三方软件安装到相应的节点上。大部分组件都使用容器化方式部署;Ascend Docker Runtime使用二进制方式部署;只有NPU Exporter组件既可以使用容器化方式部署,又可以使用二进制方式部署。

图1 组件安装部署

MindCluster提供Volcano组件,该组件在开源Volcano上集成了昇腾插件Ascend-volcano-plugin

日志路径说明

  • Ascend Docker Runtime日志路径为“/var/log/ascend-docker-runtime/”
  • 其他集群调度组件日志路径可参考创建日志目录章节。