升级TaskD

TaskD组件安装在训练镜像内部,在训练镜像内部重新安装该whl包即可完成升级。

前提条件

已完成升级环境检查

升级步骤

  1. 参考获取软件包章节,下载新版本组件安装包。
  2. 下载完成后,进入安装包所在路径并解压安装包。
  3. 执行ls -l命令,回显示例如下。

    -rw-r--r-- 1 root root 1493228 Mar 14 02:09 Ascend-mindxdl-taskd_7.0.RC1_linux-aarch64.zip
    -r-------- 1 root root 1506842 Mar 12 18:07 taskd-7.0rc1-py3-none-linux_aarch64.whl

  4. 基于已有的训练镜像,安装新版本TaskD组件。

    1. 执行以下命令运行训练镜像。
      docker run -it  -v /host/packagepath:/container/packagepath training_image:latest bash
    2. 执行以下命令卸载已安装的TaskD组件。
      pip uninstall taskd -y

      回显示例如下表示卸载成功。

      Successfully uninstalled taskd-7.0rc1
    3. 执行以下命令安装新版本TaskD
      pip install taskd-7.0rc1-py3-none-linux_aarch64.whl

      回显如下。

      Successfully installed taskd-7.0rc1
    4. 安装了新版本TaskD后,退出容器,将容器保存为新镜像。
      docker ps

      回显示例如下。

      CONTAINER ID   IMAGE                  COMMAND                  CREATED        STATUS        PORTS     NAMES
      8b70390775f2   fd6acb527bad           "/bin/bash -c 'sleep…"   2 hours ago    Up 2 hours              k8s_ascend_default-last-test-deepseek2-60b
      将该容器提交为新版本训练容器镜像,注意新镜像的tag与旧镜像不一致。示例如下。
      docker commit 8b70390775f2 newimage:latest

  5. 检查新版TaskD是否升级完成,参考检查TaskD组件章节,检查组件状态是否正常。
  6. (可选)回退老版本。若旧版镜像仍然存在,无需回退操作;若不存在则按上述步骤,重新安装旧版本TaskD软件包即可。