升级TaskD
TaskD组件安装在训练镜像内部,在训练镜像内部重新安装该whl包即可完成升级。
前提条件
已完成升级环境检查。
升级步骤
- 参考获取软件包章节,下载新版本组件安装包。
- 下载完成后,进入安装包所在路径并解压安装包。
- 执行ls -l命令,回显示例如下。
-rw-r--r-- 1 root root 1493228 Mar 14 02:09 Ascend-mindxdl-taskd_7.1.RC1_linux-aarch64.zip -r-------- 1 root root 1506842 Mar 12 18:07 taskd-7.0rc1-py3-none-linux_aarch64.whl
- 基于已有的训练镜像,安装新版本TaskD组件。
- 执行以下命令运行训练镜像。
docker run -it -v /host/packagepath:/container/packagepath training_image:latest bash
- 执行以下命令卸载已安装的TaskD组件。
pip uninstall taskd -y
回显示例如下表示卸载成功。
Successfully uninstalled taskd-7.0rc1
- 执行以下命令安装新版本TaskD。
pip install taskd-7.0rc1-py3-none-linux_aarch64.whl
回显如下。
Successfully installed taskd-7.0rc1
- 安装了新版本TaskD后,退出容器,将容器保存为新镜像。
docker ps
回显示例如下。
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES 8b70390775f2 fd6acb527bad "/bin/bash -c 'sleep…" 2 hours ago Up 2 hours k8s_ascend_default-last-test-deepseek2-60b
将该容器提交为新版本训练容器镜像,注意新镜像的tag与旧镜像不一致。示例如下。docker commit 8b70390775f2 newimage:latest
- 执行以下命令运行训练镜像。
- 检查新版TaskD是否升级完成,参考检查TaskD组件章节,检查组件状态是否正常。
- (可选)回退老版本。若旧版镜像仍然存在,无需回退操作;若不存在则按上述步骤,重新安装旧版本TaskD软件包即可。
父主题: 升级