昇腾社区首页
中文
注册

在计算节点安装MindIO ACP SDK

对接Torch和MindSpore使用MindIO ACP SDK,加速Torch和MindSpore训练CheckPoint save和load操作。

操作步骤

  1. 以安装用户{MindIO-install-user}登录安装节点。

    安装用户设置的口令需符合口令复杂度要求(请参见口令复杂度要求)。密码有效期为90天,您可以在“/etc/login.defs”文件中修改有效期的天数,或者通过chage命令来设置用户的有效期,详情请参见设置用户有效期

  2. 将内存缓存系统软件包上传至设备中安装用户有权限读写的路径下。
    • 内存缓存系统软件包以获取的实际包名为准。
    • 如果Python环境是共享目录,则在任一计算节点上传即可,否则所有计算节点都需要上传安装包。
  3. 进入软件包上传路径,解压内存缓存系统软件包。
    unzip Ascend-mindxdl-mindio_{version}_linux-{arch}.zip
    表1 解压后内层目录结构

    目录

    目录内文件

    说明

    mindio_acp-{mindio_acp_version}-py3-none-linux_{arch}.whl

    -

    Torch和MindSpore框架MindIO ACP安装包。

    mindio_ttp-{mindio_ttp_version}-py3-none-linux_{arch}.whl

    -

    MindIO TFT安装包。

    security_tool_{arch}.tar.gz

    parameter.py

    MindIO TFT证书管理脚本工具。

    log_util.py

    hseceasy_util.py

    file_util.py

    file_op.py

    cert_util.py

    cert_store_path_util.py

    _init_.py

    tftf_security_tool_tls_cert.py

  4. 进入上传路径,安装MindIO ACP SDK。
    pip3 install mindio_acp-{mindio_acp_version}-py3-none-linux_{arch}.whl --force-reinstall
    • 首次安装MindIO ACP SDK回显如下,表示安装成功。
      1
      2
      3
      Processing ./mindio_acp-{mindio_acp_version}-py3-none-linux_{arch}.whl
      Installing collected packages: mindio_acp
      Successfully installed mindio_acp-{version}
      
    • 非首次安装MindIO ACP SDK回显如下,表示安装成功。
      1
      2
      3
      4
      5
      6
      7
      Processing ./mindio_acp-{mindio_acp_version}-py3-none-linux_{arch}.whl
       Installing collected packages: mindio_acp
         Attempting uninstall: mindio_acp
           Found existing installation: mindio_acp{version}
           Uninstalling mindio_acp{version}:
             Successfully uninstalled mindio_acp{version}
       Successfully installed mindio_acp{version}
      
  5. 将软件安装目录内的可执行文件和代码脚本权限更改为550,避免出现非法篡改。
    chmod -R 550 {MindIO ACP SDK安装目录}