昇腾社区首页
中文
注册

模型转换后

  • 如果启用了“-sim”“--similar”参数,在执行转换后的模型文件前请先将输出的工程路径加入环境变量PYTHONPATH中。
  • 如果需要用到ascend_function下的similar_api.py文件中的get_device_properties(device)接口,请用户根据实际需要手动编辑StubDevicePropertise(object)中的各项参数值。
  • 如果启用了distributed参数,转换后会生成如下run_distributed_npu.sh文件:
    export MASTER_ADDR=127.0.0.1
    export MASTER_PORT=63350
    export HCCL_WHITELIST_DISABLE=1   
    
    NPUS=($(seq 0 7))
    export NPU_WORLD_SIZE=${#NPUS[@]}
    rank=0
    for i in ${NPUS[@]}
    do
        export NPU_CALCULATE_DEVICE=${i}
        export RANK=${rank}
        echo run process ${rank}
        please input your shell script here > output_npu_${i}.log 2>&1 &
        let rank++
    done
    表1 参数说明

    参数

    说明

    MASTER_ADDR

    指定训练服务器的ip

    MASTER_PORT

    指定训练服务器的端口

    HCCL_WHITELIST_DISABLE

    hccl后端环境

    NPUS

    指定在特定NPU上运行

    NPU_WORLD_SIZE

    NPU核心数量

    RANK

    进程号

    在执行转换后的模型之前需要把run_distributed_npu.sh文件中的“please input your shell script here”语句替换成模型原来的训练shell脚本。执行run_distributed_npu.sh文件后会生成指定NPU的log日志。