模型转换后
- 如果启用了“-sim”“--similar”参数,在执行转换后的模型文件前请先将输出的工程路径加入环境变量PYTHONPATH中。
- 如果需要用到ascend_function下的similar_api.py文件中的get_device_properties(device)接口,请用户根据实际需要手动编辑StubDevicePropertise(object)中的各项参数值。
- 如果启用了distributed参数,转换后会生成如下run_distributed_npu.sh文件:
export MASTER_ADDR=127.0.0.1 export MASTER_PORT=63350 export HCCL_WHITELIST_DISABLE=1 NPUS=($(seq 0 7)) export NPU_WORLD_SIZE=${#NPUS[@]} rank=0 for i in ${NPUS[@]} do export NPU_CALCULATE_DEVICE=${i} export RANK=${rank} echo run process ${rank} please input your shell script here > output_npu_${i}.log 2>&1 & let rank++ done
表1 参数说明 参数
说明
MASTER_ADDR
指定训练服务器的ip
MASTER_PORT
指定训练服务器的端口
HCCL_WHITELIST_DISABLE
hccl后端环境
NPUS
指定在特定NPU上运行
NPU_WORLD_SIZE
NPU核心数量
RANK
进程号
在执行转换后的模型之前需要把run_distributed_npu.sh文件中的“please input your shell script here”语句替换成模型原来的训练shell脚本。执行run_distributed_npu.sh文件后会生成指定NPU的log日志。
父主题: msFmkTransplt