性能验证
调优完成后,请还原代码,并刷新算子编译缓存,即将ACL_OP_COMPILER_CACHE_MODE设置为force,使用方法示例如下。
import torch import torch_npu option = {"ACL_OP_COMPILER_CACHE_MODE":"force"} torch_npu.npu.set_option(option)
使用调优后的自定义知识库前,请确保未开启二进制模式,使用方法如下。
torch_npu.npu.set_compile_mode(jit_compile=True)
使用调优后的自定义知识库(如何使用请参见如何使用调优后的自定义知识库)重新训练,验证性能是否提高。
父主题: PyTorch训练场景下离线调优