设置算子编译选项
可以通过torch_npu中的set_option接口配置算子编译过程中的属性,通过ACL接口实现。
import torch 
import torch_npu 
option = {key: val} 
torch_npu.npu.set_option(option) # 以dict方式进行设置
使用样例如下,以配置ACL_PRECISION_MODE为例。
import torch 
import torch_npu 
option = {"ACL_PRECISION_MODE":"must_keep_origin_dtype"} 
torch_npu.npu.set_option(option)
| 可选值 | 含义 | 可设置的val值 | 说明 | 
|---|---|---|---|
| ACL_PRECISION_MODE | 选择算子精度模式。 | 
 | 如果不配置该编译选项,则 
 | 
| ACL_OPTYPELIST_FOR_IMPLMODE | 列举算子类型列表。 | 当前仅支持配置的算子为Pooling、SoftmaxV2、LRN、ROIAlign。 | 该参数当前仅支持设置某个具体算子的实现方式,不支持设置多个算子。 | 
| MM_BMM_ND_ENABLE | 开启MatMul、BatchMatMul算子支持ND模式。 | 
 | 默认采用enable模式。 | 
| ACL_OP_DEBUG_OPTION | 算子内存检测开关。 | oom:用于定位算子执行过程中检测Global Memory是否内存越界,越界算子会直接报错。 | 维测能力,默认不配置。 | 
父主题: 附录