可以通过torch_npu中的set_option接口配置算子编译过程中的属性,通过ACL接口实现。
import torch import torch_npu option = {key: val} torch_npu.npu.set_option(option) # 以dict方式进行设置
使用样例如下,以配置ACL_PRECISION_MODE为例。
import torch import torch_npu option = {"ACL_PRECISION_MODE":"must_keep_origin_dtype"} torch_npu.npu.set_option(option)
可选值 |
含义 |
可设置的val值 |
说明 |
---|---|---|---|
ACL_PRECISION_MODE |
选择算子精度模式。 |
|
如果不配置该编译选项,则
|
ACL_OPTYPELIST_FOR_IMPLMODE |
列举算子类型列表。 |
当前仅支持配置的算子为Pooling、SoftmaxV2、LRN、ROIAlign。 |
该参数当前仅支持设置某个具体算子的实现方式,不支持设置多个算子。 |
MM_BMM_ND_ENABLE |
开启MatMul、BatchMatMul算子支持ND模式。 |
|
默认采用enable模式。 |
ACL_OP_DEBUG_OPTION |
算子内存检测开关。 |
oom:用于定位算子执行过程中检测Global Memory是否内存越界,越界算子会直接报错。 |
维测能力,默认不配置。 |