说明

用于配置compile接口所需要的参数。

定义

GraphInputs graphInputs;
PrecisionPolicy precision_policy = PrecisionPolicy::FP16;
std::string soc_version = "Ascend310P3";
size_t minBlockSize = 1;
size_t optimizationLevel = 0;
bool requireFullCompilation = false;
bool truncateLongAndDouble = true;
bool allowTensorReplaceInt = false;
std::vector<std::string> torchExecutedOps;
std::vector<std::string> torchExecutedModules;

成员

成员名称	描述
graphInputs	描述模型图中所有输入的数据结构。默认值：无
precision_policy	设置模型的推理精度策略，支持混合精度PREF_FP32、FP16以及FP32精度。默认值：PrecisionPolicy::FP16
soc_version	芯片型号。默认值："Ascend310P3"
minBlockSize	切分子图的最少节点数量。默认值：1
optimizationLevel	模型优化等级，取值如下： 0：表示不优化； 1：表示图优化； 2：表示算子优化，仅在编译TorchScript模型时生效。默认值：0
requireFullCompilation	是否要求整图编译。默认值：false
truncateLongAndDouble	是否允许long和double类型转换。默认值：true
allowTensorReplaceInt	是否允许采用Tensor代替Int，，仅在编译TorchScript模型时生效。默认值：false
torchExecutedOps	强制fallback执行的算子，例如：["aten::add"]或者[torch.ops.aten.add.default]。默认值：无
torchExecutedModules	强制fallback执行的模块。默认值：无

class CompileSpec

说明

定义

成员