产品 |
是否支持 |
---|---|
√ |
|
√ |
|
√ |
|
√ |
|
√ |
编译指定算子。在编译算子前,可以调用aclSetCompileopt接口设置编译选项。
每个算子的输入、输出组织不同,需要应用在调用时严格按照算子输入、输出参数来组织算子,用户在调用aclopCompile时,AscendCL根据optype、输入tensor的描述、输出tensor的描述、attr等信息查找对应的任务,再编译算子。
aclError aclopCompile(const char *opType, int numInputs, const aclTensorDesc *const inputDesc[], int numOutputs, const aclTensorDesc *const outputDesc[], const aclopAttr *attr, aclopEngineType engineType, aclopCompileType compileFlag, const char *opPath)
参数名 |
输入/输出 |
说明 |
---|---|---|
opType |
输入 |
算子类型名称的指针。 |
numInputs |
输入 |
算子输入tensor的数量。 |
inputDesc |
输入 |
算子输入tensor的描述的指针数组。 需提前调用aclCreateTensorDesc接口创建aclTensorDesc类型。 inputDesc数组中的元素个数必须与numInputs参数值保持一致。 |
numOutputs |
输入 |
算子输出tensor的数量。 |
outputDesc |
输入 |
算子输出tensor的描述的指针数组。 需提前调用aclCreateTensorDesc接口创建aclTensorDesc类型。 outputDesc数组中的元素个数必须与numOutputs参数值保持一致。 |
attr |
输入 |
算子属性的指针。 需提前调用aclopCreateAttr接口创建aclopAttr类型。 |
engineType |
输入 |
算子执行引擎。 |
compileFlag |
输入 |
算子编译标识。 |
opPath |
输入 |
算子实现文件(*.py)的路径的指针,不包含文件名。预留参数,当前仅支持设置为nullptr。 |
返回0表示成功,返回其他值表示失败,请参见aclError。