aclGenGraphAndDumpForOp
函数功能
构建单个算子的图并Dump,生成.txt文件。此处的图是指表达算子IR(Intermediate Representation)的结构,图编译过程中由于融合、拆分等原因会导致图不断变换、进而生成新的图,这些变换的目的是为了将用户表达的图适配到昇腾AI处理器上,获得更高性能。
使用场景:
算子调优场景下,调用本接口构建单个算子的图并Dump,生成.txt文件,作为算子调优的输入数据之一。
对于不涉及构建图的场景(例如单算子API执行),无需使用该接口。
函数原型
aclError aclGenGraphAndDumpForOp(const char *opType, int numInputs, const aclTensorDesc *const inputDesc[], const aclDataBuffer *const inputs[], int numOutputs, const aclTensorDesc *const outputDesc[], aclDataBuffer *const outputs[], const aclopAttr *attr, aclopEngineType engineType, const char *graphDumpPath, const aclGraphDumpOption *graphDumpOpt)
参数说明
参数名  | 
输入/输出  | 
说明  | 
|---|---|---|
opType  | 
输入  | 
指定算子类型名称的指针。  | 
numInputs  | 
输入  | 
算子输入tensor的数量。  | 
inputDesc  | 
输入  | 
算子输入tensor描述的指针数组。 需提前调用aclCreateTensorDesc接口创建aclTensorDesc类型。 inputDesc数组中的元素个数必须与numInputs参数值保持一致,且inputs数组与inputDesc数组中的元素必须一一对应。  | 
inputs  | 
输入  | 
算子输入tensor的指针数组。 需提前调用aclCreateDataBuffer接口创建aclDataBuffer类型的数据。 inputs数组中的元素个数必须与numInputs参数值保持一致,且inputs数组与inputDesc数组中的元素必须一一对应。  | 
numOutputs  | 
输入  | 
算子输出tensor的数量。  | 
outputDesc  | 
输入  | 
算子输出tensor描述的指针数组。 需提前调用aclCreateTensorDesc接口创建aclTensorDesc类型。 outputDesc数组中的元素个数必须与numOutputs参数值保持一致,且outputs数组与outputDesc数组中的元素必须一一对应。  | 
outputs  | 
输入  | 
算子输出tensor的指针数组。 需提前调用aclCreateDataBuffer接口创建aclDataBuffer类型的数据。 outputs数组中的元素个数必须与numOutputs参数值保持一致,且outputs数组与outputDesc数组中的元素必须一一对应。  | 
attr  | 
输入  | 
算子属性的指针。 需提前调用aclopCreateAttr接口创建aclopAttr类型。  | 
engineType  | 
输入  | 
算子执行引擎。  | 
graphDumpPath  | 
输入  | 
Dump单算子图所生成的文件(文件名后缀为.txt)的保存路径的指针。 路径需要由用户提前创建,路径中如果不指定文件名,则由AscendCL内部指定文件名。 如果多次Dump时,指定同一个路径,且文件名相同,则最新一次的文件会覆盖之前的文件。  | 
graphDumpOpt  | 
输入  | 
单算子图的dump选项的指针。 当前该参数预留,仅支持传入nullptr。  | 
返回值说明
返回0表示成功,返回其他值表示失败。