函数:execute_v2
C函数原型 |
aclError aclopExecuteV2(const char *opType, int numInputs, aclTensorDesc *inputDesc[], aclDataBuffer *inputs[], int numOutputs, aclTensorDesc *outputDesc[], aclDataBuffer *outputs[], aclopAttr *attr, aclrtStream stream); |
---|---|
Python函数 |
ret = acl.op.execute_v2(op_type, input_desc, inputs, output_desc, outputs, attr, stream) |
函数功能 |
同步或者异步执行指定的算子。 |
输入说明 |
op_type:str,指定算子类型名称。 input_desc:list,表示算子输入tensor的描述, 整形列表,包含多个acl的tensor描述地址对象。 inputs:list,表示算子输入tensor,整形列表,包含多个aclDataBuffer数据地址对象。 output_desc:list,表示算子输出tensor的描述,整形列表,包含多个acl的tensor描述地址对象。 outputs:list,表示算子输出tensor,整形列表,包含多个aclDataBuffer数据地址对象。 attr:int,算子的属性地址对象。 stream:int,该算子需要加载的Stream对象。 |
返回值说明 |
ret:int,错误码。
|
约束说明 |
每个算子的输入、输出组织不同,需要应用在调用时严格按照算子输入、输出参数来组织算子。用户在调用acl.op.execute_v2接口时,pyACL根据optype、输入tensor的描述、输出tensor的描述、attr等信息查找对应的任务,并下发执行。
对于支持动态Shape的算子,无法明确算子输出Shape时,可调用acl.op.infer_shape接口获取算子的输出Shape:
执行有可选输入的算子时,如果可选输入不使用: |
注意事项 |
无 |
参考资源 |