产品 |
是否支持 |
---|---|
|
√ |
|
√ |
|
√ |
|
√ |
|
√ |
执行模型推理。
本接口是异步接口,调用接口成功仅表示任务下发成功,不表示任务执行成功。调用该接口后,需调用同步等待接口(例如,aclrtSynchronizeStream)确保任务已执行完成,否则可能会导致训练或推理等业务异常、Device断链掉卡等未知情况。
aclError aclmdlExecuteAsync(uint32_t modelId, const aclmdlDataset *input, aclmdlDataset *output, aclrtStream stream)
参数名 |
输入/输出 |
说明 |
---|---|---|
modelId |
输入 |
指定需要执行推理的模型的ID。 调用模型加载接口(例如aclmdlLoadFromFile接口、aclmdlLoadFromMem等)成功后,会返回模型ID,该ID作为本接口的输入。 |
input |
输入 |
模型推理的输入数据的指针。 对于捕获Stream上下发任务的场景,此处传nullptr。 |
output |
输出 |
模型推理的输出数据的指针。 对于捕获Stream上下发任务的场景,此处传nullptr。 |
stream |
输入 |
指定Stream。 |
返回0表示成功,返回其他值表示失败,请参见aclError。
//...... aclmdlExecuteAsync(modelId1, input, output, stream1); aclmdlExecuteAsync(modelId1, input, output, stream2); aclrtSynchronizeStream(stream1); aclrtSynchronizeStream(stream2); //......
// 线程A的接口调用顺序: lock(handle1) -> aclrtMemcpyAsync(stream1)刷新输入输出内存 -> aclmdlExecuteAsync(modelId1,stream1)执行推理 -> unlock(handle1) // 线程B的接口调用顺序: lock(handle1) -> aclrtMemcpyAsync(stream1)刷新输入输出内存 -> aclmdlExecuteAsync(modelId1,stream1)执行推理 -> unlock(handle1)
其中:
Ascend RC形态
接口调用流程及示例代码,参见异步模型推理。