特性介绍
Multi Step推理允许推理引擎在一次调度中进行异步多次前向推理,以达到提升吞吐的效果。目前只支持异步单次推理,能够利用NPU执行时间在一定程度上掩盖前后处理时间,进而实现性能优化。

该特性不建议在正式商用场景下开启。
父主题: Multi Step推理
Multi Step推理允许推理引擎在一次调度中进行异步多次前向推理,以达到提升吞吐的效果。目前只支持异步单次推理,能够利用NPU执行时间在一定程度上掩盖前后处理时间,进而实现性能优化。
该特性不建议在正式商用场景下开启。