昇腾社区首页
中文
注册

特性介绍

Multi Step推理允许推理引擎在一次调度中进行异步多次前向推理,以达到提升吞吐的效果。目前只支持异步单次推理,能够利用NPU执行时间在一定程度上掩盖前后处理时间,进而实现性能优化。

该特性不建议在正式商用场景下开启。