aclnnAdvanceStep
产品支持情况
功能说明
接口功能:
vLLM是一个高性能的LLM推理和服务框架,专注于优化大规模语言模型的推理效率。它的核心特点包括PageAttention和高效内存管理。advance_step算子的主要作用是推进推理步骤,即在每个生成步骤中更新模型的状态并生成新的inputTokens、inputPositions、seqLens和slotMapping,为vLLM的推理提升效率。
计算公式:
函数原型
每个算子分为,必须先调用“aclnnAdvanceStepGetWorkspaceSize”接口获取入参并根据计算流程计算所需workspace大小,再调用“aclnnAdvanceStep”接口执行计算。
[object Object]
[object Object]
aclnnAdvanceStepGetWorkspaceSize
参数说明:
[object Object]返回值:
第一段接口会完成入参校验,出现以下场景时报错:
[object Object]aclnnAdvanceStep
约束说明
- 确定性计算:
- aclnnAdvanceStep默认确定性实现。
调用示例
[object Object]