高精度 功能说明在进行attention计算时,Q∙KT的结果有可能溢出float16,导致算子输出tensor中间出现NAN值;此时可开启此功能,算子内部使用float32承载中间结果。 开启方式参数“kernelType”置为KERNELTYPE_HIGH_PRECISION。 约束说明开启此功能时,传入的mask中需把-inf换成1。 高精度功能只在Atlas A2 训练系列产品/Atlas 800I A2 推理产品和Atlas A3 推理系列产品/Atlas A3 训练系列产品上才能生效。 父主题: 功能列表