高精度
功能说明
在进行attention计算时,Q∙KT的结果有可能溢出float16,导致算子输出tensor中间出现NAN值;此时可开启此功能,算子内部使用float32承载中间结果。
开启方式
参数“kernelType”置为KERNELTYPE_HIGH_PRECISION。
约束说明
开启此功能时,传入的mask中需把-inf换成1。
高精度功能只在
父主题: 高精度/近似计算
在进行attention计算时,Q∙KT的结果有可能溢出float16,导致算子输出tensor中间出现NAN值;此时可开启此功能,算子内部使用float32承载中间结果。
参数“kernelType”置为KERNELTYPE_HIGH_PRECISION。
开启此功能时,传入的mask中需把-inf换成1。
高精度功能只在