接口功能: 实现AdamW优化器功能。
计算公式:
每个算子分为,必须先调用“aclnnApplyAdamWGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnApplyAdamW”接口执行计算。
[object Object]
[object Object]
- 确定性计算:
- aclnnApplyAdamW默认确定性实现。
[object Object]
接口功能: 实现AdamW优化器功能。
计算公式:
gt={−gtgt if maximize=true if maximize=false mt=β1mt−1+(1−β1)gt vt=β2vt−1+(1−β2)gt2 β1t=β1t−1×β1 β2t=β2t−1×β2 vt={max(maxGradNorm,vt)vt if amsgrad=true if amsgrad=false m^t=1−β1tmt v^t=1−β2tvt θt+1=θt−v^t+ϵηm^t−η⋅λ⋅θt−1每个算子分为,必须先调用“aclnnApplyAdamWGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnApplyAdamW”接口执行计算。