开发者
资源
[object Object]

[object Object][object Object]undefined
[object Object]
  • 接口功能: 实现AdamW优化器功能。

  • 计算公式:

    gt={gt if maximize=truegt if maximize=falseg_t=\begin{cases}-g_t & \text{ if } maximize= true\\ g_t & \text{ if } maximize=false \end{cases} mt=β1mt1+(1β1)gtm_{t}=\beta_{1} m_{t-1}+\left(1-\beta_{1}\right) g_{t} \\ vt=β2vt1+(1β2)gt2v_{t}=\beta_{2} v_{t-1}+\left(1-\beta_{2}\right) g_{t}^{2} β1t=β1t1×β1\beta_{1}^{t}=\beta_{1}^{t-1}\times\beta_{1} β2t=β2t1×β2\beta_{2}^{t}=\beta_{2}^{t-1}\times\beta_{2} vt={max(maxGradNorm,vt) if amsgrad=truevt if amsgrad=falsev_t=\begin{cases}\max(maxGradNorm, v_t) & \text{ if } amsgrad = true\\ v_t & \text{ if } amsgrad = false \end{cases} m^t=mt1β1t\hat{m}_{t}=\frac{m_{t}}{1-\beta_{1}^{t}} \\ v^t=vt1β2t\hat{v}_{t}=\frac{v_{t}}{1-\beta_{2}^{t}} \\ θt+1=θtηv^t+ϵm^tηλθt1\theta_{t+1}=\theta_{t}-\frac{\eta}{\sqrt{\hat{v}_{t}}+\epsilon} \hat{m}_{t}-\eta \cdot \lambda \cdot \theta_{t-1}
[object Object]

每个算子分为,必须先调用“aclnnApplyAdamWGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnApplyAdamW”接口执行计算。

[object Object]
[object Object]
[object Object]
  • 参数说明:

    [object Object]

    [object Object]
  • 返回值:

    aclnnStatus: 返回状态码,具体参见

    第一段接口完成入参校验,出现以下场景时报错: [object Object]

    [object Object]
[object Object]
  • 参数说明:

    [object Object]
  • 返回值:

    aclnnStatus: 返回状态码,具体参见

[object Object]
  • 确定性计算:
    • aclnnApplyAdamW默认确定性实现。
[object Object]

示例代码如下,仅供参考,具体编译和执行过程请参考

[object Object]