开发者
资源
[object Object]

[object Object][object Object]undefined
[object Object]
  • 接口功能: 对优化器输入的m和v作为索引,取出各自qmap中的值,乘以每个blockSize对应的absmax进行反量化,而后实现AdamW优化器功能,更新后的m和v每blockSize中取一个最大值,每blockSize个m和v对应一个absmax,进行一次norm归一化,利用二分法找到对应m和v对应qmap中的索引作为输出,absmax也作为下一轮量化的输入。

  • 优化器计算公式:

    mt=β1mt1+(1β1)gtm_{t}=\beta_{1} m_{t-1}+\left(1-\beta_{1}\right) g_{t} \\ vt=β2vt1+(1β2)gt2v_{t}=\beta_{2} v_{t-1}+\left(1-\beta_{2}\right) g_{t}^{2} m^t=mt1β1t\hat{m}_{t}=\frac{m_{t}}{1-\beta_{1}^{t}} \\ v^t=vt1β2t\hat{v}_{t}=\frac{v_{t}}{1-\beta_{2}^{t}} \\ θt+1=θtηv^t+ϵm^tηλθt1\theta_{t+1}=\theta_{t}-\frac{\eta}{\sqrt{\hat{v}_{t}}+\epsilon} \hat{m}_{t}-\eta \cdot \lambda \cdot \theta_{t-1}
[object Object]

每个算子分为,必须先调用“aclnnApplyAdamWQuantGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnApplyAdamWQuant”接口执行计算。

[object Object]
[object Object]
[object Object]
  • 参数说明:

    [object Object]

    [object Object]
  • 返回值:

    aclnnStatus: 返回状态码,具体参见

    第一段接口完成入参校验,出现以下场景时报错: [object Object]

    [object Object]
[object Object]
  • 参数说明:

    [object Object]
  • 返回值:

    aclnnStatus: 返回状态码,具体参见

[object Object]

varRef的shape满足约束:

  • varRef.shape = grad.shape
  • varRef.shape = mRef.shape
  • varRef.shape = vRef.shape
  • varRef.size/blockSize = absmaxMRef.size
  • varRef.size/blockSize = absmaxVRef.size

确定性计算:

  • aclnnApplyAdamWQuant默认确定性实现。
[object Object]

示例代码如下,仅供参考,具体编译和执行过程请参考

[object Object]