开发者
资源
[object Object][object Object][object Object]undefined
[object Object]

将Mx scale矩阵从L1 Buffer搬运到L0A Buffer。

[object Object]
[object Object]
[object Object][object Object]undefined
[object Object]

[object Object]

PIPE_MTE1

[object Object]
  • scale矩阵的分形固定为(16, 2, 16),对应L0A Buffer的分形为(16, 32, 16),占L0A Buffer地址的1 / 16,需要按照这种地址约束存放地址。
  • dst(L0A Buffer的地址)的数据类型支持fp4x2_e2m1_t、fp4x2_e1m2_t、fp8_e5m2_t、fp8_e4m3fn_t,src的数据类型支持fp8_e8m0_t。
  • dst、src的起始地址需要32字节对齐。
[object Object]
[object Object]