将矩阵由L1 Buffer搬运到L0C Buffer中。该搬运支持的数据类型如下:
- bfloat16_t->bfloat16_t
- half->half
- float->half
- float->bfloat16_t
- float->float
- int32_t->int32_t
- uint32_t->uint32_t
常规搬运
[object Object]同步搬运
[object Object]
无
PIPE_MTE1
- src的起始地址要求按照对应数据类型所占字节数对齐。
- dst的起始地址要求32字节对齐。
- 如果需要执行多条asc_copy_l12l0c指令,且asc_copy_l12l0c指令的目的地址存在重叠,需要插入同步指令,保证多个asc_copy_l12l0c指令的串行化,防止出现异常数据。
[object Object]