接口基本信息
将L0_SET_VALUE寄存器中的16位/32位数据广播到DST中的多个块中。
所属流水线:
- 对于L0A和L0B为目的地址,该指令在MTE1流水线中执行。
- 对于L1为目的地址,该指令在MTE2流水线中执行。
数据对齐要求:
- 对于L0A/L0B,地址应为512字节对齐,每个数据块为512字节。
- 对于L1,地址应为32字节对齐,每个数据块为32字节。
接口中用到的config是一个64位参数,不同位数设置不同内容,具体内容如下表:
位数 |
说明 |
取值范围 |
单位 |
---|---|---|---|
config[14:0] |
重复次数,每次重复时,src中的地址将增加 (config[46:32] + config[30:16]) * block_size; 如果希望执行一次指令,则设置config[14:0]=1 |
[0, 2^15-1] |
/ |
config[30:16] |
每次重复的块数量 |
[0, 2^15-1] |
/ |
config[46:32] |
两次连续重复之间的间隔 |
[0, 2^15-1] |
对于 L0A/L0B,单位为512字节 对于L1,单位为32字节 |
父主题: 矩阵广播搬入