昇腾社区首页
中文
注册
开发者
下载

copy_cbuf_to_bt

功能说明

如果矩阵运算涉及乘加两种运算,此时加法计算的偏置向量需要搬运到偏置表(bias table)中。

该接口将mad需要的偏置数据从L1缓存移动到偏置表缓冲区。偏置表缓冲区的大小为1KB。

参数说明

表1 偏置表搬运参数说明

参数名

说明

取值范围

单位

dst

目的地址,64B对齐,uint64_t类型,代表首地址。

/

/

src

源地址,32B对齐。

/

/

convControl

如果启用,L1中的数据将被视为FP16格式,并在写入偏置表缓冲区之前转换为FP32格式。

[0, 1]

/

nBurst

搬运数据块数量。

[2, 2^12-1]

elem

lenBurst

数据块长度。

[0, 2^16-1]

64B

sourceGap

两个相邻源数据块之间的间隙大小。

[0, 2^16-1]

32B

dstGap

两个相邻目的数据块之间的间隙大小。

[0, 2^16-1]

64B

srcGap/dstGap:表示两次搬运之间的gap,即上一个burst的尾地址跟下一个burst的首地址之间的距离;

接口原型

void copy_cbuf_to_bt(uint64_t dst, __cbuf__ void *src, uint16_t convControl, uint16_t nBurst, uint16_t lenBurst, uint16_t sourceGap, uint16_t dstGap);

流水类型

PIPE_MTE1