SetTail
产品支持情况
产品 |
是否支持 |
|---|---|
Atlas 350 加速卡 |
√ |
√ |
|
√ |
|
√ |
|
√ |
|
x |
|
x |
功能说明
在不改变Tiling的情况下,重新设置本次计算的singleCoreM/singleCoreN/singleCoreK,以元素为单位。
函数原型
1 | __aicore__ inline void SetTail(int tailM = -1, int tailN = -1, int tailK = -1) |
参数说明
参数名 |
输入/输出 |
描述 |
|---|---|---|
tailM |
输入 |
重新设置的singleCoreM值 |
tailN |
输入 |
重新设置的singleCoreN值 |
tailK |
输入 |
重新设置的singleCoreK值 |
返回值说明
无
约束说明
无
调用示例
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | REGIST_MATMUL_OBJ(&pipe, GetSysWorkSpacePtr(), mm, &tiling); // tailM:M方向上剩余元素个数,tailN:N方向上剩余元素个数,tailK:K方向上剩余元素个数 // 如果是尾核,剩余元素可能会少于单核需要计算的元素。此时,需要使用SetTail重新设置本次计算的元素个数 if (tailM < tiling.singleCoreM || tailN < tiling.singleCoreN || tailK < tiling.singleCoreK) { matmulObj.SetTail(tailM, tailN, tailK); } mm.SetTensorA(gm_a); mm.SetTensorB(gm_b); if (tiling.isBias) { mm.SetBias(gmBias); } mm.IterateAll(gm_c); mm.End(); |
父主题: Matmul Kernel侧接口