WaitGetTensorC

功能说明

当使用GetTensorC异步接口将结果矩阵从GM拷贝到UB,且UB后续需要进行Vector计算时,需要调用WaitGetTensorC进行同步。

函数原型

1
__aicore__ inline void WaitGetTensorC()

参数说明

返回值

支持的型号

Atlas A2 训练系列产品/Atlas 800I A2 推理产品

约束说明

调用示例

1
2
3
4
5
6
7
8
// 异步模式样例
mm.template Iterate<false>();
// 其他操作
for (int i = 0; i < singleM/baseM*singleN/baseN; ++i) {   
    mm.GetTensorC<false>(ubCmatrix); 
    mm.WaitGetTensorC();
    // Vector 操作
}