Iterate
功能说明
每调用一次Iterate,会计算出一片baseM * baseN的C矩阵。接口内部会维护迭代进度,调用一次后会对A、B矩阵首地址进行偏移。默认以先M轴再N轴的迭代顺序,也可以通过调整tiling参数iterateOrder,转换为先N轴再M轴的迭代顺序。
当传入数据未对齐,存在尾块时,会在最后一次迭代输出尾块的计算结果。
函数原型
__aicore__ inline bool Iterate(bool enPartialSum = false);
参数说明
参数名 |
输入/输出 |
描述 |
---|---|---|
enPartialSum |
输入 |
是否将矩阵乘的结果累加于现有的CO1数据,默认值false。在L0C累加时,只支持A矩阵和B矩阵相乘的输出C矩阵规格为singleM==baseM &&singleN==baseN。(单matmul实例场景,多matmul场景不支持该特性) |
返回值
false:单核上的所有数据全部算完。
true:数据仍在迭代计算中。
支持的型号
Atlas A2训练系列产品
Atlas推理系列产品AI Core
注意事项
无
父主题: Matmul 高阶API