GetTensorC
产品支持情况
产品 |
是否支持 |
---|---|
√ |
|
√ |
|
x |
|
x |
|
x |
|
x |
|
x |
功能说明
在完成Iterate操作后调用本接口,获取结果矩阵块,完成数据从L0C到GM的搬运。此接口与Iterate接口配合使用,用于在Iterate执行迭代计算后,获取结果矩阵。
函数原型
1 2 | template <bool sync = true> __aicore__ inline void GetTensorC(const AscendC::GlobalTensor<DstT> &output, uint8_t enAtomic = 0, bool enSequentialWrite = false) |
参数说明
参数名 |
描述 |
---|---|
sync |
预留参数,用户无需感知。 |
参数名 |
输入/输出 |
描述 |
---|---|---|
output |
输入 |
将计算结果搬至Global Memory的GM地址。 |
enAtomic |
输入 |
预留参数,用户无需感知。 |
enSequentialWrite |
输入 |
预留参数,用户无需感知。 |
返回值说明
无
约束说明
GetTensorC接口必须在Iterate后进行调用,完成卷积反向实现,调用顺序如下。
1 2 3 | while (Iterate()) { GetTensorC(); } |
调用示例
1 2 3 | while (gradInput_.Iterate()) { gradInput_.GetTensorC(gradInputGm_[offsetC_]); } |
父主题: Conv3DBackpropInput