开发者
资源

ReinterpretCast

产品支持情况

产品

是否支持

Atlas 350 加速卡

Atlas A3 训练系列产品/Atlas A3 推理系列产品

x

Atlas A2 训练系列产品/Atlas A2 推理系列产品

x

Atlas 200I/500 A2 推理产品

x

Atlas 推理系列产品AI Core

x

Atlas 推理系列产品Vector Core

x

Atlas 训练系列产品

x

功能说明

将当前GlobalTensor重解释为用户指定的新类型。转换后的Tensor与原Tensor地址及内容完全相同,Tensor的内存大小(比特数)保持不变。

函数原型

1
2
template <typename CAST_T>
__aicore__ inline GlobalTensor<CAST_T> ReinterpretCast() const

参数说明

表1 模板参数说明

参数名

描述

CAST_T

指定重解释后的新类型。

返回值说明

重解释后的GlobalTensor。

约束说明

当数据类型发生转换后,元素个数可能无法取整,例如3个int4b_t类型转换为uint32_t,则转换后调用GetSize接口,只能获取向下取整的整数值,这种场景在CPU状态运行时,会有对应的提示告警信息。

调用示例

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
uint64_t dataSize = 256; //设置input_global的大小为256

AscendC::GlobalTensor<int32_t> inputGlobal; // 类型为int32_t
inputGlobal.SetGlobalBuffer(reinterpret_cast<__gm__ int32_t *>(src_gm), dataSize); // 设置源操作数在Global Memory上的起始地址为src_gm,所占外部存储的大小为256个int32_t

AscendC::LocalTensor<int32_t> inputLocal = inQueueX.AllocTensor<int32_t>();    
AscendC::DataCopy(inputLocal, inputGlobal, dataSize); // 将Global Memory上的inputGlobal拷贝到Local Memory的inputLocal上
...
// 假设inputGlobal为int32_t 类型,包含16个元素(64字节)
// 调用ReinterpretCast将inputGlobal重解释为int16_t类型
AscendC::GlobalTensor<int16_t> interpreTensor = inputGlobal.template ReinterpretCast<int16_t>();
// 示例结果如下,二者数据完全一致,在物理内存上也是同一地址,仅根据不同类型进行了重解释
// inputGlobal:0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
// interpreTensor:0 0 1 0 2 0 3 0 4 0 5 0 6 0 7 0 8 0 9 0 10 0 11 0 12 0 13 0 14 0 15 0