通用约束 用户定义的Tensor在内存分配时会对起始地址进行对齐,不同scope的对齐要求如表1所示。 使用TIK数据计算和数据搬运接口时,目的操作数和源操作数地址偏移对齐要求和表1保持一致,如果TIK指令接口中已说明操作数起始地址对齐要求,则以具体指令中的说明为准。 表1 不同scope的对齐要求 scope 对齐要求 Unified Buffer Atlas 200/300/500 推理产品,要求32Byte对齐 Atlas 训练系列产品,要求32Byte对齐 Atlas 推理系列产品AI Core,要求32Byte对齐 Atlas 推理系列产品Vector Core,要求32Byte对齐 L1 Buffer 512Byte对齐 L1OUT Buffer float16类型数据要求512Byte对齐;float32/int32/uint32类型数据要求1024Byte对齐 Global Memory 暂无对齐要求 父主题: TBE TIK API