开发者
下载
[object Object]

Ascend C的核心设计目标之一是实现跨代兼容。然而,每一代芯片在微架构上都存在独特的硬件特性,因此无法保证所有接口仅通过重编译就能达成完全的跨代兼容。基于这一前提,本手册旨在为Ascend C算子开发者提供系统化指导,帮助将算子Kernel代码从当前芯片平滑移植到目标代际芯片上运行,实现高效、可控的迁移。

中所述,__NPU_ARCH__是Device侧AI Core代码中的一个预处理宏,用于标识AI处理器的架构版本。例如,Ascend 950PR/Ascend 950DT的__NPU_ARCH__为3510,而Atlas A3 训练系列产品/Atlas A3 推理系列产品的__NPU_ARCH__则为2201。因此,后续章节将以__NPU_ARCH__为主线,重点介绍相邻代际芯片间的平滑迁移方法。

[object Object]

建议开发者采用以下实践:

  • 使用兼容的 API 接口。
  • 若涉及特定领域的扩展特性,应在 Device 侧通过 进行隔离,在 Host 侧通过 [object Object] 进行隔离。
  • 使用 [object Object] 直调或
[object Object]