算子编译简介
本章节介绍的算子编译方法支持开发者通过bisheng命令行和CMake进行手动配置编译选项,或编写CMake脚本来实现编译。开发者可以将Host侧main.cpp和Device侧Kernel核函数置于同一实现文件中,以实现异构编译。
- 目前,该编译方法仅支持如下型号:
Atlas A3 训练系列产品 /Atlas A3 推理系列产品 Atlas A2 训练系列产品 /Atlas A2 推理系列产品 Atlas 推理系列产品
- 当前版本暂不支持CPU孪生调试功能,NPU仿真调试功能。
- 在同一个编译单元,若存在多个核函数,暂不支持自动推导Kernel类型,需要开发者手动设置Kernel类型。
- 特别地,针对如下型号,无论是否是同一个编译单元多个核函数的场景,均不支持在开发者未设置Kernel类型时进行自动推导。建议开发者手动设置Kernel类型。
Atlas 推理系列产品
- 针对
Atlas 推理系列产品 ,暂不支持设置Kernel类型为KERNEL_TYPE_MIX_VECTOR_CORE。
- 特别地,针对如下型号,无论是否是同一个编译单元多个核函数的场景,均不支持在开发者未设置Kernel类型时进行自动推导。建议开发者手动设置Kernel类型。
父主题: AI Core算子编译