HelloWorld
本示例展示了如何使用Ascend C编写一个简单的"Hello World"程序,包括核函数(设备侧实现的入口函数)的实现、调用流程以及编译运行的完整步骤。通过本示例,您可以快速了解Ascend C的基本开发流程。完整样例请参考LINK。
代码文件hello_world.cpp包括核函数实现和主函数实现。
- 核函数实现:该核函数的核心逻辑是输出"Hello World!!!"字符串。
- 主函数实现:在主函数中,进行初始化环境、资源申请、通过<<<>>>调用核函数以及释放资源等操作。完整的代码流程和逻辑可以通过代码注释查看。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
// Host侧应用程序需要包含的头文件 #include "acl/acl.h" // Kernel侧需要包含的头文件 #include "kernel_operator.h" __global__ __aicore__ void hello_world() { // 设置Kernel类型,控制算子执行时仅启动Vector核 KERNEL_TASK_TYPE_DEFAULT(KERNEL_TYPE_AIC_ONLY); AscendC::printf("Hello World!!!\n"); } int32_t main(int argc, char const *argv[]) { // 初始化 aclInit(nullptr); // 运行管理资源申请 int32_t deviceId = 0; aclrtSetDevice(deviceId); aclrtStream stream = nullptr; aclrtCreateStream(&stream); // 设置参与计算的核数为1(核数可根据实际需求设置) constexpr uint32_t blockDim = 1; // 用内核调用符<<<>>>调用核函数 hello_world<<<blockDim, nullptr, stream>>>(); aclrtSynchronizeStream(stream); // 资源释放和去初始化 aclrtDestroyStream(stream); aclrtResetDevice(deviceId); aclFinalize(); return 0; }
完成代码实现后,可以通过两种方式,对上述代码进行编译:
- 使用bisheng命令行进行编译
bisheng hello_world.asc --npu-arch=dav-2201 -o demo ./demo
- 使用CMake进行编译CMake编译配置如下:
cmake_minimum_required(VERSION 3.16) # find_package(ASC)是CMake中用于查找和配置Ascend C编译工具链的命令 find_package(ASC REQUIRED) # 指定项目支持的语言包括ASC和CXX,ASC表示支持使用毕昇编译器对Ascend C编程语言进行编译 project(kernel_samples LANGUAGES ASC CXX) add_executable(demo hello_world.asc ) # 通过编译选项设置NPU架构 target_compile_options(demo PRIVATE $<$<COMPILE_LANGUAGE:ASC>:--npu-arch=dav-2201> )编译和运行步骤如下:
mkdir -p build && cd build; cmake ..;make -j; ./demo
- 该样例仅支持如下型号:
Atlas A3 训练系列产品 /Atlas A3 推理系列产品 Atlas A2 训练系列产品 /Atlas A2 推理系列产品
- --npu-arch用于指定NPU的架构版本,dav-后为架构版本号,各产品型号对应的架构版本号请通过表1进行查询。
运行结果如下,本样例共调度1个核,打印了核号和"Hello World!!!"等信息。
opType=hello_world, DumpHead: AIC-0, CoreType=AIC, block dim=1, total_block_num=1, block_remain_len=1048416, block_initial_space=1048576, rsv=0, magic=5aa5bccd CANN Version: xxxxxxxxx, TimeStamp: xxxxxxxxx Hello World!!!
父主题: 快速入门