调用接口后,需增加异常处理的分支,并记录报错日志、提示日志,此处不一一列举。以下是关键步骤的代码示例,不可以直接拷贝编译运行,仅供参考。
//1. 申请内存 uint64_t size = 1 * 1024 * 1024; void* hostAddr = NULL; void* devAddr = NULL; //由于异步内存复制时,要求首地址64字节对齐,因此申请内存时,size需加64 aclrtMallocHost(&hostAddr, size + 64); //通过aclrtMalloc接口申请的内存,系统已保证内存地址64字节对齐,无需用户处理对齐的逻辑 aclrtMalloc(&devAddr, size, ACL_MEM_MALLOC_NORMAL_ONLY); //2. 申请内存后,可向内存中读入数据,该自定义函数ReadFile由用户实现 ReadFile(fileName, devAddr, size); //3. 异步内存复制 aclrtStream stream = NULL; aclrtCreateStream(&stream); //获取到64字节对齐的地址 char *hostAlignAddr =(char *)hostAddr + 64 - ((uintptr_t)hostAddr % 64); aclrtMemcpyAsync(hostAlignAddr, size, devAddr, size, ACL_MEMCPY_DEVICE_TO_HOST, stream); aclrtSynchronizeStream(stream); //4. 释放资源 aclrtDestroyStream(stream); aclrtFreeHost(hostAddr); aclrtFree(devAddr); //......