从Host到Device的数据传输(异步)

调用接口后,需增加异常处理的分支,并记录报错日志、提示日志,此处不一一列举。以下是关键步骤的代码示例,不可以直接拷贝编译运行,仅供参考。

//1. 申请内存
uint64_t size = 1 * 1024 * 1024;
void* hostAddr = NULL;
void* devAddr = NULL;
//由于异步内存复制时,要求首地址64字节对齐,因此申请内存时,size需加64
aclrtMallocHost(&hostAddr, size + 64);
//通过aclrtMalloc接口申请的内存,系统已保证内存地址64字节对齐,无需用户处理对齐的逻辑
aclrtMalloc(&devAddr, size, ACL_MEM_MALLOC_NORMAL_ONLY);

//2. 异步内存复制
aclrtStream stream = NULL;
aclrtCreateStream(&stream);
//获取到64字节对齐的地址
char *hostAlignAddr =(char *)hostAddr + 64 - ((uintptr_t)hostAddr % 64);
//申请内存后,可向内存中读入数据,该自定义函数ReadFile由用户实现
ReadFile(fileName, hostAlignAddr, size);
aclrtMemcpyAsync(devAddr, size, hostAlignAddr, size, ACL_MEMCPY_HOST_TO_DEVICE, stream);
aclrtSynchronizeStream(stream);

//3. 释放资源
aclrtDestroyStream(stream);
aclrtFreeHost(hostAddr);
aclrtFree(devAddr);

//......