aclrtMalloc
函数功能
在Device上分配size大小的线性内存,并通过*devPtr返回已分配内存的指针,且内存首地址64字节对齐。本接口分配的内存会进行字节对齐,会对用户申请的size向上对齐成32字节整数倍后再多加32字节。
约束说明
- 本接口分配的内存不会对内容初始化,建议在使用内存前先调用aclrtMemset接口先初始化内存,清除内存中的随机数。
 - 本接口内部不会进行隐式的Device同步或流同步。如果申请内存成功或申请内存失败会立刻返回结果。
 - 使用aclrtMalloc接口申请的内存,需要通过aclrtFree接口释放内存。
 - 频繁调用aclrtMalloc接口申请内存、调用aclrtFree接口释放内存,会损耗性能,建议用户提前做内存预先分配或二次管理,避免频繁申请/释放内存。
 - 若用户需申请大块内存并自行划分、管理内存时,建议使用aclrtMallocAlign32接口,该接口相比aclrtMalloc接口,只会对用户申请的size向上对齐成32字节整数倍,不会再多加32字节。
      
不管是aclrtMalloc接口,还是aclrtMallocAlign32接口,若用户使用本接口申请大块内存并自行划分、管理内存时,每段内存需同时满足以下需求:
- 内存大小向上对齐成32整数倍+32字节(m=ALIGN_UP[len,32]+32字节);
 - 内存起始地址需满足64字节对齐(ALIGN_UP[m,64])。
 
 
       len表示某段内存的大小,ALIGN_UP[len,k]表示向上按k字节对齐:((len-1)/k+1)*k。
 
函数原型
aclError aclrtMalloc(void **devPtr, size_t size, aclrtMemMallocPolicy policy)
参数说明
| 
          参数名  | 
        
          输入/输出  | 
        
          说明  | 
       
|---|---|---|
| 
          devPtr  | 
        
          输出  | 
        
          “Device上已分配内存的指针”的指针。  | 
       
| 
          size  | 
        
          输入  | 
        
          申请内存的大小,单位Byte。 size不能为0。  | 
       
| 
          policy  | 
        
          输入  | 
        
          内存分配规则。  | 
       
返回值说明
返回0表示成功,返回其他值表示失败,请参见aclError。
     父主题: 内存管理