昇腾社区首页
中文
注册

函数:malloc_align32

C函数原型

aclError aclrtMallocAlign32(void **devPtr, size_t size, aclrtMemMallocPolicy policy)

Python函数

dev_ptr, ret = acl.rt.malloc_align32(size, policy)

函数功能

在Device上分配size大小的线性内存,并通过“dev_ptr”返回已分配内存的指针。本接口分配的内存会进行字节对齐,会对用户申请的size向上对齐成32字节整数倍。

与acl.rt.malloc接口相比,本接口只会对用户申请的size向上对齐成32字节整数倍,不会再多加32字节。

输入说明

  • size:int,申请内存的大小,单位Byte。size不能为0。
  • policy:int,内存分配规则,具体请参见aclrtMemMallocPolicy

输出说明

devPtr:int,Device上已分配内存的指针地址。

返回值说明

ret:int,错误码。

  • 返回0表示成功。
  • 返回其它值表示失败。

约束说明

  • 若涉及媒体数据处理功能,由于媒体数据处理功能对存放输入、输出数据的内存有更高的要求(例如,内存首地址128字节对齐),因此需调用专用的内存申请接口,如下:
  • 本接口分配的内存不会进行对内容进行初始化。
  • 本接口内部不会进行隐式的Device同步或流同步。如果申请内存成功或申请内存失败会立刻返回结果。
  • 使用acl.rt.malloc_align32接口申请的内存,需要通过acl.rt.free接口释放内存。
  • 频繁调用acl.rt.malloc_align32接口申请内存、调用acl.rt.free接口释放内存,会损耗性能,建议用户提前做内存预先分配或二次管理,避免频繁申请/释放内存。
  • 若用户使用本接口申请大块内存并自行划分、管理内存时,每段内存需同时满足以下需求:
    • 内存大小向上对齐成32整数倍+32字节(m=ALIGN_UP[len,32]+32字节);
    • 内存起始地址需满足64字节对齐(ALIGN_UP[m,64])。
    说明:

    len表示某段内存的大小,ALIGN_UP[len,k]表示向上按k字节对齐:((len-1)/k+1)*k。