函数:dvpp_malloc
产品支持情况
产品 |
是否支持 |
---|---|
|
√ |
|
√ |
|
√ |
|
√ |
|
√ |
|
√ |
功能说明
该接口主要用于分配内存给Device侧媒体数据处理时使用,申请的大页内存满足数据处理的要求(例如,内存首地址128对齐)。
函数原型
- C函数原型
1
aclError acldvppMalloc(void **devPtr, size_t size)
- python函数
1
dev_ptr, ret = acl.media.dvpp_malloc(size)
参数说明
参数名 |
说明 |
---|---|
size |
int,申请内存的大小,单位Byte。 |
返回值说明
返回值 |
说明 |
---|---|
dev_ptr |
int,Device上已分配内存的指针地址。 |
ret |
int,错误码,返回0表示成功,返回其它值表示失败。 |
约束说明
- 调用该接口申请内存后,如果内存不再使用,需及时调用acl.media.dvpp_free接口释放内存。
- 频繁调用acl.media.dvpp_malloc接口申请内存、调用acl.media.dvpp_free接口释放内存,会损耗性能,建议用户提前做内存预先分配或二次管理,避免频繁申请/释放内存。
- 调用acl.media.dvpp_malloc接口申请内存时,会对用户输入的“size”按向上对齐成32整数倍后,再多加32字节。
- 媒体数据处理的输出作为模型推理的输入时,若用户使用本接口申请大块内存并自行划分、管理内存时,每段内存需同时满足以下要求:
- 内存大小向上对齐成32整数倍+32字节(m = ALIGN_UP[len, 32] + 32字节)。
- 内存起始地址需满足128字节对齐(ALIGN_UP[m, 128])。
“len”表示某段内存的大小,ALIGN_UP[len,k]表示向上按“k”字节对齐:((len - 1) / k + 1) * k。
- 调用该接口申请大页内存失败,仅表示系统内的大页内存不够。
Atlas 200/300/500 推理产品 关于系统内预留大页的说明请参见总体说明。Atlas A2 训练系列产品 /Atlas 800I A2 推理产品 /A200I A2 Box 异构组件关于系统内预留大页的说明请参见总体说明。 - 媒体数据处理功能在每个进程内,可访问的地址空间最大为16GB。
Atlas A3 训练系列产品 /Atlas A3 推理系列产品 Atlas A2 训练系列产品 /Atlas 800I A2 推理产品 /A200I A2 Box 异构组件Atlas 推理系列产品