函数:malloc_physical
产品支持情况
产品 |
是否支持 |
|---|---|
√ |
|
√ |
|
√ |
|
√ |
|
√ |
功能说明
申请Host或Device物理内存并返回一个物理内存handle。
本接口可配合acl.rt.reserve_mem_address接口(申请虚拟内存)、acl.rt.map_mem接口(建立虚拟内存与物理内存之间的映射)使用,以便申请地址连续的虚拟内存、最大化利用物理内存地址的目的。
本接口可配合acl.rt.mem_export_to_shareable_handle接口(导出物理内存handle)、acl.rt.mem_import_from_shareable_handle(导入共享handle)使用,用于实现多进程之间的物理内存共享。同时,也支持在共享物理内存时,使用虚拟内存,请参见acl.rt.mem_export_to_shareable_handle接口处的说明。
函数原型
- C函数原型
1aclError aclrtMallocPhysical(aclrtDrvMemHandle *handle, size_t size, const aclrtPhysicalMemProp *prop, uint64_t flags)
- python函数
1handle, ret = acl.rt.malloc_physical(size, prop, flags)
参数说明
参数名 |
说明 |
|---|---|
size |
int,物理地址空间大小,单位Byte。 先调用acl.rt.mem_get_allocation_granularity接口获取内存申请粒度,然后再调用本接口申请物理内存时size按获取到的内存申请粒度对齐,以便节约内存。 |
prop |
dict,物理内存属性信息,具体请参见aclrtPhysicalMemProp。 |
flags |
int,预留,当前仅支持设置为0。 |
返回值说明
返回值 |
说明 |
|---|---|
handle |
int,存放物理内存信息的handle。 |
ret |
int,错误码,返回0表示成功,返回其它值表示失败。 |
约束说明
Atlas 200I/500 A2 推理产品 上,Ascend RC形态不支持调用本接口。- 针对
Atlas A3 训练系列产品 /Atlas A3 推理系列产品 中的超节点产品,当内存所在位置prop["location"]["type"] = ACL_MEM_LOCATION_TYPE_HOST_NUMA,且内存属性类型prop["memAttr"]为P2P选项(例如ACL_MEM_P2P_HUGE)时,可申请到的最大内存大小根据服务器型号、Bios版本会有所不同。建议通过acl.rt.malloc_physic接口按内存规划尝试申请,以确认内存是否足够。 - 内存属性类型prop["memAttr"]当前仅支持如下选项:
- ACL_MEM_NORMAL:普通内存。
- ACL_MEM_HUGE:2M粒度对齐的大页内存。
- ACL_MEM_HUGE1G:1G粒度对齐的大页内存,仅支持Device。
仅
Atlas A3 训练系列产品 /Atlas A3 推理系列产品 、Atlas A2 训练系列产品 /Atlas A2 推理系列产品 支持该类型。其它型号当前不支持该类型。
- ACL_MEM_P2P_NORMAL:用于Device间数据复制的普通内存。
- ACL_MEM_P2P_HUGE:用于Device间数据复制的大页内存,内存申请粒度为2M。
- ACL_MEM_P2P_HUGE1G:用于Device间数据复制的大页内存,内存申请粒度为1G,仅支持Device。
仅
Atlas A3 训练系列产品 /Atlas A3 推理系列产品 中的部分互联形态支持该类型,以接口实际返回情况为准。其它型号当前不支持该类型。
- ACL_HBM_MEM_HUGE:2M粒度对齐的大页内存。
- ACL_HBM_MEM_HUGE1G:1G粒度对齐的大页内存,仅支持Device。
Atlas A3 训练系列产品 /Atlas A3 推理系列产品 、Atlas A2 训练系列产品 /Atlas A2 推理系列产品 支持该类型。其它型号当前不支持该类型。
- ACL_HBM_MEM_NORMAL:普通内存,接口内部会按照ACL_HBM_MEM_HUGE类型申请大页内存。
- ACL_DDR_MEM_HUGE:大页内存,仅支持Host内存。
- ACL_DDR_MEM_NORMAL:普通内存,仅支持Host内存。
- ACL_DDR_MEM_P2P_HUGE:用于Device间数据复制的大页内存,仅支持Host内存。
- ACL_DDR_MEM_P2P_NORMAL:用于Device间数据复制的普通内存,仅支持Host内存。