aclrtMemAttr
数据格式 |
说明 |
---|---|
ACL_DDR_MEM = 0 |
DDR内存,DDR上所有大页内存 + 普通内存。 |
ACL_HBM_MEM = 1 |
片上内存,片上内存上所有大页内存 + 普通内存。 |
ACL_DDR_MEM_HUGE = 2 |
DDR大页内存。 |
ACL_DDR_MEM_NORMAL = 3 |
DDR普通内存。 |
ACL_HBM_MEM_HUGE = 4 |
片上内存大页内存。 |
ACL_HBM_MEM_NORMAL = 5 |
片上内存普通内存。 |
ACL_DDR_MEM_P2P_HUGE = 6 |
用于Device间数据复制的大页内存。 |
ACL_DDR_MEM_P2P_NORMAL = 7 |
用于Device间数据复制的普通内存。 |
ACL_HBM_MEM_P2P_HUGE = 8 |
用于Device间数据复制的大页内存。 |
ACL_HBM_MEM_P2P_NORMAL = 9 |
用于Device间数据复制的普通内存。 |
ACL_HBM_MEM_HUGE1G = 10 |
大页内存,内存申请粒度为1G,不足1G的倍数,向上1G对齐。 |
ACL_HBM_MEM_P2P_HUGE1G = 11 |
用于Device间数据复制的大页内存,内存申请粒度为1G,不足1G的倍数,向上1G对齐。 |
对于申请大页内存的场景,当内存申请粒度为2M时,如果要申请1G大小的大页内存,会占用1024/2=512个页表,当内存申请粒度为1G时,1G大页内存只占用1个页表,能有效降低页表数量,有效扩大TLB(Translation Lookaside Buffer)缓存的地址范围,从而提升离散访问的性能。TLB是昇腾AI处理器中用于高速缓存的硬件模块,用于存储最近使用的虚拟地址到物理地址的映射。
ACL_HBM_MEM_HUGE1G和ACL_HBM_MEM_P2P_HUGE1G选项各产品型号的支持情况不同,如下:
Atlas 200/300/500 推理产品 ,不支持该选项。Atlas 训练系列产品 ,不支持该选项。Atlas 推理系列产品 ,不支持该选项。Atlas 200I/500 A2 推理产品 ,不支持该选项。Atlas A2 训练系列产品 /Atlas 800I A2 推理产品 /A200I A2 Box 异构组件,支持该选项。Atlas A3 训练系列产品 /Atlas A3 推理系列产品 ,支持该选项。
父主题: 数据类型及其操作接口