开发者
资源
[object Object]

【优先级】高

【描述】由于AI处理器内部设计约束,从GM向Local Memory搬运数据时,保证GM地址512B对齐可以最有效的发挥出带宽的效率。如下图示例,展示了在512B对齐以及32B对齐情况下单核的带宽效率:搬运同等数据量,带宽差距最大的情况,32B对齐场景只能达到512B对齐场景的70%。

[object Object]

图 1 GM->UB方向512B对齐和32B对齐实测带宽的差异对比[object Object][object Object]

图 2 UB->GM方向512B对齐和32B对齐实测带宽的差异对比[object Object][object Object]