ReadGmByPassDCache(ISASI)
产品支持情况
产品 |
是否支持 |
|---|---|
Atlas 350 加速卡 |
√ |
√ |
|
√ |
|
x |
|
x |
|
x |
|
x |
功能说明
不经过DCache从GM地址上读数据。
当多核操作GM地址时,如果数据无法对齐到Cache Line,经过DCache的方式下,由于按照Cache Line大小进行读写,会导致多核数据随机覆盖的问题。此时,可以采用不经过DCache直接读写GM地址的方式,从而避免上述随机覆盖的问题。
函数原型
1 2 | template <typename T> __aicore__ inline T ReadGmByPassDCache(__gm__ T* addr) |
参数说明
参数名 |
描述 |
|---|---|
T |
操作数的数据类型。 Atlas 350 加速卡,支持的数据类型为:int8_t、uint8_t、int16_t、uint16_t、int32_t、uint32_t、int64_t、uint64_t。 |
参数名 |
输入/输出 |
含义 |
|---|---|---|
addr |
输入 |
源GM地址。 |
返回值说明
源GM地址上的数据。
约束说明
标量单元连续读取相同GM地址时,会造成Bus被长期占用,此时会影响其它核向GM该地址上写入,进而引发卡死现象。在此场景下,建议在标量读指令后插入若干空操作指令(Nop)来释放Bus,指令数量建议为800条,通常按照“需同步的核数 × 200”。
调用示例
1 2 3 4 5 6 7 8 9 | __gm__ int32_t *addr = const_cast<__gm__ int32_t *>(srcGlobal.GetPhyAddr()); int32_t value = AscendC::ReadGmByPassDCache<int32_t>(addr); // 通过Scalar读写相同GM时,需要让读操作,空出总线,避免长时占用 int target = -1; while (target != 0) { target = ReadGmByPassDCache(addr); Nop<800>(); } |