设置block dim,即参与计算的VectorCore或者CubeCore核数。
ge::graphStatus SetBlockDim(const uint32_t block_dim);
参数 |
输入/输出 |
说明 |
---|---|---|
block_dim |
输入 |
参与计算的VectorCore或者CubeCore核数。注意这里是逻辑核的概念,取值范围为[1,65535]。为了充分利用硬件资源,一般设置为物理核的核数或其倍数。特别地,对于mix场景(同时用到CubeCore和VectorCore),通常以较小的核数(一般为CubeCore)作为参考标准。VectorCore的核数和CubeCore的核数分别通过GetCoreNumAiv和GetCoreNumAic接口获取。 |
无
ge::graphStatus Tiling4XXX(TilingContext* context) { auto ret = context->SetBlockDim(32); // ... }