设置多核Matmul时,参与运算的核数。不同场景下的设置规则如下:
SetBlockDim加载的核全部用于Matmul API的计算,所以SetDim设置的值和SetBlockDim保持一致。
1
|
int32_t SetDim(int32_t dim) |
参数名 |
输入/输出 |
描述 |
---|---|---|
dim |
输入 |
多核Matmul tiling计算时,可以使用的核数。注意,参数取值必须小于等于SetBlockDim接口中入参block_dim的取值,即参数取值小于等于耦合架构下启动的AICore核数或者分离架构下启动的AIC核数。 |
-1表示设置失败; 0表示设置成功。
无
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
auto ascendcPlatform = platform_ascendc::PlatformAscendC(context->GetPlatformInfo()); matmul_tiling::MultiCoreMatmulTiling tiling(ascendcPlatform); tiling.SetDim(1); // 设置参与运算的核数 tiling.SetAType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetBType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetCType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling.SetBiasType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling.SetShape(1024, 1024, 1024); tiling.SetSingleShape(1024, 1024, 1024); tiling.SetOrgShape(1024, 1024, 1024); tiling.SetBias(true); tiling.SetBufferSpace(-1, -1, -1); optiling::TCubeTiling tilingData; int ret = tiling.GetTiling(tilingData); |