使用说明
Ascend C提供一组Matmul Tiling API,方便用户获取Matmul kernel计算时所需的Tiling参数。您只需要传入A/B/C矩阵等信息,调用API接口,即可获取到Init中TCubeTiling结构体中的相关参数。
Matmul Tiling API分为Matmul单核Tiling接口、多核Tiling接口和BatchMatmul Tiling接口。获取Tiling参数的流程如下:
- 创建一个单核Tiling对象,或多核Tiling对象,或BatchMatmul Tiling对象。
- 设置A、B、C、Bias的参数类型信息;M、N、Ka、Kb形状信息等。
- 调用GetTiling接口,获取Tiling信息。
使用Matmul单核Tiling接口、多核Tiling接口和BatchMatmul Tiling接口获取Tiling参数的样例如下:
- Matmul单核Tilingauto ascendcPlatform = platform_ascendc::PlatformAscendC(context->GetPlatformInfo()); matmul_tiling::MatmulApiTiling tiling(ascendcPlatform); tiling.SetAType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetBType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetCType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling.SetBiasType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling.SetShape(1024, 1024, 1024); tiling.SetOrgShape(1024, 1024, 1024); //或Ka,Kb不等长,如tiling.SetOrgShape(1024, 1024, 1024, 1280) tiling.SetBias(true); tiling.SetBufferSpace(-1, -1, -1); // 设定允许使用的空间,缺省使用该AI处理器所有空间 optiling::TCubeTiling tilingData; int ret = tiling.GetTiling(tilingData); // if ret = -1, get tiling failed 
- 多核Tilingauto ascendcPlatform = platform_ascendc::PlatformAscendC(context->GetPlatformInfo()); matmul_tiling::MultiCoreMatmulTiling tiling(ascendcPlatform); tiling.SetDim(1); tiling.SetAType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetBType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetCType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling.SetBiasType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling.SetShape(1024, 1024, 1024); tiling.SetSingleShape(1024, 1024, 1024); tiling.SetOrgShape(1024, 1024, 1024); tiling.SetBias(true); tiling.SetBufferSpace(-1, -1, -1); // 设定允许使用的空间,缺省使用该AI处理器所有空间 optiling::TCubeTiling tilingData; int ret = tiling.GetTiling(tilingData); // if ret = -1, get tiling failed 
- BatchMatmul Tilingauto ascendcPlatform = platform_ascendc::PlatformAscendC(context->GetPlatformInfo()); matmul_tiling::BatchMatmulTiling bmmTiling(ascendcPlatform); bmmTiling.SetDim(1); bmmTiling.SetAType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); bmmTiling.SetBType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); bmmTiling.SetCType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); bmmTiling.SetBiasType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); bmmTiling.SetBias(true); bmmTiling.SetShape(1024, 1024, 1024); bmmTiling.SetSingleShape(1024, 1024, 1024); bmmTiling.SetOrgShape(1024, 1024, 1024); bmmTiling.SetBufferSpace(-1, -1, -1); // 设定允许使用的空间,缺省使用该AI处理器所有空间 optiling::TCubeTiling tilingData; int ret = tiling.GetTiling(tilingData); // if ret = -1, get tiling failed 
接口列表如下:
| 接口 | 功能 | 
|---|---|
| SetAType | 设置A矩阵的位置,数据格式,数据类型,是否转置等信息。 | 
| SetBType | 设置B矩阵的位置,数据格式,数据类型,是否转置等信息。 | 
| SetCType | 设置C矩阵的位置,数据格式,数据类型等信息。 | 
| SetBiasType | 设置Bias的位置,数据格式,数据类型等信息。 | 
| SetShape | 设置Matmul单次计算的形状singleM、singleN、singleK,单位为元素个数。 | 
| SetOrgShape | 设置Matmul计算时的原始完整的形状M、N、Ka、Kb,单位为元素个数。 | 
| SetBias | 设置Bias是否参与运算。 | 
| SetFixSplit | 设置固定的baseM、baseN、baseK,单位为元素个数。 | 
| SetBufferSpace | 设置Matmul计算时可用的L1/L0C/UB空间大小,单位为字节。 | 
| SetTraverse | 设置遍历方式,M轴优先还是N轴优先。 | 
| SetMadType | 设置是否使能HF32模式。当前版本暂不支持。 | 
| SetSplitRange | 设置baseM/baseN/baseK的最大值和最小值。 | 
| SetDoubleBuffer | 设置A/B/C/Bias是否使能double buffer功能,以及是否需要做ND2NZ或者NZ2ND的转换。该接口为预留接口,当前版本暂不支持。 | 
| GetBaseM | 获取baseM值。 | 
| GetBaseN | 获取baseN值。 | 
| GetBaseK | 获取baseK值。 | 
| GetTiling | 获取Tiling参数。 | 
| 接口 | 功能 | 
|---|---|
| SetDim | 设置多核Matmul时,可以参与运算的核数。 | 
| SetSingleRange | 设置singleCoreM/singleCoreN/singleCoreK的最大值与最小值。 | 
| SetSingleShape | 设置Matmul单核计算的形状singleCoreM、singleCoreN、singleCoreK,单位为元素个数。 | 
| GetSingleShape | 获取计算后的singleCoreM/singleCoreN/singleCoreK。 | 
| SetAlignSplit | 设置多核切分时singleCoreM/singleCoreN/singleCoreK的对齐值 | 
| GetCoreNum | 获得多核切分后, 使用的blockDim。 | 
| SetSplitK | 多核场景,使能切K轴。 | 
| 接口 | 功能 | 
|---|---|
| GetCoreNum | 获得多核切分后, 使用的blockDim。 |