conv2d
功能说明
在给定5HD格式的Data和FracZ格式的Weight的情况下计算float16的2-D卷积。
Data tensor 的shape是5HD,即(N, C1, H, W, C0);
Weight Tensor 的shape是 FracZ,即 (C1*filter_h*filter_w, N1, N0, C0)。
接口可以支持bias。
res_tensor的shape为[N, N1, H_out*W_out, N0]。
函数原型
conv(data, weight, para_dict, optim_dict=None, dsl_flag=True)
参数说明
- data:2d卷积的FeatureMap,tensor,5HD格式,目前支持float16类型
- weight:2d卷积的Weight,tensor,FracZ格式,目前支持float16类型
- para_dict:字典格式,包含各种参数,后续参数扩展一般都在para_dict
其中目前在para_dict里必须要传的参数:
- pad_h:int类型list,[pad_top, pad_bottom],2d卷积在FeatureMap H方向的补边,如果不涉及pad值均设置为0。
- pad_w:int类型list,[pad_left, pad_right],2d卷积在FeatureMap W方向的补边,如果不涉及pad值均设置为0。
- stride_h:int类型,2d卷积在FeatureMap H方向的移动步长。
- stride_w:int类型,2d卷积在FeatureMap W方向的移动步长。
- filter_h:int类型,2d卷积Filter H方向的大小。
- filter_w:int类型,2d卷积Filter W方向的大小。
其中目前在para_dict里支持的非必须参数:
- bias:tensor,目前支持float16类型,2d卷积的Bias。如果有该参数,则意味着卷积计算包含Bias,否则不包含Bias。并要求Bias是cout大小。
- offset_x:int类型,2d卷积在int8数据类型的FeatureMap中添加的负偏移量,用来确保输出在有效范围内。默认值为“0”。
- kernel_name:string 类型,2d卷积的kernel名称。默认值为“conv2d”。
- mad_dtype:string类型,2d卷积的输出数据类型,在weight类型为“int4” 或 “int8” 的情况下默认为“int32”,其他情况下默认为“float32”。
- dilate_h:int类型,2d卷积的 kernel 中每个数据点在H方向上的距离,取值范围是1~255。默认值为1, 即每个数据点紧挨着上一个数据点。
- dilate_w:int类型,2d卷积的 kernel 中每个数据点在W方向上的距离,取值范围是1~255。默认值为1, 即每个数据点紧挨着上一个数据点。
- optim_dict:用户侧可控制优化特性的flag标志。
默认值是optim_dict = {"c0_optim_flg": False},表示不开启C0=4的优化特性。
说明:当前仅支持c0_optim_flg的设置。
- dsl_flag:是否支持UB自动融合,True:支持UB自动融合,False:不支持UB自动融合。
返回值
res_tensor:表示卷积计算的tensor,即卷积计算的结果输出。
约束说明
此接口暂不支持与其他TBE DSL计算接口混合使用。
支持的型号
Atlas 200/300/500 推理产品
Atlas 训练系列产品
Atlas 推理系列产品(Ascend 310P处理器)
Atlas 200/500 A2推理产品
Atlas A2训练系列产品/Atlas 800I A2推理产品
调用示例
对于Batch=1,C=32,H=16,W=8的FeatureMap、Cout=32,KernelH=KernelW=2的Weight的float16的2D卷积,
对应的5HD的FeatureMap tensor的shape为(Batch,C/16,H,W,16)=(1,2,16,8,16)
对应的FracZ的Weight tensor的shape为 (KernelH*KernelW*C/16, Cout/16, 16, 16)=(8,2,16,16)
对应的Bias tensor的shape为(Cout,)=(32,)
from tbe import tvm from tbe import dsl shape_in = (1, 2, 16, 8, 16) shape_w = (8, 2, 16, 16) pad_h = [1, 1] pad_w = [1, 1] stride_h = 1 stride_w = 1 dilate_h = 1 dilate_w = 1 filter_h = 2 filter_w = 2 Data = tvm.placeholder(shape_in, name='FmapW', dtype="float16") Weight = tvm.placeholder(shape_w, name='FilterW', dtype="float16") bias_tensor = tvm.placeholder((shape_w[1] * shape_w[2], ), name='Bias', dtype="float16") res_tensor = dsl.conv( Data, Weight, {"bias_tensor": bias_tensor, "pad_h": pad_h, "pad_w": pad_w, "stride_h": stride_h, "stride_w": stride_w, "dilate_h": dilate_h, "dilate_w": dilate_w, "filter_h": filter_h, "filter_w": filter_w, "offset_x":0})