单算子精度预检

提供加速库内置算子的精度预检能力,根据模型推理时dump的tensor及算子信息,计算标杆output,比较dump的算子output与标杆数据的误差,以检测算子精度是否达标。具体参考精度预检能力使用说明

使用方式

ait llm opcheck -i {tensor_dir} -c {op_csv_path} -o {output_dir}

参数说明

参数名

描述

是否必选

--input, -i

Tensor数据路径,为文件夹,由ait llm dump --type tensor落盘。

示例:OUTPUT_DIR/PID_TID/0/。

--csv-path, -c

算子信息csv文件路径,为单个数据文件路径,由ait llm dump --type op落盘。

示例:OUTPUT_DIR/ait_dump/operation_io_tensors/PID/operation_tensors_0.csv。

--output, -o

输出文件的保存路径,为文件夹。

示例:xx/xxx/xx。

--operation-ids, -ids

选择预检指定索引的tensor,默认为空,全量算子预检。

使用方式:-ids 24_1,2_3_5。

--operation-name, -opname

指定需要预检的算子类型,支持模糊指定,如selfattention只需要填写self。

使用方式:-opname self,linear。

--precision-metric, -metric

指定需要输出的精度类型,可选范围:['abs', 'cos_sim','kl'],分别表示绝对误差通过率、余弦相似度、KL散度。

默认为[],即只输出相对误差通过率。

使用方式:--metric kl cos_sim。

--device-id, -device

指定需要使用的NPU设备,默认为0。

--atb-rerun, -rerun

选择是否重新运行加速库单算子获得output。

默认为false,即不运行加速库单算子,直接对比dump数据中的output。

使用方式:-rerun。