提供加速库内置算子的精度预检能力,根据模型推理时dump的tensor及算子信息,计算标杆output,比较dump的算子output与标杆数据的误差,以检测算子精度是否达标。具体参考精度预检能力使用说明。
ait llm opcheck -i {tensor_dir} -c {op_csv_path} -o {output_dir}
参数名 |
描述 |
是否必选 |
---|---|---|
--input, -i |
Tensor数据路径,为文件夹,由ait llm dump --type tensor落盘。 示例:OUTPUT_DIR/PID_TID/0/。 |
是 |
--csv-path, -c |
算子信息csv文件路径,为单个数据文件路径,由ait llm dump --type op落盘。 示例:OUTPUT_DIR/ait_dump/operation_io_tensors/PID/operation_tensors_0.csv。 |
是 |
--output, -o |
输出文件的保存路径,为文件夹。 示例:xx/xxx/xx。 |
否 |
--operation-ids, -ids |
选择预检指定索引的tensor,默认为空,全量算子预检。 使用方式:-ids 24_1,2_3_5。 |
否 |
--operation-name, -opname |
指定需要预检的算子类型,支持模糊指定,如selfattention只需要填写self。 使用方式:-opname self,linear。 |
否 |
--precision-metric, -metric |
指定需要输出的精度类型,可选范围:['abs', 'cos_sim','kl'],分别表示绝对误差通过率、余弦相似度、KL散度。 默认为[],即只输出相对误差通过率。 使用方式:--metric kl cos_sim。 |
否 |
--device-id, -device |
指定需要使用的NPU设备,默认为0。 |
否 |
--atb-rerun, -rerun |
选择是否重新运行加速库单算子获得output。 默认为false,即不运行加速库单算子,直接对比dump数据中的output。 使用方式:-rerun。 |
否 |