昇腾故障案例详情页

近似检索算法在Duo卡上性能的线性增长不及全量检索算法

更新时间: 2023/09/14

暂无评分

问题信息

问题来源产品大类产品子类关键字
官方模型推理应用开发MindX SDK近似检索、Duo卡、全量检索

问题现象描述

近似检索的IVF系列算法在使用Atlas 300I Duo 推理卡时,发现相较于全量检索算法,性能的线性增长不如后者。

问题说明

对于IVF系列算法,在Atlas 300I Duo 推理卡上的线性增长取决于距离计算的运算量在整个search过程的占比。相较于其他计算类型,只有距离计算的运算量可以均分到多个运算单元,所以在大batch和nprobe较大的场景下,线性增长度更好,而小batch和nprobe较小的场景下线性增长度则较差。

本页内容

该页面对您有帮助吗?
我要评分