昇腾社区首页
中文
注册
开发者
下载

IVFFLAT

用法

python3 ivfflat_generate_model.py -d <dim> -c <coarse_centroid_num> --cores <core_num> -p <process_id> -pool <pool_size> -t <npu_type>

参数名称

<dim>:特征向量维度,默认值为“128”。

<coarse_centroid_num>:一级簇聚类中心个数。默认值为“16384”。

<core_num>:昇腾AI处理器AI Core的个数,默认为“40”。不指定该值时,根据<npu_type>配置:当<npu_type>配置为910B3时,<core_num>配置为40。

<process_id>:批量生成算子多进程调度的进程ID,默认值为“0”,无需设置。

<pool_size>:批量生成算子多进程调度的进程池大小,默认值为“10”。

<npu_type>:硬件形态,当前<npu_type>支持Atlas A2 推理系列产品Atlas A3 推理系列产品,默认值为“910B4”。如果无法确定具体的npu_type,则在安装昇腾AI处理器的服务器执行npu-smi info命令进行查询,将查询到的“Name”最后一位数字删除,即是npu_type的取值。对于Atlas 800I A3 超节点服务器,可以通过npu-smi info -t board -i 0 -c 0命令进行查询,获取NPU Name信息,910_NPU Name即是npu_type的取值。

--help | -h:查询帮助信息。

说明

执行此命令,用户可以得到一组算子模型文件,用户需要自行修改命令中的参数。

约束说明

  • dim ∈ {64, 128, 256, 384, 512}。
  • <coarse_centroid_num> ∈ {1024, 2048, 4096, 8192, 16384, 32768}
  • 0 ≤ <pool_size> ≤ 32

涉及算法

AscendIndexIVFFlat