应用场景
在数据集预处理、聚类、推荐系统、模式分析等海量数据的统计和数据挖掘任务中,常常需要对一组向量执行高性能的检索。
在向量检索的应用场景中,通常使用卷积神经网络提取输入的深度特征,得到半结构化的特征向量并针对特征向量的相似性计算,实现对特定目标的检索。比如基于图片库提取特征向量形成底库后,可以使用相同的神经网络提取目标图片深度特征,生成待查询的向量并将其在底库中进行比对,若相似度很高则认为在底库中检索到了匹配的目标,将目标排序最终得到特定数量的结果。

当前mxIndex特征检索组件最多同时支持8张Atlas 300I 推理卡或8张Atlas 300I Pro 推理卡A300I Pro 推理卡。
- 支持的硬件环境
- Atlas 800 推理服务器(型号:3000)
- Atlas 800 推理服务器(型号:3010)
- Atlas 500 Pro 智能边缘服务器
- Atlas 300I Pro 推理卡A300I Pro 推理卡
- Atlas 300V Pro 视频解析卡A300V Pro 视频解析卡
- 操作系统
- CentOS 7.6
- Ubuntu 18.04
- OpenEuler release 20.03
使用须知
- 特征检索FeatureRetrieval基于CANN开放形态,实际检索业务进程运行在昇腾芯片设备(Device)侧,关于Device侧业务内存资源控制请参见《CANN 软件安装指南(开放态, Atlas 200/300/500 推理产品)》,基于业务场景需求,采用内存不足时应用退出设置机制。
- 检索业务特征底库存储于昇腾芯片DDR内,特征维度和数量在进行入库、查询等操作以及计算过程中,业务临时内存和系统临时内存的使用决定总内存占用大小,输入过大会引起设备侧“OOM-Killer”导致设备侧程序异常。当前单个Index(底库)支持最大库容视具体昇腾芯片设备侧内存大小而定,业务侧需要根据实际需求规划Index个数,防止内存超限情形发生。
- 对于特征检索中索引算法Index使用具体昇腾芯片设备侧的资源,如果超出当前限制(如对于特定Index进行过度的底库数据入库和检索等操作引起内存超限),可能会导致特定的芯片上的索引算法报错,并在Host侧抛出异常。尤其内存资源不足,出现“OOM”的情况时,可能引起设备侧服务短暂不可用,但特征检索功能可以在一分钟内恢复(需要重新入库),如需进一步了解请向华为工程师获取帮助。
父主题: 简介