概述
本应用以 Atlas 300I pro、 Atlas300V pro 为主要的硬件平台,使用Vision SDK实现端到端视频分类功能
功能模块介绍
推理流程如下:
离线推理流程如下
1. 视频前处理:从待推理的离线视频中抽取8帧,完成缩放归一化等一系列操作后,将8帧数据组成一个tensor送入模型推理
2. 模型推理:TSM模型推理
3. 模型后处理:从模型推理结果中解析出视频类别
在线视频推理流程如下:
1. 视频前处理:从待推理的在线视频流,以隔一取一的抽帧方式抽取待推理视频帧,完成缩放归一化等一系列操作后,将视频数据按模型要求组装,送入模型完成推理
2. 模型推理:使用在线手势识别模型推理
3. 模型后处理:从模型推理结果中解析出视频中手势类别