单击异步推理获取样例。
该样例主要是基于Caffe ResNet-50网络(单输入、单batch)实现图片分类的功能。
将Caffe ResNet-50网络的模型文件转换为适配昇腾AI处理器的离线模型(*.om文件)。该样例中加载该om文件,对2张jpg(*.jpg)图片进行n次异步推理(n作为运行应用的参数,由用户配置,可通过“--execute_times”参数设置,默认为4次),分别得到n次推理结果后,再对推理结果进行处理,输出top5置信度的类别标识。
功能 |
对应pyACL模块 |
pyACL 接口函数 |
功能说明 |
---|---|---|---|
资源初始化 |
初始化 |
acl.init |
初始化pyACL配置。 |
Device管理 |
acl.rt.set_device |
指定用于运算的Device。 |
|
Context管理 |
acl.rt.create_context |
创建Context。 |
|
数据初始化 |
acl.create_data_buffer |
创建aclDataBuffer类型的数据,该数据类型用于描述内存地址、大小等内存信息。 如需销毁aclDataBuffer类型的数据,请参见函数:destroy_data_buffer。 |
|
公共接口 |
acl.get_data_buffer_addr |
获取aclDataBuffer类型中的数据的内存地址。 |
|
公共接口 |
acl.get_data_buffer_size_v2 |
获取aclDataBuffer类型中数据的内存大小,单位Byte。 |
|
Stream管理 |
acl.rt.create_stream |
在当前进程或线程中创建一个Stream。 |
|
Context管理 |
acl.rt.set_context |
设置线程的Context。 |
|
模型初始化 |
模型加载与执行 |
acl.mdl.load_from_file |
从*.om文件加载模型到device侧。 |
数据类型及操作接口 |
acl.mdl.create_desc |
创建模型描述数据类型。 |
|
数据类型及操作接口 |
acl.mdl.get_desc |
获取模型描述数据类型。 |
|
数据类型及操作接口 |
acl.mdl.get_cur_output_dims |
根据模型描述信息获取指定的模型输出Tensor的实际维度信息。 |
|
数据类型及操作接口 |
acl.mdl.get_num_outputs |
根据aclmdlDesc类型的数据,获取模型的输出个数。 |
|
数据类型及操作接口 |
acl.mdl.get_num_inputs |
根据aclmdlDesc类型的数据,获取模型的输入个数。 |
|
数据类型及操作接口 |
acl.mdl.get_output_size_by_index |
根据aclmdlDesc类型的数据,获取指定输出的大小,单位为Byte。 |
|
数据类型及操作接口 |
acl.mdl.add_dataset_buffer |
向aclmdlDataset中增加aclDataBuffer。 |
|
数据类型及操作接口 |
acl.mdl.create_dataset |
创建aclmdlDataset类型的数据。 该数据类型用于描述模型推理时的输入数据、输出数据,模型可能存在多个输入、多个输出,每个输入/输出的内存地址、内存大小用aclDataBuffer类型的数据来描述。 如需销毁aclmdlDataset类型的数据,请参见函数:destroy_dataset。 |
|
模型推理 |
模型加载与执行 |
acl.mdl.execute_async |
执行模型异步推理。 |
流同步 |
Stream管理 |
acl.rt.synchronize_stream |
阻塞应用程序运行,直到指定Stream中的所有任务都完成。 |
runtime |
同步等待 |
acl.rt.subscribe_report |
指定处理Stream上回调函数的线程。 |
同步等待 |
acl.rt.unsubscribe_report |
取消线程注册,Stream上的回调函数不再由指定线程处理。 |
|
同步等待 |
acl.rt.launch_callback |
在Stream的任务队列中增加一个需要在Host/Device上执行的回调函数。 |
|
同步等待 |
acl.rt.process_report |
等待指定时间后,触发回调处理。 |
|
数据交互 |
内存管理 |
acl.rt.memcpy |
数据传输,Host->Device或Device->Host。 |
内存管理 |
acl.rt.malloc |
申请Device上的内存。 |
|
内存管理 |
acl.rt.malloc_host |
申请Host上的内存。 |
|
公共模块 |
-- |
acl.util.ptr_to_numpy |
将指针地址数据转换为numpy数组,可以使Python代码直接访问。 |
-- |
acl.util.numpy_to_ptr |
获取numpy.ndarry数组的内存数据指针地址。 |
|
-- |
acl.util.start_thread |
启动一个回调函数线程。 |
|
-- |
acl.util.stop_thread |
回收一个回调函数线程。 |
|
C和Python的数据交互 |
acl.util.bytes_to_ptr |
将bytes对象转换成为void*数据,可以将转换好的数据传递给C函数直接使用。 |
|
C和Python的数据交互 |
acl.util.ptr_to_bytes |
将void*数据转换为bytes对象,可以使Python代码直接访问。 |
|
数据后处理 |
数据类型及操作接口 |
acl.mdl.get_dataset_buffer |
获取aclmdlDataset中的第n个aclDataBuffer。 |
数据类型及操作接口 |
acl.mdl.get_dataset_num_buffers |
获取aclmdlDataset中aclDataBuffer的个数。 |
|
资源释放 |
内存管理 |
acl.rt.free |
释放Device上的内存。 |
内存管理 |
acl.rt.free_host |
释放Host上的内存。 |
|
模型加载与执行 |
acl.mdl.unload |
卸载模型。 |
|
Context管理 |
acl.rt.destroy_context |
销毁Context。 |
|
Device管理 |
acl.rt.reset_device |
复位当前运算的Device,回收Device上的资源。 |
|
去初始化 |
acl.finalize |
实现pyACL去初始化。 |
|
数据释放 |
acl.destroy_data_buffer |
销毁aclDataBuffer类型的数据。 此处仅销毁aclDataBuffer类型的数据,调用acl.create_data_buffer接口创建aclDataBuffer类型数据时传入的data的内存需由用户自行释放。 |
|
数据释放 |
acl.mdl.destroy_dataset |
销毁通过acl.mdl.create_dataset接口创建的aclmdlDataset类型的数据。 |
|
数据释放 |
acl.mdl.destroy_desc |
销毁通过acl.mdl.create_desc接口创建的aclmdlDesc类型的数据。 |
|
数据释放 |
acl.rt.destroy_stream |
销毁指定Stream,销毁通过acl.rt.create_stream或acl.rt.create_stream_with_config接口创建的Stream,若Stream上有未完成的任务,会等待任务完成后再销毁Stream。 |
目录结构如下所示。
resnet50_async_imagenet_classification ├──scripts │ ├── host_version.conf //版本号配置文件。 │ └── testcase_300.sh //运行脚本。 ├──src │ ├── acl_net.py //运行文件。 │ └── constant.py //常量定义。 ├── data │ ├── fusion_result.json //atc转化后生成,记录融合算子信息。 │ ├── dog1_1024_683.jpg //测试图片数据。 │ └── dog2_1024_683.jpg //测试图片数据。 ├── caffe_model │ ├── resnet50.caffemodel //ResNet-50模型。 │ └── resnet50.prototxt // ResNet-50模型的网络文件。 └── model //atc转换生成后的目录 │ └── resnet50.om //转换后的模型文件。 └── README_CN.md