应用开发深入讲解之模型离线推理

模型离线推理是指使用已经转好的om模型对输入图片进行推理,主要步骤如下图所示:

【2023 · CANN训练营第一季】应用开发深入讲解之模型离线推理_数据

1.Host&Device内存管理与数据传输

Host&Device上的内存申请与释放,内存间的相互拷贝。

代码中加载输入数据时,需要申请Host内存进行存储,当输入数据处理完毕后,需要将处理完成的数据从Host内存拷贝 到Device的模型输入内存中,以便于Device进行模型推理的专用计算。

【2023 · CANN训练营第一季】应用开发深入讲解之模型离线推理_离线_02

2.模型加载

将离线的om文件加载到Device上。

模型加载支持多种加载方式,由用户根据需求选择从om模型文件或内存加载模型数据、选择由用户自行管理内存或由AscendCL管理内存。而不管用哪种接口,最终卸载时接口都是统一的。

【2023 · CANN训练营第一季】应用开发深入讲解之模型离线推理_数据_03

3.模型输入输出准备

根据离线om的输入输出,在Deⅵce上申请好模型的输入输出内存。

【2023 · CANN训练营第一季】应用开发深入讲解之模型离线推理_离线_04

4.执行推理

当模型的输入内存获取到有效数据后,便可以调用AscendCL接口执行模型推理,推理完成后结果生成到输出内存中;在样例的模型推理模块中进行。

【2023 · CANN训练营第一季】应用开发深入讲解之模型离线推理_数据_05

5.输出解析:使用AscendCL接口,将模型输出数据从特定格式中解析出来;在输出数据处理模块中进行。

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6