AI 模型优化平台 (AIMO) 用户指南
简介
AI Model Optimizer (AIMO) 是一个基于Web端的可交互的AI模型部署优化平台,旨在帮助用户能够在边缘端芯片上快速迁移、部署和运行各种机器学习模型。AIMO能够将其他主流框架模型格式转换成tflite、ONNX、DLC等多种模型格式。
AIMO 有两种部署方式:
AIMO 集成了各种模型转换工具,简化了转换流程,方便用户零代码、低成本的完成模型转换。另外,针对高通平台,为了提高模型转换成功率,AIMO 内置了额外的算子库。对于带有 UDO 算子的模型需要配合 AidLite SDK 推理引擎一起使用 (AidLite SDK 开发者文档)
使用方法
AIMO使用流程图见下图:

步骤一:上传模型
先选择源模型格式,然后将模型拖拽或点击上传至 AIMO

正确的操作之后,描述 会根据模型文件名自动补充,开发者可以自行编辑修改
步骤二:选择目标平台
第二步选择芯片型号和 Runtime 版本,如下图:

步骤三:参数设置
平台自动解析模型节点信息,用户配置量化参数

以图中为例子,模型优化界面会包含:
- 数据精度:模型量化时要保持的数据格式精度 (INT8, INT16等)
- 量化模式:包含多种量化策略,一般默认使用 CLE ,也可以不勾选使用普通方式量化
- 校准辅助数据:模型量化时必要的辅助量化的数据,一般需要几十条训练时用到的数据辅助量化
步骤四:下载模型
等待模型转换完成后即可下载模型。
模型优化转换时间可能瞬间完成 (十几秒内),也可能几天,这取决于优化量化设置。
在结果页可以在线对比转换前后模型结构,也可以启用精度评估做初步的量化精度判断。

转换失败
转换失败时,执行日志会打印失败日志。开发者可以根据失败日志判断原因
开发者也可以查阅常见问题来定位问题
转换案例
Model Farm 包含了大量的通过 AIMO 转换的适配高通平台的模型,开发者可以在模型详情页面查看 AIMO 的转换步骤参考。
以 YOLOv5s INT8 为例:
访问 Model Farm
登录开发者账号
搜索 YOLOv5s
进入模型详情页面——点击右侧性能参考中的 模型转换参考 按钮
