第十一章 ONNX 使用
第十一章简介
本章介绍模型部署的第一个工具——ONNX。
ONNX (Open Neural Network Exchange,开放神经网络交换格式)是一种开放的、跨平台的深度学习模型交换格式,可以方便地将模型从一个框架转移到另一个框架,可谓是模型部署必须要了解的一个工具。
本章将从ONNX的概念及原理介绍开始,再介绍ONNX配套的推理引擎——ONNXRuntime, 最后介绍ONNXRuntime中常用的优化方法(float16量化、int8量化、混合精度量化、计算图优化、线程管理和IO binding)。