第十一章 ONNX 使用

第十一章简介

本章介绍模型部署的第一个工具——ONNX。

ONNX (Open Neural Network Exchange,开放神经网络交换格式)是一种开放的、跨平台的深度学习模型交换格式,可以方便地将模型从一个框架转移到另一个框架,可谓是模型部署必须要了解的一个工具。

本章将从ONNX的概念及原理介绍开始,再介绍ONNX配套的推理引擎——ONNXRuntime, 最后介绍ONNXRuntime中常用的优化方法(float16量化、int8量化、混合精度量化、计算图优化、线程管理和IO binding)。

Copyright © TingsongYu 2021 all right reserved,powered by Gitbook文件修订时间: 2024年04月26日21:48:10

results matching ""

    No results matching ""