TensorRT实现EfficientDet推理加速(二)

2023-10-30 16:10

本文主要是介绍TensorRT实现EfficientDet推理加速(二),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、参考资料

为什么你比官方的运行速度快
全网第一SoTA成绩却朴实无华的pytorch版efficientdet
PyTorch转TensorRT流程
一文掌握Pytorch-onnx-tensorrt模型转换
onnx-tensorrt安装
ONNX前向inference调试

二、重要说明

  • 论文中介绍说EfficiendDet-D1(640)的infer速度为16ms,实际上测试没有那么快;需要跑一下 efficientdet官方仓库 代码,测试真实速度;
  • 在GTX 1650(4GB)显卡上,测试EfficientDet-D0(512),不包含后处理infer,tensorRT加速比可达10倍;包含后处理的infer,tensorRT加速比可达4倍;

三、存在的问题

  • BatchedNMS_TRT

    batchedNMSPlugin
    Code sample to add custom importer for BatchedNMS_TRT in builtin_op_importers.cpp
    How to use NMS with Pytorch model (that was converted to ONNX -> TensorRT) #795

    ERROR:EngineBuilder:Failed to load ONNX file: /home/yichao/Downloads/saved_model_onnx-1/model.onnx
    ERROR:EngineBuilder:In node 882 (parseGraph): UNSUPPORTED_NODE: No importer registered for op: BatchedNMS_TRT
    
    https://github.com/NVIDIA/TensorRT/blob/master/CHANGELOG.md
    https://github.com/NVIDIA/TensorRT/tree/master/plugin/batchedNMSPlugin错误原因:
    tensorRT 8.0.1之后的版本支持 EfficientNMS_TRT plugins插件解决办法:
    更换tensorRT 版本
    
  • EfficientNMS_TRT

    nmsPlugin
    EfficientNMS_TRT not working on jetson nano (TensorRT 8.0.1)

    ERROR:EngineBuilder:Failed to load ONNX file: /home/yichao/Downloads/saved_model_onnx-1/model.onnx
    ERROR:EngineBuilder:In node 853 (parseGraph): UNSUPPORTED_NODE: No importer registered for op: EfficientNMS_TRT
    
    错误原因:
    不兼容低于 tensorRT 8.0.1 版本的 plugins 插件,需要增加 --legacy_plugins 参数,增加兼容性。
    --legacy_plugins allows falling back to older plugins on systems where a version lower than TensorRT 8.0.1 is installed. This will result in substantially slower inference times however, but is provided for compatibility.解决办法:
    增加 --legacy_plugins 参数python create_onnx.py \--input_shape '1,512,512,3' \--saved_model /home/yichao/Downloads/efficientdet_d0_coco17_tpu-32/saved_model \--onnx /home/yichao/Downloads/saved_model_onnx-1/model.onnx \--legacy_plugins
    
  • 无法解析onnx模型

    ERROR:EngineBuilder:Failed to load ONNX file: /home/yichao/Downloads/saved_model_onnx/model.onnx
    ERROR:EngineBuilder:In node -1 (parseGraph): UNSUPPORTED_NODE: Assertion failed: convertOnnxWeights(initializer, &weights, ctx)
    
    错误原因:
    博主的onnx版本太新了,降低onnx版本即可,按照requirements.txt文件中的版本安装方法一:
    降低onnx版本,按照requirements.txt文件中的版本安装方法二:
    如果方法一无法解决,尝试方法二
    下载另外一种格式的预训练模型(1)AutoML Models
    (2)TFOD Models
    
  • build_engine.py生成引擎错误

    [TensorRT] ERROR: [graphShapeAnalyzer.cpp::throwIfError::1306] Error Code 9: Internal Error (fpn_cells/cell_0/fnode0/add_n/add: broadcast dimensions must be conformable
    )
    ERROR:EngineBuilder:Failed to load ONNX file: /media/yichao/蚁巢文件/YOYOFile/ModelZoo/EfficientDet模型/D7/saved_model_onnx/model.onnx
    ERROR:EngineBuilder:In node 681 (parseGraph): INVALID_NODE: Invalid Node - fpn_cells/cell_0/fnode0/add_n/add
    [graphShapeAnalyzer.cpp::throwIfError::1306] Error Code 9: Internal Error (fpn_cells/cell_0/fnode0/add_n/add: broadcast dimensions must be conformable
    )
    
    [TensorRT] ERROR: [graphShapeAnalyzer.cpp::throwIfError::1306] Error Code 9: Internal Error (mul_5: broadcast dimensions must be conformable
    )
    ERROR:EngineBuilder:Failed to load ONNX file: /media/yichao/蚁巢文件/YOYOFile/ModelZoo/EfficientDet模型/D7/saved_model_onnx/model.onnx
    ERROR:EngineBuilder:In node 1452 (parseGraph): INVALID_NODE: Invalid Node - mul_5
    [graphShapeAnalyzer.cpp::throwIfError::1306] Error Code 9: Internal Error (mul_5: broadcast dimensions must be conformable
    )
    
    错误原因:
    不同Model模型的input shape不同,解决办法:
    对于EfficientDet D0
    python create_onnx.py \--input_shape '1,512,512,3' \--saved_model /path/to/saved_model \--onnx /path/to/model.onnx对于EfficientDet D7
    python create_onnx.py \--input_shape '1,1536,1536,3' \--saved_model /path/to/saved_model \--onnx /path/to/model.onnx
    

在这里插入图片描述

这篇关于TensorRT实现EfficientDet推理加速(二)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/309089

相关文章

python使用Akshare与Streamlit实现股票估值分析教程(图文代码)

《python使用Akshare与Streamlit实现股票估值分析教程(图文代码)》入职测试中的一道题,要求:从Akshare下载某一个股票近十年的财务报表包括,资产负债表,利润表,现金流量表,保存... 目录一、前言二、核心知识点梳理1、Akshare数据获取2、Pandas数据处理3、Matplotl

分布式锁在Spring Boot应用中的实现过程

《分布式锁在SpringBoot应用中的实现过程》文章介绍在SpringBoot中通过自定义Lock注解、LockAspect切面和RedisLockUtils工具类实现分布式锁,确保多实例并发操作... 目录Lock注解LockASPect切面RedisLockUtils工具类总结在现代微服务架构中,分布

Java使用Thumbnailator库实现图片处理与压缩功能

《Java使用Thumbnailator库实现图片处理与压缩功能》Thumbnailator是高性能Java图像处理库,支持缩放、旋转、水印添加、裁剪及格式转换,提供易用API和性能优化,适合Web应... 目录1. 图片处理库Thumbnailator介绍2. 基本和指定大小图片缩放功能2.1 图片缩放的

Python使用Tenacity一行代码实现自动重试详解

《Python使用Tenacity一行代码实现自动重试详解》tenacity是一个专为Python设计的通用重试库,它的核心理念就是用简单、清晰的方式,为任何可能失败的操作添加重试能力,下面我们就来看... 目录一切始于一个简单的 API 调用Tenacity 入门:一行代码实现优雅重试精细控制:让重试按我

Redis客户端连接机制的实现方案

《Redis客户端连接机制的实现方案》本文主要介绍了Redis客户端连接机制的实现方案,包括事件驱动模型、非阻塞I/O处理、连接池应用及配置优化,具有一定的参考价值,感兴趣的可以了解一下... 目录1. Redis连接模型概述2. 连接建立过程详解2.1 连php接初始化流程2.2 关键配置参数3. 最大连

Python实现网格交易策略的过程

《Python实现网格交易策略的过程》本文讲解Python网格交易策略,利用ccxt获取加密货币数据及backtrader回测,通过设定网格节点,低买高卖获利,适合震荡行情,下面跟我一起看看我们的第一... 网格交易是一种经典的量化交易策略,其核心思想是在价格上下预设多个“网格”,当价格触发特定网格时执行买

python设置环境变量路径实现过程

《python设置环境变量路径实现过程》本文介绍设置Python路径的多种方法:临时设置(Windows用`set`,Linux/macOS用`export`)、永久设置(系统属性或shell配置文件... 目录设置python路径的方法临时设置环境变量(适用于当前会话)永久设置环境变量(Windows系统

Python对接支付宝支付之使用AliPay实现的详细操作指南

《Python对接支付宝支付之使用AliPay实现的详细操作指南》支付宝没有提供PythonSDK,但是强大的github就有提供python-alipay-sdk,封装里很多复杂操作,使用这个我们就... 目录一、引言二、准备工作2.1 支付宝开放平台入驻与应用创建2.2 密钥生成与配置2.3 安装ali

Spring Security 单点登录与自动登录机制的实现原理

《SpringSecurity单点登录与自动登录机制的实现原理》本文探讨SpringSecurity实现单点登录(SSO)与自动登录机制,涵盖JWT跨系统认证、RememberMe持久化Token... 目录一、核心概念解析1.1 单点登录(SSO)1.2 自动登录(Remember Me)二、代码分析三、

PyCharm中配置PyQt的实现步骤

《PyCharm中配置PyQt的实现步骤》PyCharm是JetBrains推出的一款强大的PythonIDE,结合PyQt可以进行pythion高效开发桌面GUI应用程序,本文就来介绍一下PyCha... 目录1. 安装China编程PyQt1.PyQt 核心组件2. 基础 PyQt 应用程序结构3. 使用 Q