YOLOv7 TensorRT Benchmark测试（Linux）

环境准备

CUDA、CUDNN：确认环境中已经安装CUDA和CUDNN，并且提前获取其安装路径。
TensorRT：可通过NVIDIA官网下载TensorRT 8.4.1.5或其他版本安装包。
Paddle Inference C++预测库：编译develop版本请参考编译文档。编译完成后，会在build目录下生成paddle_inference_install_dir文件夹，这个就是我们需要的C++预测库文件。

编译可执行程序

(1)修改compile.sh中依赖库路径，主要是以下内容：

# Paddle Inference预测库路径
LIB_DIR=/root/auto_compress/Paddle/build/paddle_inference_install_dir/
# CUDNN路径
CUDNN_LIB=/usr/lib/x86_64-linux-gnu/
# CUDA路径
CUDA_LIB=/usr/local/cuda/lib64
# TensorRT安装包路径，为TRT资源包解压完成后的绝对路径，其中包含`lib`和`include`文件夹
TENSORRT_ROOT=/root/auto_compress/trt/trt8.4/

Paddle tensorRT测试

YOLOv5

# FP32
./build/trt_run --model_file yolov5s_infer/model.pdmodel --params_file yolov5s_infer/model.pdiparams --run_mode=trt_fp32
# FP16
./build/trt_run --model_file yolov5s_infer/model.pdmodel --params_file yolov5s_infer/model.pdiparams --run_mode=trt_fp16
# INT8
./build/trt_run --model_file yolov5s_quant/model.pdmodel --params_file yolov5s_quant/model.pdiparams --run_mode=trt_int8

YOLOv6

# FP32
./build/trt_run --arch=YOLOv6 --model_file yolov6s_infer/model.pdmodel --params_file yolov6s_infer/model.pdiparams --run_mode=trt_fp32
# FP16
./build/trt_run --arch=YOLOv6 --model_file yolov6s_infer/model.pdmodel --params_file yolov6s_infer/model.pdiparams --run_mode=trt_fp16
# INT8
./build/trt_run --arch=YOLOv6 --model_file yolov6s_quant/model.pdmodel --params_file yolov6s_quant/model.pdiparams --run_mode=trt_int8

YOLOv7

# FP32
./build/trt_run --model_file yolov7_infer/model.pdmodel --params_file yolov7_infer/model.pdiparams --run_mode=trt_fp32
# FP16
./build/trt_run --model_file yolov7_infer/model.pdmodel --params_file yolov7_infer/model.pdiparams --run_mode=trt_fp16
# INT8
./build/trt_run --model_file yolov7_quant/model.pdmodel --params_file yolov7_quant/model.pdiparams --run_mode=trt_int8

原生TensorRT测试

# FP32
trtexec --onnx=yolov5s.onnx --workspace=1024 --avgRuns=1000 --inputIOFormats=fp16:chw --outputIOFormats=fp16:chw
# FP16
trtexec --onnx=yolov5s.onnx --workspace=1024 --avgRuns=1000 --inputIOFormats=fp16:chw --outputIOFormats=fp16:chw --fp16
# INT8
trtexec --onnx=yolov5s.onnx --workspace=1024 --avgRuns=1000 --inputIOFormats=fp16:chw --outputIOFormats=fp16:chw --int8

注：可把--onnx=yolov5s.onnx替换成yolov6s.onnx和yolov7.onnx模型

性能对比

预测库	模型	预测时延^{FP32^(ms)}	预测时延^{FP16^(ms)}	预测时延^{INT8^(ms)}
Paddle TensorRT	yolov5s	5.95ms	2.44ms	1.87ms
TensorRT	yolov5s	6.16ms	2.58ms	2.07ms

Paddle TensorRT	YOLOv6s	9.06ms	2.90ms	1.83ms
TensorRT	YOLOv6s	8.59ms	2.83ms	1.87ms

Paddle TensorRT	YOLOv7	26.84ms	7.44ms	4.55ms
TensorRT	YOLOv7	28.25ms	7.23ms	4.67ms

环境：

Tesla T4，TensorRT 8.4.1，CUDA 11.2
batch_size=1

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

YOLOv7 TensorRT Benchmark测试（Linux）

环境准备

编译可执行程序

Paddle tensorRT测试

原生TensorRT测试

性能对比

Files

README.md

Latest commit

History

README.md

File metadata and controls

YOLOv7 TensorRT Benchmark测试（Linux）

环境准备

编译可执行程序

Paddle tensorRT测试

原生TensorRT测试

性能对比