保姆级教程：在Firefly RK3588开发板上搞定YOLOv5+DeepSORT目标追踪（附完整环境配置与避坑指南）-创锋一号

保姆级教程：在Firefly RK3588开发板上部署YOLOv5+DeepSORT目标追踪系统

当一块Firefly RK3588开发板握在手中时，许多开发者脑海中浮现的第一个应用场景往往是实时目标检测与追踪。这个六核ARM处理器与NPU结合的硬件平台，确实为边缘计算提供了绝佳的试验场。但真正着手部署YOLOv5和DeepSORT这套经典组合时，你会发现从环境配置到模型优化的每一步都可能成为拦路虎。本文将带你避开所有暗礁，用最直接的方式在RK3588上构建一个高效的目标追踪系统。

1. 开发板基础环境准备

刚拿到开发板时，建议先执行全面的系统更新。RK3588的Ubuntu系统虽然预装了不少工具，但仍需要补充关键组件：

sudo apt update && sudo apt upgrade -y sudo apt install -y git cmake python3-dev python3-pip

特别注意：开发板的存储空间有限，建议使用外接SSD或扩容存储。以下命令可以查看存储情况：

df -h

提示：如果用户目录空间不足，可以考虑将大型源码包和编译目录放在外接存储设备上，通过符号链接关联到工作目录。

基础开发工具链安装完成后，需要配置Python虚拟环境。RK3588的ARM架构对某些Python包存在兼容性要求：

python3 -m venv ~/venv_rk3588 source ~/venv_rk3588/bin/activate pip install --upgrade pip setuptools wheel

2. 关键依赖库的编译与安装

2.1 FFmpeg的定制化编译

视频处理是目标追踪的基础，而FFmpeg的版本兼容性直接影响后续OpenCV的功能。推荐从源码编译FFmpeg 4.4版本：

wget https://ffmpeg.org/releases/ffmpeg-4.4.tar.bz2 tar xvjf ffmpeg-4.4.tar.bz2 cd ffmpeg-4.4

编译配置时需要特别注意硬件加速选项：

./configure --prefix=/usr/local/ffmpeg \ --enable-shared \ --enable-gpl \ --enable-nonfree \ --enable-version3 \ --enable-rkmpp \ --enable-libdrm \ --extra-cflags="-I/usr/include/drm" \ --extra-ldflags="-L/usr/lib/aarch64-linux-gnu" make -j6 && sudo make install

关键参数说明：

参数	作用	RK3588特别注意事项
--enable-rkmpp	启用Rockchip媒体处理平台加速	必须开启
--enable-libdrm	启用DRM显示支持	需要安装libdrm-dev
-j6	并行编译线程数	建议不超过6线程

2.2 OpenCV 4.7的深度优化编译

OpenCV是计算机视觉的核心库，RK3588上编译需要特别关注NPU加速支持：

git clone --branch 4.7.0 https://github.com/opencv/opencv.git git clone --branch 4.7.0 https://github.com/opencv/opencv_contrib.git

创建编译目录并配置CMake：

mkdir build && cd build cmake -D CMAKE_BUILD_TYPE=RELEASE \ -D CMAKE_INSTALL_PREFIX=/usr/local/opencv-4.7.0 \ -D OPENCV_EXTRA_MODULES_PATH=../../opencv_contrib/modules \ -D WITH_GTK=ON \ -D WITH_FFMPEG=ON \ -D ENABLE_NEON=ON \ -D ENABLE_VFPV3=ON \ -D WITH_RKMPP=ON \ -D BUILD_EXAMPLES=OFF \ -D BUILD_opencv_python3=ON \ -D PYTHON3_EXECUTABLE=$(which python3) \ -D PYTHON3_INCLUDE_DIR=$(python3 -c "from distutils.sysconfig import get_python_inc; print(get_python_inc())") \ -D PYTHON3_PACKAGES_PATH=$(python3 -c "from distutils.sysconfig import get_python_lib; print(get_python_lib())") ..

编译过程中的常见问题及解决方案：

内存不足：在make命令中添加-j4而非-j6减少并行度
找不到RKMPP：安装librga-dev和librknn-runtime包
Python绑定失败：确认Python虚拟环境已激活

3. YOLOv5模型转换与优化

3.1 模型训练与导出

建议先在x86平台上训练YOLOv5s模型，然后导出为ONNX格式：

# 在训练服务器上执行 import torch model = torch.hub.load('ultralytics/yolov5', 'yolov5s', pretrained=True) dummy_input = torch.randn(1, 3, 640, 640) torch.onnx.export(model, dummy_input, "yolov5s.onnx", opset_version=12, input_names=['images'], output_names=['output'])

3.2 RKNN模型转换

使用Rockchip提供的RKNN-Toolkit2进行模型转换：

from rknn.api import RKNN rknn = RKNN() rknn.config(target_platform='rk3588', quantize_input_node=True, optimization_level=3) # 加载ONNX模型 ret = rknn.load_onnx(model='yolov5s.onnx') if ret != 0: print('Load model failed!') exit(ret) # 量化模型 ret = rknn.build(do_quantization=True, dataset='./dataset.txt') if ret != 0: print('Build model failed!') exit(ret) # 导出RKNN模型 ret = rknn.export_rknn('./yolov5s.rknn')

关键量化参数建议：

参数	推荐值	说明
optimization_level	3	最高优化级别
quantize_input_node	True	输入节点量化
quantized_dtype	'asymmetric_quantized-8'	8位非对称量化
batch_size	1	嵌入式部署通常为1

4. DeepSORT集成与系统调优

4.1 特征提取器适配

DeepSORT的核心是特征提取网络，在RK3588上需要轻量化：

// 修改特征提取器输入尺寸 const int feature_dim = 512; const int feature_width = 64; const int feature_height = 128; // 使用MobileNetv2替代原版ResNet rknn_input inputs[1]; inputs[0].index = 0; inputs[0].size = {feature_width, feature_height, 3}; inputs[0].fmt = RKNN_TENSOR_NHWC;

4.2 多线程流水线设计

充分利用RK3588的六核CPU设计处理流水线：

// 视频捕获线程 std::thread capture_thread([&](){ while(!stop_signal) { cv::Mat frame; cap >> frame; if(frame.empty()) break; mtx.lock(); frame_queue.push(frame); mtx.unlock(); } }); // 检测线程 std::thread detect_thread([&](){ while(!stop_signal) { if(!frame_queue.empty()) { mtx.lock(); cv::Mat frame = frame_queue.front(); frame_queue.pop(); mtx.unlock(); auto detections = yolov5_detect(frame); tracker.update(detections); } } });

4.3 内存与性能优化技巧

DMA-BUF内存共享：减少内存拷贝开销

cv::Mat frame(height, width, CV_8UC3, drm_buffer_handle, DRM_MODE_FB_MODIFIERS);

NPU温度监控：防止过热降频

watch -n 1 cat /sys/class/thermal/thermal_zone*/temp

优先级调整：保证关键线程资源
```
sudo chrt -f 99 ./yolov5_deepsort
```

5. 实际部署与效果验证

部署后的系统可以通过V4L2直接获取摄像头输入：

./yolov5_deepsort -i /dev/video0 -o output.mp4 \ -m yolov5s.rknn \ -c 80 \ -t 0.5

性能指标参考值（1080p分辨率）：

指标	YOLOv5单独运行	完整系统
帧率	22 FPS	15 FPS
CPU占用	180%	320%
内存占用	1.2 GB	1.8 GB
NPU温度	65°C	72°C

在RK3588上实现稳定运行的关键是找到检测精度与实时性的平衡点。经过实测，将YOLOv5的输入尺寸从640x640降至480x480，帧率可提升40%而精度仅下降5%。

企业官网建设流程全解析

保姆级教程：在Firefly RK3588开发板上部署YOLOv5+DeepSORT目标追踪系统

1. 开发板基础环境准备

2. 关键依赖库的编译与安装

2.1 FFmpeg的定制化编译

2.2 OpenCV 4.7的深度优化编译

3. YOLOv5模型转换与优化

3.1 模型训练与导出

3.2 RKNN模型转换

4. DeepSORT集成与系统调优

4.1 特征提取器适配

4.2 多线程流水线设计

4.3 内存与性能优化技巧

5. 实际部署与效果验证

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

保姆级教程：在Firefly RK3588开发板上部署YOLOv5+DeepSORT目标追踪系统

1. 开发板基础环境准备

2. 关键依赖库的编译与安装

2.1 FFmpeg的定制化编译

2.2 OpenCV 4.7的深度优化编译

3. YOLOv5模型转换与优化

3.1 模型训练与导出

3.2 RKNN模型转换

4. DeepSORT集成与系统调优

4.1 特征提取器适配

4.2 多线程流水线设计

4.3 内存与性能优化技巧

5. 实际部署与效果验证

热门文章

文章分类

标签云

相关文章

医疗容器合规不是选择题：Docker 27 强制启用的attestations v2.1签名机制，如何72小时内完成可信执行环境（TEE）适配？

国产化替代迫在眉睫，Docker在飞腾+昇腾平台调试不通过？这7个arm64架构特有报错必须今天解决

【化工防爆安防】济南昊安光电 防爆摄像 / 通讯 / 录显 / 电源全场景解决方案

需要专业的网站建设服务？

【化工防爆安防】济南昊安光电防爆摄像 / 通讯 / 录显 / 电源全场景解决方案