YOLO11在RDKS100上量化部署之后识别效果失准

94347251 · 2025 年8 月 7 日 10:09

自训练的onnx可以成功识别机器人手上的零件，但是量化后的hbm的检测框都在图片上方
一、onnx模型信息

📥 输入信息:
   - 输入名称: images
   - 输入形状: [1, 3, 640, 480]
   - 输入尺寸: 480x640
   - 输入通道数: 3
📤 输出信息:
   - 输出名称: ['output0']
   - 输出数量: 1
   - 输出0 (output0): [1, 8, 6300]
⚙️  模型参数:
   - 类别数量: 4
   - 类别列表: ['part', 'labeled_part', 'part_in_hand', 'labeled_in_hand']
   - 置信度阈值: 0.5
   - IoU阈值: 0.45
🎨 颜色映射:
   - part: RGB(0, 255, 0)
   - labeled_part: RGB(0, 0, 255)
   - part_in_hand: RGB(255, 0, 0)
   - labeled_in_hand: RGB(0, 255, 255)

二、量化文件的使用
2.1 输入图像预处理: fix_uv_format_v3.py

root@ubuntu:/userdata/deploy_new# python3 fix_uv_format_v3.py test_img_new.jpg
处理图片: test_img_new.jpg
原始尺寸: 4000x3000
直接缩放后尺寸: 480x640 (宽x高)
目标尺寸: 480x640 (宽x高)
Y分量形状: (640, 480)
UV分量形状: (320, 480)
Y分量已保存: yolo11_input_y.bin ((640, 480)) - 307200 bytes
UV分量已保存: yolo11_input_uv.bin ((320, 480)) - 153600 bytes

2.2 编译并运行：yolo11_board_test.cc

./yolo11_board_test yolo11_0724_new.hbm yolo11_input_y.bin yolo11_input_uv.bin 4000 3000
[UCP]: log level = 3
[UCP]: UCP version = 3.7.3
[VP]: log level = 3
[DNN]: log level = 3
[HPL]: log level = 3
[UCPT]: log level = 6
🎯 YOLO11 板端测试程序
📁 模型文件: yolo11_0724_new.hbm
📁 Y输入文件: yolo11_input_y.bin
📁 UV输入文件: yolo11_input_uv.bin
📏 原图尺寸: 4000x3000
============================================================
🔄 Step 1: 获取模型句柄...
[BPU][[BPU_MONITOR]][281473725593824][INFO]BPULib verison(2, 1, 2)[0d3f195]!
[DNN] HBTL_EXT_DNN log level:6
[DNN]: 3.7.3_(4.2.11 HBRT)
✅ 模型句柄获取成功
🔄 Step 2: 准备输入输出tensor...
    输入tensor数量: 2
    输出tensor数量: 1
    输入0: [1, 640, 480, 1], 大小: 307200 bytes
    输入1: [1, 320, 240, 2], 大小: 153600 bytes
    输出0 (output0): [1, 8, 6300], 大小: 101376 bytes
✅ 输入输出tensor准备完成
🔄 Step 3: 设置输入数据到tensor...
    Y分量数据复制完成
    UV分量数据复制完成
✅ 输入数据设置完成
🔄 Step 4: 运行模型推理...
✅ 模型推理完成
🔄 Step 5: 保存输出数据到文件...
    输出数据大小: 50688 个int16_t值
    输出tensor形状: [1, 8, 6300]
    实际有效元素数: 50400 个int16_t值
    实际有效字节数: 100800 字节
    对齐字节数: 101376 字节
    填充字节数: 576 字节
✅ 输出数据已保存到: yolo11_output.bin
    保存了 50400 个有效int16_t值
    输出数据范围: [0, 32568]
    前10个输出值: 258 517 775 1292 1809 2326 2585 3102 3360 3619
✅ 量化系数信息已保存到: yolo11_scale.txt
✅ 输出数据保存完成
🎯 推理完成，输出数据已保存
📁 输出文件: yolo11_output.bin
📁 输入文件: yolo11_input_y.bin, yolo11_input_uv.bin
📏 原图尺寸: 4000x3000
💡 请使用Python脚本进行后处理
🔄 Step 6: 释放所有资源...
✅ 所有资源释放完成
🎉 板端测试程序执行完成!

2.3 后处理： postprocess_hbm_output.py

识别效果：

具体输出为：

🎯 HBM模型输出后处理
============================================================
📁 输出文件: yolo11_output.bin
📏 原图尺寸: 4000x3000
🎯 置信度阈值: 0.6
🎯 IoU阈值: 0.45
🐛 调试模式: 开启
🖼️  原始图像: test_img_new.jpg
🎨 可视化: 启用
============================================================
📁 读取输出文件: yolo11_output.bin
📊 读取到 50400 个int16_t量化值
🔄 开始反量化处理...
    坐标反量化系数: 0.0193229
    类别概率反量化系数: 0.0193229
    反量化后数据范围: [0.000000, 629.308228]
✅ 输出数据读取成功
    形状: (1, 8, 6300)
    数据类型: float32
    数据范围: [0.000000, 629.308228]

🔄 开始后处理...
原始输出形状：(1, 8, 6300)
输出数据类型：float32
输出数据范围：[0.000000, 629.308228]
📊 原始输出数据样本 (前5个anchor, 8维特征):
  Anchor 0: [  4.985308   0.       281.9018   201.36394  151.02779    0.
   0.         0.      ]
  Anchor 1: [  9.98994   0.      281.9018  201.36394 151.02779   0.        0.
   0.     ]
  Anchor 2: [ 14.975247   0.       281.9018   191.2967   151.02779    0.
   0.         0.      ]
  Anchor 3: [ 24.965187   0.       281.9018   191.2967   161.09502    0.
   0.         0.      ]
  Anchor 4: [ 34.955128   0.       281.9018   191.2967   151.02779    0.
   0.         0.      ]
转置后形状：(6300, 8)
模型输出框数量：6300
坐标数据形状：(6300, 4)
类别概率形状：(6300, 4)
模型输出坐标范围：x∈[5.0, 469.5], y∈[0.0, 629.3]
宽高范围：w∈[0.0, 322.2], h∈[0.0, 249.7]
📊 前5个anchor的坐标和类别概率:
  Anchor 0: 坐标=[  4.985308   0.       281.9018   201.36394 ], 类别概率=[151.02779   0.        0.        0.     ]
  Anchor 1: 坐标=[  9.98994   0.      281.9018  201.36394], 类别概率=[151.02779   0.        0.        0.     ]
  Anchor 2: 坐标=[ 14.975247   0.       281.9018   191.2967  ], 类别概率=[151.02779   0.        0.        0.     ]
  Anchor 3: 坐标=[ 24.965187   0.       281.9018   191.2967  ], 类别概率=[161.09502   0.        0.        0.     ]
  Anchor 4: 坐标=[ 34.955128   0.       281.9018   191.2967  ], 类别概率=[151.02779   0.        0.        0.     ]
得分范围：[0.0000, 171.1622]
📊 前5个anchor的类别ID和得分:
  Anchor 0: 类别ID=0, 得分=151.0278
  Anchor 1: 类别ID=0, 得分=151.0278
  Anchor 2: 类别ID=0, 得分=151.0278
  Anchor 3: 类别ID=0, 得分=161.0950
  Anchor 4: 类别ID=0, 得分=151.0278
过滤后保留框数量：108 (阈值=0.6)
开始坐标转换...
坐标转换完成，形状：(108, 4)
📊 前5个转换后的坐标 (xyxy格式，480x640范围内):
  Box 0: [-135.96559 -100.68197  145.9362   100.68197]
  Box 1: [-130.96095 -100.68197  150.94084  100.68197]
  Box 2: [-125.97565  -95.64835  155.92615   95.64835]
  Box 3: [-115.98571  -95.64835  165.91608   95.64835]
  Box 4: [-105.99577  -95.64835  175.90602   95.64835]
/userdata/deploy_new/postprocess_hbm_output.py:282: RuntimeWarning: invalid value encountered in divide
  return inter_area / union_area  # IoU = 交集 / 并集
NMS后保留框数量：3 (IoU阈值=0.45)

🎯 最终检测结果:
  1. part：坐标(-91,-95)-(220,95)，中心(64,0)，得分171.162
  2. part：坐标(33,-95)-(355,95)，中心(194,0)，得分171.162
  3. part：坐标(367,14)-(392,14)，中心(379,14)，得分161.095

✅ 后处理完成！
📊 检测到 3 个目标
============================================================
🎯 最终检测结果 (置信度 >= 0.5):
  1. part: 置信度=171.162, 位置=(-91,-95)-(220,95)
  2. part: 置信度=171.162, 位置=(33,-95)-(355,95)
  3. part: 置信度=161.095, 位置=(367,14)-(392,14)
    有效检测数量: 3/3

🎨 开始可视化...
✅ 成功读取原始图像: (3000, 4000, 3)

🎨 开始绘制检测结果...
    原始图像尺寸: (3000, 4000, 3)
    检测到 3 个目标
    坐标转换比例: 宽=8.33, 高=4.69
    1. part: 坐标(-758,-445)-(1833,445), 中心(533,0), 得分171.162
    2. part: 坐标(275,-445)-(2958,445), 中心(1616,0), 得分171.162
    3. part: 坐标(3058,65)-(3266,65), 中心(3158,65), 得分161.095
✅ 检测结果已保存到: hbm_detection_result.jpg
✅ 可视化完成！
📁 结果图像: hbm_detection_result.jpg

有没有成功部署yolo11模型的大佬解答一下是哪些步骤可能出错了呢？

无限进步 · 2025 年8 月 7 日 12:25

我也是这个问题，我用的rdkx5

无限进步 · 2025 年8 月 7 日 14:53

我也是这个问题，我用的rdkx5

94347251 · 2025 年8 月 8 日 00:53

是的哥们，我也是检测框都在上面
，你解决了吗

无限进步 · 2025 年8 月 8 日 06:12

没有，超哥也不回，不知道哪里出现问题了

CauchyKesai · 2025 年8 月 8 日 08:20

你好，在算法开发的过程中，遇到各种数值不可控的问题都是正常的，算法开发本身就是需要厚积薄发的领域。算法工具链提供了完整的流程说明，debug工具及流程说明，供您参考。 PTQ流程详解：6.1. PTQ转换原理及流程 — Horizon Open Explorer

精度调优：8.2. PTQ模型精度调优 — Horizon Open Explorer

性能调优：8.1. 模型性能调优 — Horizon Open Explorer

精度debug工具详解：6.2.12. 精度debug工具 — Horizon Open Explorer

Runtime程序编写详解：9. 嵌入式应用开发（runtime）手册 — Horizon Open Explorer

如果将工具链手册所述的所有流程走完仍然不及预期，则说明模型及其权重本身无法量化。特别的，过拟合的模型本身容易出现异常值导致量化表示能力不足。

新算法开发建议

基本上新算法都需要做pipeline检查，来摸明白前后处理，一般不会是精度问题。
编写使用ONNXRuntime来推理原始浮点onnx的程序，来确定前后处理的baseline。
将输入类型设置为NCHW和featuremap，包括train和rt的两个type，前处理类型修改为no_preprocess,这样编译出来的quantized模型和bin模型所需要的数据，也就是所需要的前处理，和浮点onnx完全一致。建议在全featuremap的基础上进行准备校准数据，和bin模型编译。由于featuremap在板子上的python接口无法推理，只能用C/C++推理，调试阶段建议使用开发机器的HB_ONNXRuntime推理quantized onnx来调试。quantized onnx在全featuremap的编译基础上，前处理与浮点onnx完全一致。
如果在全featuremap的基础上，精度不达预期，可以查阅手册使用全int16编译，来确定精度上限。
全featuremap的基础上调通了，再来尝试配置nv12或rgb等让BPU加速前处理的配置方式。

无限进步 · 2025 年8 月 8 日 17:09

这回复说了像没说一样，我在别的平台转换量化模型是没问题的，所以模型本身肯定是没问题的。但是在这就有问题了，很难绷

94347251 · 2025 年8 月 11 日 01:25

感谢超哥热心解答，我理解一下步骤三应该就是先做一个demo版试试效果，然后再进一步量化是吧

94347251 · 2025 年8 月 11 日 08:31

超哥我想再请问一下，featuremap量化方式得到的hbm模型的数据预处理和后处理，应该跟onnx模型推理时的前后处理一致对吗？？

CauchyKesai · 2025 年8 月 11 日 11:00

一致，记得preprocess type写no_preprocess

YOLO11在RDKS100上量化部署之后识别效果失准

2.2 编译并运行 ：yolo11_board_test.cc

2.3 后处理： postprocess_hbm_output.py

2.2 编译并运行：yolo11_board_test.cc