问题描述:在部署基于激光点云的目标检测算法至地平线J5芯片时,hb_mapper checker时显示全部算子皆为BPU算子,但是在模型转换生成bin后板端推理时(hrt_model_exec perf)发现耗时严重,查看profiler.log发现CPU耗时很多。yaml模型转换配置文件中input_type_rt为:featuremap。问题详细见下图
这种情况下如何提高检测帧率呢?
问题描述:在部署基于激光点云的目标检测算法至地平线J5芯片时,hb_mapper checker时显示全部算子皆为BPU算子,但是在模型转换生成bin后板端推理时(hrt_model_exec perf)发现耗时严重,查看profiler.log发现CPU耗时很多。yaml模型转换配置文件中input_type_rt为:featuremap。问题详细见下图
这种情况下如何提高检测帧率呢?
您好,关于这个问题有三种解决方案:-
第一,通过将输入的量化节点(跑在CPU上)融合到前处理中,关于量化节点融合方案可参考这篇文章:https://developer.horizon.ai/forumDetail/116476291842200072;
第二,使用J5上的DSP进行加速,也就是将量化节点跑在DSP上,该方案需要联系和贵公司对接的地平线支持人员,走一些流程后释放。-
第三,参考地平线的点云参考方案,可以联系贵公司的项目对接人,参考方案的释放也需要走一些流程。
好的,谢谢
不客气~