1.芯片型号 :J5
2.天工开物开发包OpenExplorer版本 :J5_OE_1.1.62
3.问题定位 :模型转换
4.问题具体描述 :你好,之前我也请教过core dump问题,自己尝试解决目前依然没有成功。
与上次求助贴对比,这次的模型我们去掉了地平线算子支持列表中明确不支持的算子类型(只去掉了不支持的算子种类,具体BPU CPU的约束条件还没有一一检查是否满足要求)。
hb_mapper_checker.log文件在附件,我在模型检查时需要调用的一些python代码中加了很多打印, 看下来应该是执行到/usr/local/lib/python3.8/dist-packages/horizon_nn/build.py 的if self.cali_dict_parser.get_calibration_type() in {“load”}:这条语句附近出现的Segmentation fault (core dumped)。 core dump之前的打印:Start to optimize the model这句话我也没有找到是哪个地方打印的,不确定是不是调用了.so的库打印的?做了很多尝试docker内core文件也无法生成,不确定是我们配置问题还是释放的docker不支持。
问题1:类似hb_mapper checker的底层工具,有什么更方便的方法进行调试吗,目前只能加打印找问题
问题2:core dump的模型麻烦再帮我们看一下,看看你们那边能不能更方便的定位到问题。这种问题我们后续要进行什么,目前模型在onnx runtime=1.8.0可以推理,是要先让降级到onnx runtime=1.2.0的版本推理成功再用hb_mapper checker吗
模型文件链接: https://pan.baidu.com/s/13V1AqLsyAfnqEyi\_8NGyvg 提取码: 293q
hb_mapper_checker.log
颜值即正义
2023 年9 月 4 日 08:58
2
您好,地平线工具链在持续迭代优化,为了给您提供更好的服务,希望您能抽出3分钟左右的时间,将您在使用工具链期间的感受和建议告诉我们,您的宝贵意见对我们很重要,非常感谢!-
问卷链接:地平线算法工具链使用满意度反馈
颜值即正义
2023 年8 月 23 日 06:11
3
你好,由于当前工具是基于onnx runtime=1.2.0进行开发的,在使用onnx runtime=1.2.0检查模型合法性时退出了,还没到我们的工具链层面,正如在问题2中所描述的,需要先降级到onnxruntime=1.2.0版本成功推理后,再进行模型转换,希望可以提供在onnx runtime=1.2.0可以推理的onnx模型以及脚本~
你好,我们修改了模型,使其可以在在onnx runtime=1.2.0版本上进行推理,但模型检查还是在相同的位置core dumped了,模型链接: 百度网盘-链接不存在 提取码: 08v9。
新的模型onnx runtime可以推理,也没有报错,但可能是因为去掉了很多层,推理最终结果不正确了,主要是想先定位一下core dumped原因,模型精度损失后面再慢慢修改,但也还是失败了。麻烦帮忙看一下你们那边能不能定位到core dumped的原因,我们再去修改模型。
另外还想请教一下,我们的模型是bev模型,用的是开源比较新的算法,是不是可能因为模型太新 工具链某些地方还没有适配,所以才有这些问题。我们用的是ptq的流程去量化,bev算法ptq的流程理论上也是可行的吧。
颜值即正义
2023 年9 月 4 日 08:52
5
你好,使用patch版本horzion-nn==0.20.1替换OE1.1.62 Docker中的原生horizon-nn,获取途径:https://pan.horizon.ai/index.php/s/kFbMzi7WAbdtzPc
BEV算法PTQ量化理论上是走的通的。
颜值即正义
2023 年9 月 20 日 08:41
7
非常感谢,但是换了之后还是core dumped。。
颜值即正义
2023 年9 月 20 日 09:16
9
那应该是不同的问题定位,这边建议单独发一份求助帖说明问题情况吧