RDK X5 运行 vlm 模型

OPlin · 2025 年4 月 1 日 12:24

您好！这可能是由于模型推理时BPU可用内存不足导致的。您可以通过输入sudo srpi-config进入系统配置界面，选择Performance Options->选择P2 ION Memory->选择512MB+1024MB+1024MB。完成设置后退出srpi-config并重启开发板后再次尝试推理！这应该能解决您的问题

caojiaang · 2025 年4 月 3 日 12:04

你好解决了吗？-

潜沉10 · 2025 年4 月 7 日 07:11

其他模型目前不支持哈

潜沉10 · 2025 年5 月 8 日 03:47

这个报错看起来是图片问题，麻烦检测下图片是否完整或图片路径是否正确。

WiSadel · 2025 年5 月 17 日 07:39

我也是这样，请问解决了吗

89839205 · 2025 年5 月 30 日 16:26

成功部署了，谢谢作者大佬。小白总结一下我在部署过程中的小经验：1.如果出现模型初始化失败的报错，很有可能是没有修改ION memory大小为2.5GB，输入sudo srpi-config进入系统配置界面，选择Performance Options->选择P2 ION Memory->选择512MB+1024MB+1024MB。完成设置记得后退出srpi-config并重启开发板。2.(小白很容易犯错)作者运行的命令./build/bin/llama-intern2vl-bpu-cli -m ./Qwen2.5-0.5B-Instruct-Q4_0.gguf --mmproj ./vit_model_int16_v2.bin --image image2.jpg -p “描述一下这张图片.” --temp 0.5 --threads 8 由于模型项目的更新和编译的不同，命令中文件的路径可能是不相同的，应该是不能直接粘贴使用的要记得修改路径。比如我实际调用的命令是：./llama.cpp/build/bin/llama-intern2vl-bpu-cli -m ./Qwen2.5-0.5B-Instruct-Q4_0.gguf --mmproj ./vit_model_int16_v2.bin --image ./img/image2.jpg -p “描述一下这张图片.” --temp 0.5 --threads 8。可见我调用的命令和作者是不同的，这个需要根据自己实际的文件地址去修改。

我的文件层级是这样的，两个模型文件都放在和llama.cpp同一层级下。由于我是在llama.cpp里面进行的编译，所以我的llama-intern2vl-bpu-cli 文件不在作者的./build/bin/llama-intern2vl-bpu-cli -mli 的路径下，而是在./llama.cpp/build/bin/llama-intern2vl-bpu-cli 。再比如如果你将模型文件放在llama.cpp里面那么你对模型的调用地址应该是： ./llama.cpp/Qwen2.5-0.5B-Instruct-Q4_0.gguf .和./llama.cpp/vit_model_int16_v2.bin。.注意linux当中.的意思就是在当前路径下的意思，所以上述我的命令都是在llama.cpp_internv12_bpu当中运行的，而不是在llama.cpp里面运行的。如果在llama.cpp当中运行命令，那么路径也应该进行相应的修改。

zgrobot · 2025 年3 月 5 日 08:58

没有

zgrobot · 2025 年3 月 5 日 09:02

我也是在x5平台上，不过是最新的镜像。忘了附上log了，回头我再试下。印象中可能是版本不同导致。所以想了解一下这个文件是怎么产生的。我是不是自己转换产生一个。我现在镜像版本是3.1.1

潜沉10 · 2025 年3 月 7 日 07:57

x5 平台是支持的，这个文件是从模型拆分的onnx文件经过ptq转换的。镜像版本也正常的，可以贴上报错信息看看哈

初尘1 · 2025 年3 月 5 日 11:44

好的，谢谢，后续会出支持RDK X3版本的吗？

潜沉10 · 2025 年3 月 7 日 07:58

暂时不会哈，因为X3跑大模型效率比较低，会出支持RDK S100的版本。

caojiaang · 2025 年3 月 23 日 08:32

cp ../src/* ./examples/llava

是要把这个命令改成cp ../src/x5/* ./examples/llava它吗？

潜沉10 · 2025 年3 月 27 日 02:57

对的，谢谢

潜沉10 · 2025 年3 月 27 日 02:56

您好，请看看模型的路径是不是有问题，在运行路径下

89839205 · 2025 年5 月 30 日 16:31

成功解决了，就是文件路径出了问题。root@ubuntu:/app/llama.cpp_internvl2_bpu/llama.cpp# ./build/bin/llama-intern2vl-bpu-cli -m ./Qwen2.5-0.5B-Instruct-F16.gguf --mmproj ./vit_model_int16.bin --image image2.jpg -p “描述一下这张图片.” --temp 0.5 --threads 8 他是在llama.cpp里面执行的命令，下载的两个模型也都得仿照llama.cpp里面，这个他应该是没错的。但是iamge2.jpg这个文件，他的路径是llama.cpp_internvl2_bpu/img/image2.jpg。所以他图片的路径错了。建议的修改方法是：把模型文件都挪到llama.cpp_internvl2_bpu里面，让他们和llama.cpp同一层级，然后调用命令./llama.cpp/build/bin/llama-intern2vl-bpu-cli -m ./Qwen2.5-0.5B-Instruct-Q4_0.gguf --mmproj ./vit_model_int16_v2.bin --image ./img/image2.jpg -p “描述一下这张图片.” --temp 0.5 --threads 8

16773030500 · 2025 年6 月 24 日 08:53

哥们，后面那个yolov8的问题解决了没，遇到了一样的问题，交流下

guoweihong · 2025 年7 月 13 日 06:24

识别运行确实太慢了，十几秒才能返回答案，准确度暂且不说，这个识别效率如何提升，或者如何使用bpu做加速？

潜沉10 · 2025 年8 月 7 日 06:44

感谢您对地瓜机器人论坛的贡献！看看图片路径是否正确

潜沉10 · 2025 年8 月 7 日 06:44

可以试试最新的smolvlm方案，推理更快