用户您好,请详细描述您所遇到的问题,这会帮助我们快速定位问题~
1.芯片型号:Xj3
2.天工开物开发包OpenExplorer版本:XJ3_OE_2.4.2
3.问题具体描述:请问是否能够提供在板端运行的各种深度学习模型所需的算力,例如yolov5,fcos等
用户您好,请详细描述您所遇到的问题,这会帮助我们快速定位问题~
1.芯片型号:Xj3
2.天工开物开发包OpenExplorer版本:XJ3_OE_2.4.2
3.问题具体描述:请问是否能够提供在板端运行的各种深度学习模型所需的算力,例如yolov5,fcos等
您好,地平线工具链在持续迭代优化,为了给您提供更好的服务,希望您能抽出3分钟左右的时间,将您在使用工具链期间的感受和建议告诉我们,您的宝贵意见对我们很重要,非常感谢!
问卷链接:地平线算法工具链使用满意度反馈
你好,这个没有哎,算力和模型本身并没有什么线性对应的关系。
在这里有提供不同模型在XJ3上的FPS信息,可以参考看一下:https://developer.horizon.cc/api/v1/fileData/horizon\_xj3\_open\_explorer\_cn\_doc/oe\_mapper/source/appendix/model\_benchmark.html#id3
那想请问一下,j3有5tops的算力,有多少算力可以应用到深度学习模型中呢
理论上都可以啊,只是不同模型结构对芯片的友好程度不同
但是参考您上面的链接:不同模型在XJ3上的FPS信息,发现其实这些网络模型在实际运行过程中也只使用了不到1TOPS的算力,是为什么呢?
MODEL NAME
INPUT SIZE
C(GOPs)
FPS
ITC(ms)
TCPP(ms)
ACCURACY
Dataset
MobileNetv1
1x224x224x3
1.14
661.10
3.171
0.089
Top1:
0.7061(FLOAT)
0.7034(INT8)
ImageNet
MobileNetv2
1x224x224x3
0.86
869.86
2.434
0.092
Top1:
0.7167(FLOAT)
0.7124(INT8)
ImageNet
GoogleNet
1x224x224x3
3.00
234.58
8.133
0.084
Top1:
0.7001(FLOAT)
0.6993(INT8)
ImageNet
Resnet18
1x224x224x3
3.65
228.25
8.720
0.087
Top1:
0.6836(FLOAT)
0.6825(INT8)
ImageNet
EfficientNet-Lite0
1x224x224x3
0.77
900.03
2.282
0.085
Top1:
0.7491(FLOAT)
0.7473(INT8)
ImageNet
EfficientNet-Lite1
1x240x240x3
1.20
624.67
3.168
0.081
Top1:
0.7647(FLOAT)
0.7625(INT8)
ImageNet
EfficientNet-Lite2
1x260x260x3
1.72
363.56
5.614
0.081
Top1:
0.7738(FLOAT)
0.7714(INT8)
ImageNet
EfficientNet-Lite3
1x280x280x3
2.77
228.68
8.537
0.081
Top1:
0.7922(FLOAT)
0.7901(INT8)
ImageNet
实测是无法测出算力的哈,像FPS的影响因素不单纯是算力,也会受到带宽等因素的限制
FPS*GOPS不就是一个算法所需的算力?
建议还是重点关注模型的性能表现