各种深度模型在板端运行所需算力

用户您好,请详细描述您所遇到的问题,这会帮助我们快速定位问题~

1.芯片型号:Xj3

2.天工开物开发包OpenExplorer版本:XJ3_OE_2.4.2

3.问题具体描述:请问是否能够提供在板端运行的各种深度学习模型所需的算力,例如yolov5,fcos等

您好,地平线工具链在持续迭代优化,为了给您提供更好的服务,希望您能抽出3分钟左右的时间,将您在使用工具链期间的感受和建议告诉我们,您的宝贵意见对我们很重要,非常感谢!

问卷链接:地平线算法工具链使用满意度反馈

你好,这个没有哎,算力和模型本身并没有什么线性对应的关系。

在这里有提供不同模型在XJ3上的FPS信息,可以参考看一下:https://developer.horizon.cc/api/v1/fileData/horizon\_xj3\_open\_explorer\_cn\_doc/oe\_mapper/source/appendix/model\_benchmark.html#id3

那想请问一下,j3有5tops的算力,有多少算力可以应用到深度学习模型中呢

理论上都可以啊,只是不同模型结构对芯片的友好程度不同

但是参考您上面的链接:不同模型在XJ3上的FPS信息,发现其实这些网络模型在实际运行过程中也只使用了不到1TOPS的算力,是为什么呢?

MODEL NAME

INPUT SIZE

C(GOPs)

FPS

ITC(ms)

TCPP(ms)

ACCURACY

Dataset

MobileNetv1

1x224x224x3

1.14

661.10

3.171

0.089

Top1:

0.7061(FLOAT)

0.7034(INT8)

ImageNet

MobileNetv2

1x224x224x3

0.86

869.86

2.434

0.092

Top1:

0.7167(FLOAT)

0.7124(INT8)

ImageNet

GoogleNet

1x224x224x3

3.00

234.58

8.133

0.084

Top1:

0.7001(FLOAT)

0.6993(INT8)

ImageNet

Resnet18

1x224x224x3

3.65

228.25

8.720

0.087

Top1:

0.6836(FLOAT)

0.6825(INT8)

ImageNet

EfficientNet-Lite0

1x224x224x3

0.77

900.03

2.282

0.085

Top1:

0.7491(FLOAT)

0.7473(INT8)

ImageNet

EfficientNet-Lite1

1x240x240x3

1.20

624.67

3.168

0.081

Top1:

0.7647(FLOAT)

0.7625(INT8)

ImageNet

EfficientNet-Lite2

1x260x260x3

1.72

363.56

5.614

0.081

Top1:

0.7738(FLOAT)

0.7714(INT8)

ImageNet

EfficientNet-Lite3

1x280x280x3

2.77

228.68

8.537

0.081

Top1:

0.7922(FLOAT)

0.7901(INT8)

ImageNet

实测是无法测出算力的哈,像FPS的影响因素不单纯是算力,也会受到带宽等因素的限制

FPS*GOPS不就是一个算法所需的算力?

建议还是重点关注模型的性能表现