关于训练过程中不同训练阶段生成的权重文件用于图像推断时表现的思考

使用yolov3模型进行迁移学习,结合名为saved_model_full的pre-trained model。

训练至第4、5个epoch时其权重文件便获得了不俗的推断表现。

训练至第7/8个epoch时loss值不降反增,微小的loss值升高体现在模型推断能力上便是bouding box标注的不准确/图像中目标类别物体标注不全面。

通过对最终saved_model的比对,epoch-5.index文件能获得最优的推断结果。

这种U形训练曲线并不少见,若有条件应适当提升训练epoch值或对模型超参数进行微调等,以期获得更好的训练效果。剧照镇楼:

另外,基于LeNet-5的量化感知模型所得的Quant test accuracy出奇地好,甚至优于原本模型。推测是进行quantization_aware_training时适当调整了原始浮点模型(进行模型fine-tune)或是调整了计算单元的类型所致。