在这里想请教一个问题:
在用迁移学习训练网络模型的时候,运行到第一个 Epoch 最后的时候,卡在那里不再往下走了,但程序并没有停,Cuda 也显示是仍在加速着,请问下这个是什么原因呢?谢谢!(这个做的是图片分类的任务,之前选用很少的几个类别进行训练的时候是完全没有任何问题的,但是类别扩展到几千类之后就出现这种情况了)
1
yoshiaki 2019-12-13 14:04:47 +08:00
我认为这是程序在跑 val 数据集导致的,跑完一个 epoch,显示的 val_acc 和 val_loss 就是这时候计算的,你几千类,batch_size 应该会大不少,不过详细也需要看过你代码才知道
|
2
LoveIsPain OP 谢谢您
|