1
xjtu001 OP 第一次用 github 上传东西,不知道能不能打开哦
|
2
xjtu001 OP v2ex 竟然不能发图,有点懵,没法上传效果图
|
3
ivechan 2019-05-06 21:01:55 +08:00 3
ANN 和 DNN 这个概念先纠正一下。
ANN 应该是 artificial neural network,是比较广泛的概念,包含了 DNN。 DNN 是 deep neural network,有时候也称为 MLP,一般与 CNN, RNN 做区分。 你这里应该是三层网络( DNN )和单层网络(你说的 ANN )对比, 建议你把 DNN 中的 dropout 和 BatchNorm 先去掉,特别是 dropout ( 0.5 )可能太激进了。 另外注意下 Loss 曲线,三层比一层差可能有两个原因: 1. 过拟合,少训练一点时间就可以解决 2. 未拟合,建议增加时间,或者增加数据集。 |
4
xychang 2019-05-06 21:08:32 +08:00 via Android
你数据量多大啊?最后模型取的是第几个 epoch 的结果?
|
6
ipwx 2019-05-06 21:46:26 +08:00
无脑上 BN 和 Dropout 的都是猛士。
|
9
loryyang 2019-05-06 21:50:31 +08:00
你的好和差到底是多少?至少要看到你的模型是欠拟合还是过拟合了,还是压根没有 work,然后相应地做调整
|
11
longbye0 2019-05-06 22:41:17 +08:00
只看了下你写的 mlp。
同#3,去掉 bn 和 dropout。 看你输入输出应该是 721 维向量,自己度量下输入向量的相关性,判断下隐藏层该取小于 721 还是大于。 取一个完整工况不做训练,来验证。 |
12
usingnamespace 2019-05-07 01:52:38 +08:00 via iPhone
还好有人纠正了你的概念。。。
|
13
jackOne 2019-05-07 09:15:07 +08:00
建议看下你模型训练过程中的训练损失曲线以及验证损失曲线,看模型是否 work 或者是过拟合
|