最近有一个同学实现了一个利用 DQN + CNN 的 Java 版增强学习 Flappybird:

作者自己手写了一个Java 版的 Flappybird,然后+ DJL 纯 Java 深度学习框架。
目前训练了 300 万步,鸟可以自己玩到 380 多分。训练好的模型已经在 repo 里面了,可以直接用来继续训练或者用 agent 跑跑看。
参考项目:
1
nl101531 2020 年 12 月 1 日 via iPhone
很有意思
|
2
saul0913 2020 年 12 月 1 日
这种东西用按键精灵不是更简单
|
3
tsening 2020 年 12 月 1 日
真厉害
|
4
lanking520 OP @saul0913 按键精灵没法应对随机管道呀
|
5
SkyLine7 2020 年 12 月 3 日
很强
|
6
choichun 2020 年 12 月 5 日 via Android
|