最近学习了一下深度强化学习算法,用 CNN+DDPG 算法做了一个玩微信跳一跳的 AI
和 GitHub 上的基于 OpenCV 的方法有本质的区别,实现了端到端的自动学习
有兴趣的同学可以看一看,或者帮忙改进改进一下,目前参数调优和训练量都还不足
1
Heigum 2018-06-15 14:24:20 +08:00 via Android
我跳一跳的排行榜都没人了
|
2
nine99 2018-06-15 14:57:52 +08:00
好奇这个训练起来会有多慢
|
3
ynyounuo 2018-06-15 15:01:35 +08:00
跳一跳距离和按压时间正相关,你这样意义不大。
|
4
hijkzzz OP |
5
takato 2018-06-15 16:32:50 +08:00 via iPad
|
6
tsaoyu 2018-06-15 18:16:03 +08:00
做的还是很有意思的。
@takato 可以继续往稀疏奖励和高维状态的方向上去做,应用方面的话机器人,能源规划以及资产管理都有一些可以继续深入的点。 |