这个模型是使用深度q学习的一个例子,主要使用了cnn和强化学习以及q-learing的思想。具体原理准备写一份博客进行讲解。这里使用pytorch进行实现。
pytorch >= 1.0.0
python >= 3.6
git clone https://github.com/chaotiaor/mybird.git
cd mybird
python deep_q.py
1,cnn
2,q-learn
https://github.com/yenchenlin/DeepLearningFlappyBird
https://www.intel.ai/demystifying-deep-reinforcement-learning/