DQN算法实例演示
探索与action获取