DQN算法实例演示
计算target值