5.1 策略梯度和增强算法_深度强化学习与GAN课程：深度学习中的高级主题-CSDN在线视频培训

课时介绍

5.1 策略梯度和增强算法

课程介绍

深度强化学习和GAN 在线课程是对当今深度学习中最令人兴奋的两个主题的介绍。生成式对抗网络（Generative Adversarial Network，GAN）将两个深度学习网络以“伪造者-检测”的关系相互映射，从而能够制作出具有灵活的、用户可指定元素的令人惊叹的照片真实感图像。深度强化学习也产生了同样令人惊讶的进步，包括大部分最广为人知的“人工智能”突破。Deep RL包括训练一名“代理人”在给定的“环境”中变得熟练，使算法能够在各种复杂挑战上达到或超过人类水平的表现，包括Atari视频游戏、棋类游戏围棋和微妙的手工操纵任务。在这些课程中，基本理论通过直观的解释和互动的、动手操作的Jupyter笔记本演示变得栩栩如生。实例主要特点是使用以Python和Keras，而Keras是最流行的深度学习库TensorFlow的高级API。