深度强化学习新趋势:谷歌如何把好奇心引入强化学习智能体

  探索-利用困境是规范强化学习算法的动力之一。如何平衡智能体应该探索环境的程度与如何执行特定操作和 … Continue reading “深度强化学习新趋势:谷歌如何把好奇心引入强化学习智能体”

从信息流推荐到控制领域 百度PaddlePaddle技术能力再升级

人工智能技术越来越广泛的应用于各行各业,而这一切都离不开底层深度学习框架的支持。近日,百度深度学习Paddle … Continue reading “从信息流推荐到控制领域 百度PaddlePaddle技术能力再升级”

深度强化学习从入门到大师:通过Q学习进行强化学习(第二部分)

深度强化学习从入门到大师:通过Q学习进行强化学习(第二部分)     本文是 Tensor … Continue reading “深度强化学习从入门到大师:通过Q学习进行强化学习(第二部分)”