书籍:Mathematical Foundations of Reinforcement Learning
作者:赵世钰
出版:Springer
编辑:陈萍萍的公主@一点人工一点智能
01 书籍介绍
本书对基本概念、核心挑战和经典强化学习算法进行了数学但易于理解的介绍。它旨在帮助读者理解算法的理论基础,提供对其设计和功能的见解。整个过程中包括许多说明性示例。数学内容经过精心设计,以确保可读性和易于理解。
本书分为两部分。第一部分是关于强化学习的数学基础,涵盖 Bellman 方程、Bellman 最优方程和随机近似等主题。第二部分阐述了强化学习算法,包括价值迭代和策略迭代、蒙特卡洛方法、时间差分方法、价值函数方法、策略梯度方法和参与者-批评者方法。
作为一本内容详实的著作,它不仅面向高校本科生、研究生、博士后学者、教师及工业界研究员,同时也吸引着所有希望深入了解强化学习领域的爱好者。
02 作者简介
赵世钰教授现任教于西湖大学工程学院,担任智能无人系统实验室的主任。他于2014年在新加坡国立大学取得电气与计算机工程博士学位。在此之前,赵教授曾在英国谢菲尔德大学的自动控制与系统工程系任教。他的研究方向主要围绕多机器人系统的决策制定与感知技术展开。