理查德·萨顿

（美国计算机科学家）

理查德·萨顿（Richard Sutton）是美国计算机科学家，是Deepmind的研究科学家，阿尔伯塔大学计算机学教授。萨顿和他的老师安德鲁·巴托（Andrew Barto）合著《强化学习导论》（Reinforcement Learning， an introduction），他的贡献包括时序差分学习和策略梯度方法，被称为现代强化学习之父。萨顿出生在美国俄亥俄州。