理查德·萨顿
(美国计算机科学家)
理查德·萨顿(Richard Sutton)是美国计算机科学家,是Deepmind的研究科学家,阿尔伯塔大学计算机学教授。萨顿和他的老师安德鲁·巴托(Andrew Barto)合著《强化学习导论》(Reinforcement Learning, an introduction),他的贡献包括时序差分学习和策略梯度方法,被称为现代强化学习之父。萨顿出生在美国俄亥俄州。
知识树
时光轴
论点集
总题库
阅读模式
知识树 创建页面
知识树 创建说明
领域
提 交
科学家
科学人物
学者
科学
学术
人物
词条相关
词条 主页
》
词条 科普
》
词条 事件
》
词条 题库
》
词条 知识
》
加载更多
加载更多
加载更多
加载更多