理查德·萨顿
(美国计算机科学家)
理查德·萨顿(Richard Sutton)是美国计算机科学家,是Deepmind的研究科学家,阿尔伯塔大学计算机学教授。萨顿和他的老师安德鲁·巴托(Andrew Barto)合著《强化学习导论》(Reinforcement Learning, an introduction),他的贡献包括时序差分学习和策略梯度方法,被称为现代强化学习之父。萨顿出生在美国俄亥俄州。
用户数据
参数表
继承树
构成树
关注人数:
0
技点进度:
0
/
0
题库进度:
0
/
0
技能进度:
0
/
关注级别:
取消关注
【参数模块正在开发当中】