时序差分学习
(理学 | 计算机科学技术)
时序差分学习(temporal difference learning),理学-计算机科学技术-人工智能-机器学习-弱监督学习-强化学习,时序差分学习算法是强化学习中一种用于预测的经典算法,最早由R.萨顿(Richard Sutton)提出。此算法可以获得和监督学习同样的效果,并且占用的内存更少、收敛更快。
用户数据
参数表
继承树
构成树
关注人数:
0
技点进度:
0
/
0
题库进度:
0
/
0
技能进度:
0
/
关注级别:
取消关注
【参数模块正在开发当中】