时序差分学习
(理学 | 计算机科学技术)
时序差分学习(temporal difference learning),理学-计算机科学技术-人工智能-机器学习-弱监督学习-强化学习,时序差分学习算法是强化学习中一种用于预测的经典算法,最早由R.萨顿(Richard Sutton)提出。此算法可以获得和监督学习同样的效果,并且占用的内存更少、收敛更快。
加载更多
领域
提 交
计算机
科技
农学
技术
科学
词条相关
词条 主页
》
词条 科普
》
词条 事件
》
词条 题库
》
词条 知识
》