贝尔曼方程(BellmanEquation)也被称作动态规划方程(DynamicProgrammingEquation),由理查·贝尔曼(RichardBellman)发现。贝尔曼方程是动态规划(DynamicProgramming)这些数学最佳化方法能够达到最佳化的必要条件。此方程把"决策问题在特定时间怎么的值"以"来自初始选择的报酬比从初始选择衍生的决策问题的值"的形式表示。借此这个方式把动态最佳化问题变成简单的子问题,而这些子问题遵守从贝尔曼所提出来的"最佳化还原理"。贝尔曼方程最早应用在工程领域的控制理论和其他应用数学领域,而后成为经济学上的重要工具。