概率规划(probabilistic planning),管理学-管理科学与工程-管理系统工程-[管理系统规划与计划]-自动规划-概率规划,在给定初始状态的集合、目标状态的集合、动作的集合(其中的动作带有不确定的结果,用概率分布描述)及限定的时间和必须满足的阈值的情况下,寻找一个动作序列使主体能在最小概率值为阈值的状态下到达目标状态。概率规划的目标是在限定时间内,从所有可以达到目标状态的规划中找到一个最优的规划。在求解过程中加入哪个动作到规划中主要取决于到目前为止的历史结果,且一个完整的意外规划一定是带有分支的规划。最优是指在给定的时间限制内规划成功的概率最大。概率规划问题类似于马尔可夫决策问题,而马尔可夫决策过程是处理动作具有不确定性效果的一种方式,其假定在一定状态下每个可执行的动作,其结果状态由一个已知的概率分布给出。对于决策来说其并不是严格的定义,因为在这种假设下,没有考虑动作的代价及规划中某些动作的结果会对整个规划有促进作用而生成的奖励。也就是说其只是衡量了规划实现目标的可能性,没有考虑到使用动作所涉及的资源及其他数值要求。这种状况只是一种理想状态,其实际应用能力也是很有限的。