摘要:序贯决策 正文 用于随机性或不确定性动态系统最优化的决策方法。序贯决策的特点是:①所研究的系统是动态的,即系统所处的状态与时间有关,可周期(或连续)地对它观察;②决策是序贯地进行的,即每个时刻根据所观察到的状态和以前状态的记录,从一组可行方案中选用一个最优方案(即作最优决策),使取决于状态的某个目标函数取最优值(极大或极小值);③系统下一步(或未来)可能出现的状态是随机的或不确定的。序贯决策的过程是:从初始状态开始,每个时刻作出最优决策后,接着观察下一步实际出现的状态,即收集新的信息[阅读全文]