序貫決策
[拼音]:xuguan juece
[外文]:sequential decision
用于隨機性或不確定性動態(tài)系統(tǒng)最優(yōu)化的決策方法。序貫決策的特點是:
(1)所研究的系統(tǒng)是動態(tài)的,即系統(tǒng)所處的狀態(tài)與時間有關,可周期(或連續(xù))地對它觀察;
(2)決策是序貫地進行的,即每個時刻根據(jù)所觀察到的狀態(tài)和以前狀態(tài)的記錄,從一組可行方案中選用一個最優(yōu)方案(即作最優(yōu)決策),使取決于狀態(tài)的某個目標函數(shù)取最優(yōu)值(極大或極小值);
(3)系統(tǒng)下一步(或未來)可能出現(xiàn)的狀態(tài)是隨機的或不確定的。序貫決策的過程是:從初始狀態(tài)開始,每個時刻作出最優(yōu)決策后,接著觀察下一步實際出現(xiàn)的狀態(tài),即收集新的信息,然后再作出新的最優(yōu)決策,反復進行直至最后。系統(tǒng)在每次作出決策后下一步可能出現(xiàn)的狀態(tài)是不能確切預知的,存在兩種情況:
(1)系統(tǒng)下一步可能出現(xiàn)的狀態(tài)的概率分布是已知的,可用客觀概率的條件分布來描述。對于這類系統(tǒng)的序貫決策研究得較完滿的是狀態(tài)轉(zhuǎn)移律具有無后效性的系統(tǒng),相應的序貫決策稱為馬爾可夫決策過程,它是將馬爾可夫過程理論與決定性動態(tài)規(guī)劃相結合的產(chǎn)物。
(2)系統(tǒng)下一步可能出現(xiàn)的狀態(tài)的概率分布不知道,只能用主觀概率的條件分布來描述。用于這類系統(tǒng)的序貫決策屬于決策分析的內(nèi)容。
建筑資質(zhì)代辦咨詢熱線:13198516101
標簽:序貫決策
版權聲明:本文采用知識共享 署名4.0國際許可協(xié)議 [BY-NC-SA] 進行授權
文章名稱:《序貫決策》
文章鏈接:http://m.fjemb.com/14573.html
該作品系作者結合建筑標準規(guī)范、政府官網(wǎng)及互聯(lián)網(wǎng)相關知識整合。如若侵權請通過投訴通道提交信息,我們將按照規(guī)定及時處理。