版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
系統(tǒng)建模理論及應(yīng)用清華大學(xué)自動化系系統(tǒng)工程研究所2003季學(xué)期1第四章梯度校正建模理論研究最小二乘建模遞推算法的結(jié)構(gòu): 新的估計(jì)值=前一步的估計(jì)值+修正值梯度校正法:沿著準(zhǔn)則函數(shù)的負(fù)梯度方向,逐步修正模型的參數(shù)估計(jì)值,直至準(zhǔn)則函數(shù)達(dá)到最小值.梯度建模方法的應(yīng)用: 1.確定性問題的梯度建模方法; 2.隨機(jī)性問題的梯度建模方法; 3.隨機(jī)逼近法的應(yīng)用;24.1確定性問題的梯度校正建模(1/6)設(shè)系統(tǒng)的輸出是參數(shù)的線性組合如果y(t)和所有的h(t)是可以準(zhǔn)確測量的,稱為確定性過程,設(shè):可以簡單記為:在離散時(shí)間點(diǎn)有可以寫成:例如用差分方程描述的確定性過程可以寫成:34.1確定性問題的梯度校正建模(2/6)很容易化為定義式其中建模的核心問題就是如何根據(jù)數(shù)據(jù)來確定參數(shù)在k時(shí)刻的估計(jì)值,使用準(zhǔn)則函數(shù)式中解決此類問題的方法可以用梯度校正法,也就是最速下降法。其核心就是沿著的負(fù)梯度方向不斷修正的值,直至
達(dá)到最小。4這種方法的數(shù)學(xué)表達(dá)式為:其中:R(k)稱為加權(quán)陣,是n維的對稱矩陣。表示準(zhǔn)則函數(shù)關(guān)于的梯度4.1確定性問題的梯度校正建模(3/6)有確定性問題的遞推公式可以寫成:5加權(quán)陣的作用是用來控制各輸入量對建模的影響程度。其基本格式為:4.1確定性問題的梯度校正建模(4/6)只要適當(dāng)選擇,就能控制各輸入分量對參數(shù)估計(jì)值的影響。如果取表示輸入分量對參數(shù)估計(jì)值的影響弱于。如果取表示輸入分量的加權(quán)值相同,對參數(shù)估計(jì)的影響是一致的。權(quán)矩陣的選擇視具體問題而定。6加權(quán)陣R(k)的各元素應(yīng)該滿足如下條件:4.1確定性問題的梯度校正建模(5/6)式中為確定的上、下界。1、2、N個(gè)中至少存在一個(gè)使得或3、7加權(quán)陣R(k)的各元素應(yīng)該滿足如下條件(Cont.):4.1確定性問題的梯度校正建模(6/6)4、與h(k)不正交則:參數(shù)估計(jì)是一致漸進(jìn)收斂的,即:條件1規(guī)定了加權(quán)值必須是大于0且為有界的實(shí)數(shù);條件2是推倒條件3的前提;條件3、條件4保證收斂的條件。條件3規(guī)定了c(k)存在一個(gè)選擇范圍,在理論上是可以證明存在最佳權(quán)矩陣,保證快速收斂。84.2隨機(jī)性問題的梯度校正建模(1/10)梯度校正法的最大優(yōu)點(diǎn)是計(jì)算簡單,但是如果輸入輸出含有噪聲,就需要對原由方法進(jìn)行修改,需要研究隨機(jī)性問題梯度校正法。新方法也具備計(jì)算簡單的特點(diǎn),可以用于在線實(shí)時(shí)辨識,但要求噪聲的統(tǒng)計(jì)特性:一階矩和二階矩是已知的。設(shè)輸入輸出均含噪聲的隨機(jī)性問題如下圖:系統(tǒng)模型參數(shù)h(k)s(k)x(k)y(k)w(k)z(k)94.2隨機(jī)性問題的梯度校正建模(2/10)系統(tǒng)的輸出y(k)是模型參數(shù)的線性組合:觀測到的輸入輸出數(shù)據(jù)均含有測量噪聲,即:其中w(k)和s(k)為零均值的不相關(guān)隨機(jī)噪聲,且則可得到10上式中:4.2隨機(jī)性問題的梯度校正建模(3/10)要解決的問題就是利用輸入輸出數(shù)據(jù)x(k)和z(k)來確定參數(shù)在k時(shí)刻的估計(jì)值,使準(zhǔn)則函數(shù)式中11最終可以寫成4.2隨機(jī)性問題的梯度校正建模(4/10)隨機(jī)性問題的梯度校正法思想與確定性問題是一樣的,也是用最速下降法原理,從給定的初始值出發(fā),沿著準(zhǔn)則函數(shù)的負(fù)梯度方向修正參數(shù)估計(jì)值,直到準(zhǔn)則函數(shù)達(dá)到極小值。其數(shù)學(xué)表達(dá)式可寫成:12按噪聲的特點(diǎn)可以將隨機(jī)性問題的梯度校正法分為三類辨識問題:4.2隨機(jī)性問題的梯度校正建模(5/10)4.2.1第一類問題 要求測量噪聲w(k)是統(tǒng)計(jì)獨(dú)立的系統(tǒng)參數(shù)++++-模型參數(shù)辨識算法+13從數(shù)學(xué)意義上講,第一類問題滿足以下條件:向量h(k)與零均值的測量噪聲w(k)是統(tǒng)計(jì)獨(dú)立的,即:,w(k)的方差不必已知4.2隨機(jī)性問題的梯度校正建模(6/10)向量h(k)的條件協(xié)方差陣是常數(shù)矩陣,且與參數(shù)估計(jì)值無關(guān),即輸入向量的測量噪聲s(k)是均值為零,協(xié)方差陣為(已知)的不相關(guān)離散隨機(jī)向量,并且與h(k)和w(k)都是統(tǒng)計(jì)獨(dú)立的,即144.2隨機(jī)性問題的梯度校正建模(7/10)第一類隨機(jī)問題結(jié)論:當(dāng)輸入向量不含測量噪聲時(shí),梯度校正法可以得到漸進(jìn)無偏估計(jì),即有4.2.2第二類問題 測量噪聲w(k)中有一部分分量與h(k)是相關(guān)的。系統(tǒng)參數(shù)+++++-模型參數(shù)辨識算法動態(tài)環(huán)節(jié)154.2隨機(jī)性問題的梯度校正建模(8/10)其中,擾動噪聲通過“動態(tài)環(huán)節(jié)”與輸入向量相關(guān)。要求保證w(k)的均值為零,但其方差不必先知。從數(shù)學(xué)意義上講,第二類問題只將第一類問題的條件1改變?yōu)椋涸肼晈(k)可分解為測量噪聲和擾動噪聲兩部分,即第二類問題結(jié)論:這種問題利用梯度校正法得到的模型參數(shù)估計(jì)值是漸進(jìn)有偏的。164.2隨機(jī)性問題的梯度校正建模(9/10)4.2.3第三類問題第三類問題輸入向量h(k)不僅與噪聲w(k)相關(guān),而且與參數(shù)估計(jì)值也相關(guān),一般不研究此類辨識問題。4.2.4梯度校正建模參數(shù)估計(jì)直接用以下遞推算法的通用式是有偏估計(jì)。對于第一類問題,增加約束條件后可得到無偏估計(jì)的遞推算法:17梯度校正法應(yīng)用中注意的問題:對于第二類問題,增加約束條件后也可得到無偏估計(jì)的遞推算法:4.2隨機(jī)性問題的梯度校正建模(10/10)1.注意選擇步長間隔使輸入向量和參數(shù)估計(jì)值不相關(guān),即通過選擇步長使向量和是統(tǒng)計(jì)不相關(guān)的。這是選擇步長間隔的基本出發(fā)點(diǎn)。2.必須事先知道噪聲的一階和二階矩統(tǒng)計(jì)特性。3.權(quán)矩陣的選擇必須滿足一定的條件才能保證參數(shù)估計(jì)是一致收斂的,但是不能保證最快的收斂速度。18隨機(jī)逼近法是梯度校正法的一種類型,是一種頗受重視的參數(shù)估計(jì)方法。準(zhǔn)則函數(shù)的一階負(fù)梯度為:4.3隨機(jī)逼近法(1/7)考慮如下模型的辨識問題:其中,e(k)為均值為零的噪聲。這種模型的參數(shù)辨識問題可以通過極小化噪聲方差來實(shí)現(xiàn)。即求參數(shù)的估計(jì)值使下列準(zhǔn)則函數(shù)達(dá)到極小值:19原則上說通過令上述負(fù)梯度值為零可以求得準(zhǔn)則函數(shù)達(dá)到最小時(shí)的參數(shù)的估計(jì)值。即4.3隨機(jī)逼近法(2/7)問題:如果不知道噪聲的統(tǒng)計(jì)性質(zhì),上式無法求解。如果將數(shù)學(xué)期望值用平均值來代替,就變?yōu)樽钚《藛栴}。4.3.1隨機(jī)逼近原理設(shè)x是標(biāo)量,y(x)是對應(yīng)的隨機(jī)變量。p(y|x)是x條件下y的概率密度函數(shù),則隨機(jī)變量y關(guān)于x的條件數(shù)學(xué)期望為:20它是x的函數(shù),又稱為回歸函數(shù)。當(dāng)函數(shù)的形式及其條件概率密度函數(shù)都不知道時(shí),很難求出上述方程的解析解。但可以通過隨機(jī)逼近法來求解。定義:隨機(jī)逼近法就是利用變量x1,x2,…及其對應(yīng)的隨機(jī)變量y(x1),y(x2),…,通過迭代計(jì)算,逐步逼近上述方程的解。4.3隨機(jī)逼近法(3/7)4.3.1隨機(jī)逼近原理(Cont.)對于給定的,設(shè)方程214.3.2Robbins-Monro算法算法遞推公式為:其中y(x(k))是對應(yīng)于x(k)的y值。為收斂因子。4.3隨機(jī)逼近法(4/7)則x(k)在均方意義下收斂于方程的解.如果收斂因子滿足下列條件:最簡單的收斂因子有:224.3.2Kiefer-Wolfowitz算法Robbins-Monro算法一般用來求方程的根。Kiefer和Wolfowitz引用它來確定回歸函數(shù)h(x)的極值,可以求出回歸函數(shù)h(x)極值的迭代算法:同樣,如果收斂因子滿足Robbins-Monro算法的條件,則此算法是收斂的,即x(k)的收斂值將使h(x(k))達(dá)到極值。Kiefer-Wolfowitz算法是隨機(jī)逼近法的基礎(chǔ)。4.3隨機(jī)逼近法(5/7)234.3.3隨機(jī)逼近參數(shù)估計(jì)這樣上述模型的辨識問題歸結(jié)成求下列方程的解利用隨機(jī)逼近原理,有4.3隨機(jī)逼近法(6/7)其中h(.)為標(biāo)量函數(shù),D表示k時(shí)刻以前的輸入輸出數(shù)據(jù)集合。顯然準(zhǔn)則函數(shù)的一階負(fù)梯度為:對于模型的參數(shù)辯識問題,設(shè)準(zhǔn)則函數(shù)為244.3.3隨機(jī)逼近參數(shù)估計(jì)(Cont.)對于我們具體的模型辨識問題,收斂因子滿足RobbinsMonro算法中的條件,準(zhǔn)則函數(shù)取噪聲的方差,即:4.3隨機(jī)逼近法(7/7)則可以得到用隨機(jī)逼近法解決上述模型辨識問題的基本公式:對于用差分方程描述的系統(tǒng)模型:當(dāng)輸入、輸出及系統(tǒng)噪聲滿足一定條件時(shí),利用隨機(jī)逼近原理可得到參數(shù)估計(jì)值的隨機(jī)逼近算法:254.4參數(shù)建模的收斂性問題(1/3)任何一種建模方法需要提供一種收斂的算法:當(dāng)觀測數(shù)據(jù)不斷增加時(shí),模型的參數(shù)估計(jì)值必須逐漸收斂于真值。建模的算法希望具有較快的收斂速度,有些算法雖然在理論上能給出嚴(yán)格的收斂證明,但無法給出收斂的速度,實(shí)際應(yīng)用中缺乏可操作性。建模算法所得到的參數(shù)有較高的精度,即參數(shù)估計(jì)偏差向量的各分量的方差都要盡可能小。264.4參數(shù)建模的收斂性問題(2/3)常見的幾種收斂性分析方法;仿真研究方法:針對某種建模算法,以大量具體的例子,通過計(jì)算機(jī)仿真,根據(jù)仿真的結(jié)果來分析算法的收斂性。 優(yōu)點(diǎn):直觀、實(shí)用的分析方法;缺點(diǎn):仿真結(jié)果往往與仿真所用的模型及噪聲特性有關(guān),不能對算法的收斂性作普遍性結(jié)論。借助穩(wěn)定性分析的理論方法來研究建模的收斂性包括:1、ODE法(OriginaryDifferentialEquation)
推導(dǎo)出與建模辨識算法相關(guān)的伴隨微分方程,通過研究微分方程的穩(wěn)定性來判斷遞推辨識算法的收斂性。274.4參數(shù)建模的收斂性問題(3/3) 2、鞅理論(MartingaleTheory)的應(yīng)用 通過引進(jìn)隨機(jī)Lyapunov函數(shù),然后用鞅理論分析該函數(shù)的收斂性,得到辨識參數(shù)的收斂性3、間接法 通過研究的收斂性,來間接研究算法的收斂性。即如果
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 賀州學(xué)院《通信一線工程典型案列》2023-2024學(xué)年第一學(xué)期期末試卷
- 賀州學(xué)院《素描》2021-2022學(xué)年第一學(xué)期期末試卷
- 賀州學(xué)院《模型設(shè)計(jì)與制作》2021-2022學(xué)年第一學(xué)期期末試卷
- 菏澤學(xué)院《綜合材料》2023-2024學(xué)年第一學(xué)期期末試卷
- 菏澤學(xué)院《高等代數(shù)方法》2022-2023學(xué)年第一學(xué)期期末試卷
- 菏澤學(xué)院《發(fā)酵工藝學(xué)》2022-2023學(xué)年第一學(xué)期期末試卷
- 風(fēng)能制造:搏風(fēng)破浪-探索風(fēng)能設(shè)備市場的未來之路
- 塑造民族醫(yī)療新模式-以病患需求為導(dǎo)向的營銷策略
- 618招聘宣傳-營銷策劃的618招聘宣傳
- 河南師范大學(xué)《歌曲作法與小樂隊(duì)編配1》2023-2024學(xué)年第一學(xué)期期末試卷
- 100以內(nèi)連加連減加減混合帶括號的練習(xí)題
- 【正版授權(quán)】 ISO 3585:1998 EN Borosilicate glass 3.3 - Properties
- 10以內(nèi)口算題每頁50道
- JBT 14585-2024 信號蝶閥(正式版)
- 實(shí)驗(yàn)室檢測基礎(chǔ)知識題庫附答案
- (高清版)WST 402-2024 臨床實(shí)驗(yàn)室定量檢驗(yàn)項(xiàng)目參考區(qū)間的制定
- 大學(xué)生生涯發(fā)展展示 (第二版)
- 2024年廣東深圳高三二模英語讀后續(xù)寫試題講評課件
- 電纜連接電磁兼容與防護(hù)措施
- 網(wǎng)絡(luò)故障分析報(bào)告模板
- DB37-T 5081-2024 住宅煙氣集中排放系統(tǒng)技術(shù)標(biāo)準(zhǔn)
評論
0/150
提交評論