版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
系統(tǒng)建模理論及應(yīng)用清華大學(xué)自動(dòng)化系系統(tǒng)工程研究所2003季學(xué)期1第四章梯度校正建模理論研究最小二乘建模遞推算法的結(jié)構(gòu): 新的估計(jì)值=前一步的估計(jì)值+修正值梯度校正法:沿著準(zhǔn)則函數(shù)的負(fù)梯度方向,逐步修正模型的參數(shù)估計(jì)值,直至準(zhǔn)則函數(shù)達(dá)到最小值.梯度建模方法的應(yīng)用: 1.確定性問(wèn)題的梯度建模方法; 2.隨機(jī)性問(wèn)題的梯度建模方法; 3.隨機(jī)逼近法的應(yīng)用;24.1確定性問(wèn)題的梯度校正建模(1/6)設(shè)系統(tǒng)的輸出是參數(shù)的線性組合如果y(t)和所有的h(t)是可以準(zhǔn)確測(cè)量的,稱為確定性過(guò)程,設(shè):可以簡(jiǎn)單記為:在離散時(shí)間點(diǎn)有可以寫成:例如用差分方程描述的確定性過(guò)程可以寫成:34.1確定性問(wèn)題的梯度校正建模(2/6)很容易化為定義式其中建模的核心問(wèn)題就是如何根據(jù)數(shù)據(jù)來(lái)確定參數(shù)在k時(shí)刻的估計(jì)值,使用準(zhǔn)則函數(shù)式中解決此類問(wèn)題的方法可以用梯度校正法,也就是最速下降法。其核心就是沿著的負(fù)梯度方向不斷修正的值,直至
達(dá)到最小。4這種方法的數(shù)學(xué)表達(dá)式為:其中:R(k)稱為加權(quán)陣,是n維的對(duì)稱矩陣。表示準(zhǔn)則函數(shù)關(guān)于的梯度4.1確定性問(wèn)題的梯度校正建模(3/6)有確定性問(wèn)題的遞推公式可以寫成:5加權(quán)陣的作用是用來(lái)控制各輸入量對(duì)建模的影響程度。其基本格式為:4.1確定性問(wèn)題的梯度校正建模(4/6)只要適當(dāng)選擇,就能控制各輸入分量對(duì)參數(shù)估計(jì)值的影響。如果取表示輸入分量對(duì)參數(shù)估計(jì)值的影響弱于。如果取表示輸入分量的加權(quán)值相同,對(duì)參數(shù)估計(jì)的影響是一致的。權(quán)矩陣的選擇視具體問(wèn)題而定。6加權(quán)陣R(k)的各元素應(yīng)該滿足如下條件:4.1確定性問(wèn)題的梯度校正建模(5/6)式中為確定的上、下界。1、2、N個(gè)中至少存在一個(gè)使得或3、7加權(quán)陣R(k)的各元素應(yīng)該滿足如下條件(Cont.):4.1確定性問(wèn)題的梯度校正建模(6/6)4、與h(k)不正交則:參數(shù)估計(jì)是一致漸進(jìn)收斂的,即:條件1規(guī)定了加權(quán)值必須是大于0且為有界的實(shí)數(shù);條件2是推倒條件3的前提;條件3、條件4保證收斂的條件。條件3規(guī)定了c(k)存在一個(gè)選擇范圍,在理論上是可以證明存在最佳權(quán)矩陣,保證快速收斂。84.2隨機(jī)性問(wèn)題的梯度校正建模(1/10)梯度校正法的最大優(yōu)點(diǎn)是計(jì)算簡(jiǎn)單,但是如果輸入輸出含有噪聲,就需要對(duì)原由方法進(jìn)行修改,需要研究隨機(jī)性問(wèn)題梯度校正法。新方法也具備計(jì)算簡(jiǎn)單的特點(diǎn),可以用于在線實(shí)時(shí)辨識(shí),但要求噪聲的統(tǒng)計(jì)特性:一階矩和二階矩是已知的。設(shè)輸入輸出均含噪聲的隨機(jī)性問(wèn)題如下圖:系統(tǒng)模型參數(shù)h(k)s(k)x(k)y(k)w(k)z(k)94.2隨機(jī)性問(wèn)題的梯度校正建模(2/10)系統(tǒng)的輸出y(k)是模型參數(shù)的線性組合:觀測(cè)到的輸入輸出數(shù)據(jù)均含有測(cè)量噪聲,即:其中w(k)和s(k)為零均值的不相關(guān)隨機(jī)噪聲,且則可得到10上式中:4.2隨機(jī)性問(wèn)題的梯度校正建模(3/10)要解決的問(wèn)題就是利用輸入輸出數(shù)據(jù)x(k)和z(k)來(lái)確定參數(shù)在k時(shí)刻的估計(jì)值,使準(zhǔn)則函數(shù)式中11最終可以寫成4.2隨機(jī)性問(wèn)題的梯度校正建模(4/10)隨機(jī)性問(wèn)題的梯度校正法思想與確定性問(wèn)題是一樣的,也是用最速下降法原理,從給定的初始值出發(fā),沿著準(zhǔn)則函數(shù)的負(fù)梯度方向修正參數(shù)估計(jì)值,直到準(zhǔn)則函數(shù)達(dá)到極小值。其數(shù)學(xué)表達(dá)式可寫成:12按噪聲的特點(diǎn)可以將隨機(jī)性問(wèn)題的梯度校正法分為三類辨識(shí)問(wèn)題:4.2隨機(jī)性問(wèn)題的梯度校正建模(5/10)4.2.1第一類問(wèn)題 要求測(cè)量噪聲w(k)是統(tǒng)計(jì)獨(dú)立的系統(tǒng)參數(shù)++++-模型參數(shù)辨識(shí)算法+13從數(shù)學(xué)意義上講,第一類問(wèn)題滿足以下條件:向量h(k)與零均值的測(cè)量噪聲w(k)是統(tǒng)計(jì)獨(dú)立的,即:,w(k)的方差不必已知4.2隨機(jī)性問(wèn)題的梯度校正建模(6/10)向量h(k)的條件協(xié)方差陣是常數(shù)矩陣,且與參數(shù)估計(jì)值無(wú)關(guān),即輸入向量的測(cè)量噪聲s(k)是均值為零,協(xié)方差陣為(已知)的不相關(guān)離散隨機(jī)向量,并且與h(k)和w(k)都是統(tǒng)計(jì)獨(dú)立的,即144.2隨機(jī)性問(wèn)題的梯度校正建模(7/10)第一類隨機(jī)問(wèn)題結(jié)論:當(dāng)輸入向量不含測(cè)量噪聲時(shí),梯度校正法可以得到漸進(jìn)無(wú)偏估計(jì),即有4.2.2第二類問(wèn)題 測(cè)量噪聲w(k)中有一部分分量與h(k)是相關(guān)的。系統(tǒng)參數(shù)+++++-模型參數(shù)辨識(shí)算法動(dòng)態(tài)環(huán)節(jié)154.2隨機(jī)性問(wèn)題的梯度校正建模(8/10)其中,擾動(dòng)噪聲通過(guò)“動(dòng)態(tài)環(huán)節(jié)”與輸入向量相關(guān)。要求保證w(k)的均值為零,但其方差不必先知。從數(shù)學(xué)意義上講,第二類問(wèn)題只將第一類問(wèn)題的條件1改變?yōu)椋涸肼晈(k)可分解為測(cè)量噪聲和擾動(dòng)噪聲兩部分,即第二類問(wèn)題結(jié)論:這種問(wèn)題利用梯度校正法得到的模型參數(shù)估計(jì)值是漸進(jìn)有偏的。164.2隨機(jī)性問(wèn)題的梯度校正建模(9/10)4.2.3第三類問(wèn)題第三類問(wèn)題輸入向量h(k)不僅與噪聲w(k)相關(guān),而且與參數(shù)估計(jì)值也相關(guān),一般不研究此類辨識(shí)問(wèn)題。4.2.4梯度校正建模參數(shù)估計(jì)直接用以下遞推算法的通用式是有偏估計(jì)。對(duì)于第一類問(wèn)題,增加約束條件后可得到無(wú)偏估計(jì)的遞推算法:17梯度校正法應(yīng)用中注意的問(wèn)題:對(duì)于第二類問(wèn)題,增加約束條件后也可得到無(wú)偏估計(jì)的遞推算法:4.2隨機(jī)性問(wèn)題的梯度校正建模(10/10)1.注意選擇步長(zhǎng)間隔使輸入向量和參數(shù)估計(jì)值不相關(guān),即通過(guò)選擇步長(zhǎng)使向量和是統(tǒng)計(jì)不相關(guān)的。這是選擇步長(zhǎng)間隔的基本出發(fā)點(diǎn)。2.必須事先知道噪聲的一階和二階矩統(tǒng)計(jì)特性。3.權(quán)矩陣的選擇必須滿足一定的條件才能保證參數(shù)估計(jì)是一致收斂的,但是不能保證最快的收斂速度。18隨機(jī)逼近法是梯度校正法的一種類型,是一種頗受重視的參數(shù)估計(jì)方法。準(zhǔn)則函數(shù)的一階負(fù)梯度為:4.3隨機(jī)逼近法(1/7)考慮如下模型的辨識(shí)問(wèn)題:其中,e(k)為均值為零的噪聲。這種模型的參數(shù)辨識(shí)問(wèn)題可以通過(guò)極小化噪聲方差來(lái)實(shí)現(xiàn)。即求參數(shù)的估計(jì)值使下列準(zhǔn)則函數(shù)達(dá)到極小值:19原則上說(shuō)通過(guò)令上述負(fù)梯度值為零可以求得準(zhǔn)則函數(shù)達(dá)到最小時(shí)的參數(shù)的估計(jì)值。即4.3隨機(jī)逼近法(2/7)問(wèn)題:如果不知道噪聲的統(tǒng)計(jì)性質(zhì),上式無(wú)法求解。如果將數(shù)學(xué)期望值用平均值來(lái)代替,就變?yōu)樽钚《藛?wèn)題。4.3.1隨機(jī)逼近原理設(shè)x是標(biāo)量,y(x)是對(duì)應(yīng)的隨機(jī)變量。p(y|x)是x條件下y的概率密度函數(shù),則隨機(jī)變量y關(guān)于x的條件數(shù)學(xué)期望為:20它是x的函數(shù),又稱為回歸函數(shù)。當(dāng)函數(shù)的形式及其條件概率密度函數(shù)都不知道時(shí),很難求出上述方程的解析解。但可以通過(guò)隨機(jī)逼近法來(lái)求解。定義:隨機(jī)逼近法就是利用變量x1,x2,…及其對(duì)應(yīng)的隨機(jī)變量y(x1),y(x2),…,通過(guò)迭代計(jì)算,逐步逼近上述方程的解。4.3隨機(jī)逼近法(3/7)4.3.1隨機(jī)逼近原理(Cont.)對(duì)于給定的,設(shè)方程214.3.2Robbins-Monro算法算法遞推公式為:其中y(x(k))是對(duì)應(yīng)于x(k)的y值。為收斂因子。4.3隨機(jī)逼近法(4/7)則x(k)在均方意義下收斂于方程的解.如果收斂因子滿足下列條件:最簡(jiǎn)單的收斂因子有:224.3.2Kiefer-Wolfowitz算法Robbins-Monro算法一般用來(lái)求方程的根。Kiefer和Wolfowitz引用它來(lái)確定回歸函數(shù)h(x)的極值,可以求出回歸函數(shù)h(x)極值的迭代算法:同樣,如果收斂因子滿足Robbins-Monro算法的條件,則此算法是收斂的,即x(k)的收斂值將使h(x(k))達(dá)到極值。Kiefer-Wolfowitz算法是隨機(jī)逼近法的基礎(chǔ)。4.3隨機(jī)逼近法(5/7)234.3.3隨機(jī)逼近參數(shù)估計(jì)這樣上述模型的辨識(shí)問(wèn)題歸結(jié)成求下列方程的解利用隨機(jī)逼近原理,有4.3隨機(jī)逼近法(6/7)其中h(.)為標(biāo)量函數(shù),D表示k時(shí)刻以前的輸入輸出數(shù)據(jù)集合。顯然準(zhǔn)則函數(shù)的一階負(fù)梯度為:對(duì)于模型的參數(shù)辯識(shí)問(wèn)題,設(shè)準(zhǔn)則函數(shù)為244.3.3隨機(jī)逼近參數(shù)估計(jì)(Cont.)對(duì)于我們具體的模型辨識(shí)問(wèn)題,收斂因子滿足RobbinsMonro算法中的條件,準(zhǔn)則函數(shù)取噪聲的方差,即:4.3隨機(jī)逼近法(7/7)則可以得到用隨機(jī)逼近法解決上述模型辨識(shí)問(wèn)題的基本公式:對(duì)于用差分方程描述的系統(tǒng)模型:當(dāng)輸入、輸出及系統(tǒng)噪聲滿足一定條件時(shí),利用隨機(jī)逼近原理可得到參數(shù)估計(jì)值的隨機(jī)逼近算法:254.4參數(shù)建模的收斂性問(wèn)題(1/3)任何一種建模方法需要提供一種收斂的算法:當(dāng)觀測(cè)數(shù)據(jù)不斷增加時(shí),模型的參數(shù)估計(jì)值必須逐漸收斂于真值。建模的算法希望具有較快的收斂速度,有些算法雖然在理論上能給出嚴(yán)格的收斂證明,但無(wú)法給出收斂的速度,實(shí)際應(yīng)用中缺乏可操作性。建模算法所得到的參數(shù)有較高的精度,即參數(shù)估計(jì)偏差向量的各分量的方差都要盡可能小。264.4參數(shù)建模的收斂性問(wèn)題(2/3)常見的幾種收斂性分析方法;仿真研究方法:針對(duì)某種建模算法,以大量具體的例子,通過(guò)計(jì)算機(jī)仿真,根據(jù)仿真的結(jié)果來(lái)分析算法的收斂性。 優(yōu)點(diǎn):直觀、實(shí)用的分析方法;缺點(diǎn):仿真結(jié)果往往與仿真所用的模型及噪聲特性有關(guān),不能對(duì)算法的收斂性作普遍性結(jié)論。借助穩(wěn)定性分析的理論方法來(lái)研究建模的收斂性包括:1、ODE法(OriginaryDifferentialEquation)
推導(dǎo)出與建模辨識(shí)算法相關(guān)的伴隨微分方程,通過(guò)研究微分方程的穩(wěn)定性來(lái)判斷遞推辨識(shí)算法的收斂性。274.4參數(shù)建模的收斂性問(wèn)題(3/3) 2、鞅理論(MartingaleTheory)的應(yīng)用 通過(guò)引進(jìn)隨機(jī)Lyapunov函數(shù),然后用鞅理論分析該函數(shù)的收斂性,得到辨識(shí)參數(shù)的收斂性3、間接法 通過(guò)研究的收斂性,來(lái)間接研究算法的收斂性。即如果
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 勞動(dòng)仲裁協(xié)議申請(qǐng)書
- 2023安全生產(chǎn)工作書面協(xié)議書七篇
- 合伙合同合作協(xié)議
- 土地糾紛調(diào)解的協(xié)議書7篇
- 北京房屋出租協(xié)議模板
- 雙方自愿離婚的協(xié)議書8篇
- 舞蹈病病因介紹
- 機(jī)械基礎(chǔ) 課件 模塊八任務(wù)一 軸
- 【中職專用】中職對(duì)口高考-機(jī)電與機(jī)制類專業(yè)-核心課-模擬試卷1(河南適用)(原卷版)
- 重慶2020-2024年中考英語(yǔ)5年真題回-學(xué)生版-專題09 閱讀理解之應(yīng)用文
- 藝坊尋美-藝術(shù)實(shí)踐體驗(yàn)坊智慧樹知到答案2024年黑龍江幼兒師范高等專科學(xué)校
- 桂枝顆粒營(yíng)銷策略與品牌定位
- 2023年人教版六年級(jí)語(yǔ)文上冊(cè)期末試卷(參考答案)
- 爭(zhēng)做“四有好老師”-當(dāng)好“四個(gè)引路人”
- DB37-T 4706-2024事故車輛損失鑒定評(píng)估規(guī)范
- 人教版二年級(jí)數(shù)學(xué)上冊(cè)全冊(cè)表格式教案
- 2024-2030年中國(guó)高壓電力變壓器行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略分析報(bào)告
- 國(guó)家開放大學(xué)電大本科《工程經(jīng)濟(jì)與管理》2023-2024期末試題及答案(試卷號(hào):1141)
- 監(jiān)理項(xiàng)目管理 投標(biāo)方案(技術(shù)方案)
- 電影作品讀解智慧樹知到期末考試答案章節(jié)答案2024年西北大學(xué)
- 公務(wù)員職業(yè)道德建設(shè)和素質(zhì)能力提升培訓(xùn)課件(共37張)
評(píng)論
0/150
提交評(píng)論