巖石力學(xué)反問題呂愛鐘課件_第1頁
巖石力學(xué)反問題呂愛鐘課件_第2頁
巖石力學(xué)反問題呂愛鐘課件_第3頁
巖石力學(xué)反問題呂愛鐘課件_第4頁
巖石力學(xué)反問題呂愛鐘課件_第5頁
已閱讀5頁,還剩359頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

巖石力學(xué)反問題呂愛鐘巖石力學(xué)反問題1第一章緒論

第一節(jié)反問題第一章緒論

第一節(jié)反問題2一、反問題的內(nèi)容及特點一、反問題的內(nèi)容及特點3

固體力學(xué)的正問題是指在物體的幾何形狀、材料性質(zhì)及外荷載已知的情形下,求其物體內(nèi)部的應(yīng)力分布與變形規(guī)律。而相應(yīng)的反問題是指正問題中的某些待求量通過實地量測或人為指定變?yōu)橐阎?,而某些已知量作為待求量。固體力學(xué)的正問題是指在物體的幾何形狀、材料性質(zhì)及外荷載已4

近幾年固體力學(xué)所關(guān)心的反問題有孔形優(yōu)化問題,即已知材料性質(zhì)及外荷載,如何設(shè)計孔洞的形狀,使孔洞周邊或孔外域的二次應(yīng)力場(或位移場)滿足預(yù)先指定的要求。孔形優(yōu)化問題也是巖石力學(xué)工作者所關(guān)心的一類反問題,它可以指導(dǎo)我們?nèi)绾伍_挖巷道,使巷道在有一定工作空間的要求下處于最佳的受力狀態(tài),以利于巷道的維護。近幾年固體力學(xué)所關(guān)心的反問題有孔形優(yōu)化問題,即已知材料性5

礦山巖石力學(xué)所關(guān)心的第二類反問題是:已知巷道的開挖形狀,根據(jù)實地量測的變形規(guī)律(位移場),求其描述這個系統(tǒng)的最佳模型及模型參數(shù)(巖石的性質(zhì)參數(shù))或原始地應(yīng)力場,這類反問題稱為位移反分析。礦山巖石力學(xué)所關(guān)心的第二類反問題是:已知巷道的開挖形狀,6

在數(shù)學(xué)中我們早就接觸過反問題,例如,在初等代數(shù)學(xué)中已知方程求根若稱為正問題的話,那么由根求方程的系數(shù)就是代數(shù)方程的反問題;在矩陣論中,由矩陣求特征值也對應(yīng)著它的反問題——已知特征值反求矩陣。在數(shù)學(xué)中我們早就接觸過反問題,例如,在初等代數(shù)學(xué)中已知方7

由“結(jié)果”推斷“原因”的反問題在人類認識自然與改造自然中起到了重要的作用,例如,遙測與遙感技術(shù)是通過接收回波(反射波)信息去判斷人們感興趣的物體的形狀,地球物理勘探中的反問題就是借助于地球表面接收到的主動場或被動場的數(shù)據(jù),經(jīng)過處理判斷地層的結(jié)構(gòu)。由“結(jié)果”推斷“原因”的反問題在人類認識自然與改造自然中8

應(yīng)用反問題思想解決實際問題的例子比比皆是,例如:(1)各類案件的偵破(2)建筑質(zhì)量的判斷(3)各類設(shè)備故障原因的調(diào)查與確定(4)各類事故的調(diào)查與責(zé)任的判定(5)考古研究(6)內(nèi)科大夫看病應(yīng)用反問題思想解決實際問題的例子比比皆是,例如:9

以往在礦山巖石力學(xué)中實際上也求解了一些反問題,例如,利用應(yīng)力解除法求原始地應(yīng)力,就是通過量測應(yīng)變或位移反求荷載,平板試驗就是利用量測位移反求巖體性質(zhì)參數(shù),所采用的求解方法都為逆法,只是未被普遍認識。以往在礦山巖石力學(xué)中實際上也求解了一些反問題,例如,利用10

由“結(jié)果”推斷的“原因”可能解不唯一(多解性),即某一特定“結(jié)果”可能引起的“原因”有多種,這是反問題的一類不適定性,反問題還可能具有解的不存在性和解的不穩(wěn)定性這些特點,如果反問題的提法不正確,可能會導(dǎo)致反問題的解不存在,反問題的不穩(wěn)定性是指實測資料有一定的微小誤差時,反求出的結(jié)果產(chǎn)生很大偏差,甚至無法控制。如果反問題的解存在,唯一且穩(wěn)定,則我們稱反問題為適定的。由“結(jié)果”推斷的“原因”可能解不唯一(多解性),即某一特11

不適定問題的解法研究已成為計算數(shù)學(xué)中心問題之一,在這一領(lǐng)域中理論上作出重要貢獻的是原蘇聯(lián)學(xué)者古洪諾夫,1974年他出版了“不適定問題的解法”一書,這是有關(guān)這方面的第一本專著,美國、中國相繼翻譯成英文、中文出版。不適定問題的解法研究已成為計算數(shù)學(xué)中心問題之一,在這一領(lǐng)12二、研究巖石力學(xué)反問題的意義二、研究巖石力學(xué)反問題的意義13巷道形狀優(yōu)化設(shè)計(孔形優(yōu)化)是一項很有實際意義的工作,它可以指導(dǎo)我們?nèi)绾卧O(shè)計巷道斷面使巷道在有一定工作空間的要求下,處于容易維護的狀態(tài),達到既安全又經(jīng)濟的目的。巷道形狀優(yōu)化設(shè)計(孔形優(yōu)化)是一項很有實際意義的工作,它可14

孔形優(yōu)化是在巖石性質(zhì)參數(shù)及原始地應(yīng)力已知的條件下進行的,巖石的性質(zhì)參數(shù)及地應(yīng)力的確定是解決巖石力學(xué)問題的關(guān)鍵所在,巖石力學(xué)工作者多年來一直在專門研究這個問題,但效果并不理想。巖石性質(zhì)參數(shù)的確定一般都是在實驗室或現(xiàn)場試件進行的,試件尺寸與巷道尺寸比較仍然太小,試件不能反映實際巖體的結(jié)構(gòu),試件的受力狀態(tài)與巷道的實際受力狀態(tài)相差很大,這樣根據(jù)試件確定的巖石性質(zhì)參數(shù)對于解決實際的巖石力學(xué)問題,其結(jié)果相差很大??仔蝺?yōu)化是在巖石性質(zhì)參數(shù)及原始地應(yīng)力已知的條件下進行的,15

計算結(jié)果與實際量測結(jié)果相差很大的原因并非完全是由以上原因引起的,通常的原始地應(yīng)力測定可靠性較差或者是選擇的力學(xué)模型不正確都可以造成很大的誤差。以往求解巖石力學(xué)問題的主要特點是把力學(xué)模型的選擇、巖石性質(zhì)參數(shù)及地應(yīng)力的確定三個過程單獨進行的。現(xiàn)在,有了位移反分析我們可以直接利用實地量測的變形規(guī)律,根據(jù)選擇的力學(xué)模型同時求出巖石性質(zhì)參數(shù)及原始地應(yīng)力。計算結(jié)果與實際量測結(jié)果相差很大的原因并非完全是由16

實地量測就是一個最反映實際情況的現(xiàn)場試驗,究竟采用何種力學(xué)模型這不能憑空事先決定,而必須由實地量測的變形規(guī)律在已知的一組模型里求出與實際變形規(guī)律最接近的最佳模型,這就是模型鑒別的內(nèi)容。求出了模型(包括參數(shù))和原始地應(yīng)力,我們再按正問題去計算,預(yù)測以后開挖所表現(xiàn)的各種力學(xué)行為。實地量測就是一個最反映實際情況的現(xiàn)場試驗,究17

確定支護結(jié)構(gòu)上的荷載,這是地下結(jié)構(gòu)設(shè)計與地面結(jié)構(gòu)設(shè)計的最大不同點,對于地面結(jié)構(gòu)所承受的荷載較易確定,而地下支護結(jié)構(gòu)所承受的荷載是不能事先知道的,結(jié)構(gòu)承受的荷載取決于結(jié)構(gòu)與巖體的相互作用,它的大小及分布規(guī)律與巖體性質(zhì)、原始地應(yīng)力場、支護剛度及支護時間等多種因素有關(guān),分析結(jié)構(gòu)與巖體的相互作用,要利用巖體和結(jié)構(gòu)的力學(xué)模型,但由于目前巖體力學(xué)模型的研究尚未成熟,故根據(jù)相互作用從理論上精確給出結(jié)構(gòu)上的荷載是困難的。確定支護結(jié)構(gòu)上的荷載,這是地下結(jié)構(gòu)設(shè)計與地面18

現(xiàn)在有了位移反分析,我們可以在可靠性較高的結(jié)構(gòu)模型的基礎(chǔ)上,利用結(jié)構(gòu)上的位移量測值反求結(jié)構(gòu)上的荷載,當(dāng)結(jié)構(gòu)的力學(xué)模型正確時,反算的荷載是可信的?,F(xiàn)在有了位移反分析,我們可以在可靠性較高的結(jié)構(gòu)模型的基礎(chǔ)19長期以來,地下結(jié)構(gòu)的荷載缺乏合適的確定方法,設(shè)計主要依靠經(jīng)驗類比,從而往往導(dǎo)致安全儲備不足而破壞或者安全儲備過大而嚴(yán)重浪費。目前,位移反分析已廣泛應(yīng)用于巖體的力學(xué)性質(zhì)參數(shù)及原始地應(yīng)力的辨識。當(dāng)然,利用位移反分析也可以辨識出支架上的荷載。長期以來,地下結(jié)構(gòu)的荷載缺乏合適的確定方法,設(shè)計主20根據(jù)巖石力學(xué)的發(fā)展水平,地下結(jié)構(gòu)上荷載的確定可劃分為三個階段:第一階段(上世紀(jì)末和本世紀(jì)前半葉),沿用地面結(jié)構(gòu)的特點,地下結(jié)構(gòu)被看作僅是承受荷載的結(jié)構(gòu),荷載大小(為了區(qū)別,這里的荷載稱為主動荷載)是根據(jù)當(dāng)時的地壓假說來確定。假定地下結(jié)構(gòu)本身對作用在其上的荷載大小和分布不產(chǎn)生影響,在地壓計算中不考慮地下結(jié)構(gòu)的變形,即不考慮圍巖抗力(圍巖抗力稱為被動荷載)。比較有影響的地壓假說是冒落拱假說和壓力拱假說。根據(jù)巖石力學(xué)的發(fā)展水平,地下結(jié)構(gòu)上荷載的確定可劃21第二階段(自本世紀(jì)30年代起),與第一階段不同的是考慮在主動荷載作用下地下結(jié)構(gòu)的變形,其特點是作用在地下結(jié)構(gòu)上的荷載由主動荷載和被動荷載組成。主動荷載仍根據(jù)地壓假說確定;被動荷載是根據(jù)圍巖限制地下結(jié)構(gòu)在主動荷載作用下產(chǎn)生的變形而引起的抗力來確定。圍巖抗力通常根據(jù)熟知的文克爾(E.Winkler)假設(shè)(圍巖的彈性抗力與結(jié)構(gòu)變位成正比)計算。第二階段(自本世紀(jì)30年代起),與第一階段不同的是22第三階段(現(xiàn)代階段),不再區(qū)分主動荷載和被動荷載,地下結(jié)構(gòu)的荷載根據(jù)圍巖支架共同作用原理來確定。即,給定支架、圍巖的力學(xué)模型,通過計算圍巖對支架的作用力來確定地下結(jié)構(gòu)受到的荷載。常用的力學(xué)模型有彈性模型、彈塑性模型及粘、彈塑性模型等。第三階段(現(xiàn)代階段),不再區(qū)分主動荷載和被動23從理論上講,根據(jù)支架圍巖共同作用原理確定地下結(jié)構(gòu)的荷載是完善的。這樣獲得的荷載能夠綜合反映巖體性質(zhì)、原始地應(yīng)力、地下結(jié)構(gòu)的性質(zhì)及開挖與支護間隔時間等多種因素的影響,不僅能夠得到地下結(jié)構(gòu)的法向荷載而且能夠得到其切向荷載,克服了直接按主動荷載和被動荷載確定地下結(jié)構(gòu)荷載的不足。但是,由于巖體是地質(zhì)介質(zhì),其力學(xué)性質(zhì)具有非均質(zhì)、各向異性、流變性質(zhì)等特性,更重要的是巖體是裂隙體,即巖體中含有斷層、節(jié)理、裂隙等不連續(xù)面,因此,至今未能建立起符合實際情況的力學(xué)模型,故此,難以根據(jù)圍巖支架共同作用原理有效地確定地下結(jié)構(gòu)的荷載。從理論上講,根據(jù)支架圍巖共同作用原理確定地下結(jié)構(gòu)的24此外,人們曾通過在襯砌與圍巖之間埋設(shè)測壓元件直接量測地下結(jié)構(gòu)的荷載。由于測壓元件的剛度與圍巖的剛度不匹配,測壓元件的存在擾動了地下結(jié)構(gòu)上的荷載分布,因此,通過測壓元件量測得到的地下結(jié)構(gòu)荷載不可靠,而且該方法不能量測地下結(jié)構(gòu)的切向荷載,此外該法費用較高。此外,人們曾通過在襯砌與圍巖之間埋設(shè)測壓元件直接量25上述確定地下結(jié)構(gòu)荷載的三個階段都是沿用地面結(jié)構(gòu)設(shè)計的思路——先確定荷載,再進行結(jié)構(gòu)設(shè)計、計算。地下工程的特點是應(yīng)先求反問題再求正問題。這里的反問題指,通過量測受載后支架上某些點間的相對位移,反算支架的荷載。上述確定地下結(jié)構(gòu)荷載的三個階段都是沿用地面結(jié)26第二節(jié)系統(tǒng)辨識和參數(shù)辨識第二節(jié)系統(tǒng)辨識和參數(shù)辨識27如果把所討論的對象作為一個系統(tǒng)的話,則正問題是指已知描述系統(tǒng)的模型及輸入,求輸出,如圖1.1所示,在這種情況下,不但模型結(jié)構(gòu)是已知的,而且所有有關(guān)的參數(shù)也是已知的。而反問題是指通過量測輸出,來求系統(tǒng)的模型或模型參數(shù),有些情況下,當(dāng)模型和模型參數(shù)已知時,反問題是指由輸出求輸入。按對系統(tǒng)的了解程度,反問題可分為系統(tǒng)辨識和參數(shù)辨識兩類。如果把所討論的對象作為一個系統(tǒng)的話,則正問題是指已知描述28一、系統(tǒng)辨識一、系統(tǒng)辨識29

系統(tǒng)辨識是通過量測得到系統(tǒng)的輸出和輸入數(shù)據(jù)來確定描述這個系統(tǒng)的數(shù)學(xué)方程,即模型結(jié)構(gòu)。為了得到這個模型,我們可以用各種輸入來試探該系統(tǒng)并觀測其響應(yīng)(輸出),然后將輸入——輸出數(shù)據(jù)進行處理來得到模型。系統(tǒng)辨識是通過量測得到系統(tǒng)的輸出和輸入數(shù)據(jù)來確定描述這個30

近年來,系統(tǒng)辨識的應(yīng)用領(lǐng)域日益擴大,在通信工程、航空航天工程、地質(zhì)學(xué)、經(jīng)濟學(xué)、生物學(xué)、醫(yī)學(xué)等方面都得到應(yīng)用,各個領(lǐng)域都在利用系統(tǒng)辨識方法建立各自系統(tǒng)的定量模型,從而由定性到定量地解決實際問題,另一方面,也由于現(xiàn)代計算工具發(fā)展,使許多問題可以通過計算機加以解決,這又推動了系統(tǒng)辨識的發(fā)展。近年來,系統(tǒng)辨識的應(yīng)用領(lǐng)域日益擴大,在通信31

基于對系統(tǒng)先驗信息的了解程度,我們可以把系統(tǒng)辨識問題分為兩類:“黑箱問題”:也叫完全辨識問題,在這種情況下,被辨識的系統(tǒng)的基本特性是完全未知的。例如,系統(tǒng)是線性的還是非線性的,是動態(tài)的還是靜態(tài)的,對這些基本的信息都一無所知,要辨識這類系統(tǒng)當(dāng)然是很困難的,目前尚無有效的辦法?;趯ο到y(tǒng)先驗信息的了解程度,我們可以把系統(tǒng)辨識32

“灰箱問題”又叫不完全辨識問題,在這一類問題中,系統(tǒng)的某些基本特性(例如線性)為已知的,不能確切知道的只是系統(tǒng)方程的階次和系數(shù)。當(dāng)然,這類問題比“黑箱問題”容易處理。幸好,許多工程上的辨識問題屬于“灰箱問題”,這樣,系統(tǒng)辨識問題就簡化為模型鑒別和參數(shù)辨識問題了,參數(shù)辨識是系統(tǒng)辨識中最重要也是研究得最成熟的部分?!盎蚁鋯栴}”又叫不完全辨識問題,在這一類問題中,33二、參數(shù)辨識二、參數(shù)辨識34

參數(shù)辨識是近幾年發(fā)展較快的年輕學(xué)科,在各個領(lǐng)域都引起了重視,它的名字還沒有完全統(tǒng)一起來,參數(shù)辨識的其它名字有非線性估計(nonlinearestimation)、非線性回歸(nonlinearregression)、參數(shù)優(yōu)化(optimizationofparameters),有的文獻干脆稱為建模(modelbuilding)或系統(tǒng)辨識(identificationofsystems)?!肮烙嫛笔菙?shù)理統(tǒng)計中的術(shù)語,“辨識”是電氣工程上的術(shù)語。參數(shù)辨識是近幾年發(fā)展較快的年輕學(xué)科,在各個領(lǐng)域都35

對于礦山巖石力學(xué)問題,我們一般把易量測的位移作為系統(tǒng)的輸出,巷道及支護的形狀、尺寸作為輸入,與模型結(jié)構(gòu)有關(guān)的變形參數(shù)可作為模型參數(shù),地應(yīng)力既可以作為輸入,也可看作為待識別的參數(shù)。對于礦山巖石力學(xué)問題,我們一般把易量測的位移作為系統(tǒng)的輸36

第二章參數(shù)辨識方法

的基礎(chǔ)知識

第一節(jié)參數(shù)辨識的幾個要素第二章參數(shù)辨識方法

的基礎(chǔ)知識

第一節(jié)參數(shù)37一、模型一、模型38

在自然科學(xué)和工程領(lǐng)域中,模型的建立與實驗、觀察具有同等重要的地位,模型的建立是實驗、觀察、認識問題的一個飛躍。模型是實際系統(tǒng)“原型”的一種“類似”,它與“原型”必定存在一定的差別,任何原型都有數(shù)不清的層次和特征,能反映出原型一切特征的只能是原型本身,而不是模型。建模的目的不是將原型的一切方面都表達出來,模型只是在所要研究的主題范圍內(nèi)能表達人們最需要知道的那些特征即可,從而達到對原型的抽象,以模型為基礎(chǔ),較方便地對原型進行分析、研究,以便通過模型的預(yù)測結(jié)果來正確指導(dǎo)我們作出某種決策。在自然科學(xué)和工程領(lǐng)域中,模型的建立與實驗、觀察具有39模型的表達形式可以是概念性的、物理的或者是數(shù)學(xué)的,這取決于模型建立的特定目的。采用數(shù)學(xué)描述的形式所建立的模型我們稱為數(shù)學(xué)模型,它是系統(tǒng)中的各個物理量之間的關(guān)系所構(gòu)成的數(shù)學(xué)結(jié)構(gòu),象代數(shù)方程、微分方程等等。不言而喻,目前在巖石力學(xué)中采用的彈性模型、彈塑性模型、粘彈模型都為數(shù)學(xué)模型。模型結(jié)構(gòu)的形式有:靜態(tài)的或是動態(tài)的,線性的或是非線性的,參數(shù)是定常的或是時變的,確定型的或是隨機型的,參數(shù)模型或是非參數(shù)模型。模型的表達形式可以是概念性的、物理的或者是數(shù)學(xué)的,這取決40二、參數(shù)和狀態(tài)二、參數(shù)和狀態(tài)41由常微分或偏微分方程給出的數(shù)學(xué)模型,有時它的解是一組比較簡單的代數(shù)方程。在任何情形下,都有自變量和因變量以及一些常數(shù)。因變量有時稱為狀態(tài)變量(或信號),而常數(shù)稱為參數(shù)。由常微分或偏微分方程給出的數(shù)學(xué)模型,有時它的解是一組比較42

在實驗中,常常直接量測的是狀態(tài),而參數(shù)一般不能直接量測出來,參數(shù)只能由狀態(tài)的量測值反求出來。有的教科書所關(guān)心的是參數(shù)估計問題,而有的教科書則側(cè)重于狀態(tài)的估計(預(yù)測)。參數(shù)估計與狀態(tài)估計(預(yù)測)兩個問題非常相似,在參數(shù)估計的同時,通常狀態(tài)估計(預(yù)測)自動完成。在實驗中,常常直接量測的是狀態(tài),而參數(shù)一般不能直接量測出43

參數(shù)和狀態(tài)這兩個概念可以由下面的簡單例子說明之。例1:根據(jù)牛頓第二定律可知:ax(t)=mFx(t)這里Fx(t)是x方向的力,ax(t)是x方向的加速度,它們都是時間t的函數(shù),m是質(zhì)量。Fx(t),ax(t)我們可以看作為狀態(tài),而質(zhì)量m則是參數(shù)。力和加速度通??扇菀椎赝ㄟ^量測獲得。對此問題,質(zhì)量不但可以根據(jù)力和加速度求得,而且也可以直接量測獲得,但是對有些情況,質(zhì)量則必須根據(jù)力和加速度推算而得,例如,要確定慧星和行星的質(zhì)量就是一個例子,這時不可能直接量測而得它們的質(zhì)量。參數(shù)和狀態(tài)這兩個概念可以由下面的簡單例子說明之。44例2:以初速度v0垂直上拋一個物體,已知物體離開地面的距離s可由公式s=v0t-1/2gt2表示。這里g是重力加速度,它是一個參數(shù),時間t為自變量,s是狀態(tài)。v0既可看作為參數(shù),也可看作為狀態(tài)。例2:以初速度v0垂直上拋一個物體,已知物體離開地面的距離s45例3:一等截面拉桿,截面積為A,原長為L,它一端固定,一端受拉力P的作用(圖2.1),每個截面都產(chǎn)生x方向的位移,距原點O,x處的截面位移為u(x):

u(x)=Px/EA這里u(x)為狀態(tài),x是自變量,E、A、P為參數(shù),但A、P可直接量取獲得,E必須由狀態(tài)值求得。例3:一等截面拉桿,截面積為A,原長為L,它一端固定,一端受46

以上所舉的這些參數(shù)與統(tǒng)計參數(shù)比較,一般稱為物理參數(shù),象量測誤差的方差、相關(guān)系數(shù)這樣的參數(shù)稱為統(tǒng)計參數(shù)。物理參數(shù)和統(tǒng)計參數(shù)在某些問題中可能都要辨識,而我們最關(guān)心的是物理參數(shù)的辨識。以上所舉的這些參數(shù)與統(tǒng)計參數(shù)比較,一般稱為物理參47三、準(zhǔn)則函數(shù)三、準(zhǔn)則函數(shù)48若模型能精確地反映我們對“原型”所關(guān)心的那些特征,則模型的輸出就是系統(tǒng)的實際輸出,如果對輸出的量測值也不存在誤差,且所討論的反問題為適定的,則由量測的輸出總可列出也只能列出與待辨識參數(shù)個數(shù)相等的獨立方程,由這些方程即可唯一地求出待求的參數(shù)。若模型能精確地反映我們對“原型”所關(guān)心的那些特49

實際上,由于模型的近似性和量測誤差的存在,則按以上方法求得的參數(shù)不能很好地反映整個系統(tǒng)的特征。如何能夠求出反映整個系統(tǒng)的最優(yōu)參數(shù)呢?最直觀的做法是:量測的數(shù)量必須大大地超過待求參數(shù)的個數(shù),這樣可以降低量測噪聲對待求參數(shù)的影響,這樣列出的方程個數(shù)多于待求的參數(shù)個數(shù),所得的方程組為矛盾方程組,通過適當(dāng)?shù)淖顑?yōu)化技術(shù)可以求解這樣的問題,使得在某種意義下求得的參數(shù)為最優(yōu)參數(shù)。如何衡量最優(yōu)?最優(yōu)準(zhǔn)則如何確定?這是參數(shù)辨識首先要解決的問題。實際上,由于模型的近似性和量測誤差的存在,則按以上方法求50

我們一般把最優(yōu)化準(zhǔn)則稱為準(zhǔn)則函數(shù),記為J。準(zhǔn)則函數(shù)總體上可分為兩大類,一類是以輸出信號為基礎(chǔ)的準(zhǔn)則函數(shù),一類是以量測誤差或參數(shù)的概率統(tǒng)計性質(zhì)為基礎(chǔ)的準(zhǔn)則函數(shù),后面我們將分別稱為第一類和第二類準(zhǔn)則函數(shù)。我們一般把最優(yōu)化準(zhǔn)則稱為準(zhǔn)則函數(shù),記為J。準(zhǔn)則函數(shù)總體上51

第一類準(zhǔn)則函數(shù)一般表示為系統(tǒng)的實際輸出量測值y(t)和模型的輸出η(t)的偏差的某個函數(shù),例如,可取等一些誤差函數(shù)作為準(zhǔn)則函數(shù)。式中:n為量測數(shù)量,η(ti)是輸入和參數(shù)的函數(shù),給定模型結(jié)構(gòu)也就是知道了η(ti)的函數(shù)形式,t是自變量。對于以時間作為自變量的模型,ti表示第i時刻,對于以位置作為自變量的模型,ti表示第i個位置。y(ti)是已知的量測值,當(dāng)輸入為已知時,顯然,準(zhǔn)則函數(shù)J的大小隨著所選的模型參數(shù)不同而不同,當(dāng)J達到最小值時的參數(shù)即為最優(yōu)參數(shù)。第一類準(zhǔn)則函數(shù)一般表示為系統(tǒng)的實際輸出量測值y(52

對于第一類準(zhǔn)則函數(shù),參數(shù)辨識實際上可作為一個最優(yōu)化問題處理,即通過所選的準(zhǔn)則函數(shù)如何尋求使準(zhǔn)則函數(shù)達到極小的參數(shù)值。就此而言,準(zhǔn)則函數(shù)稱為目標(biāo)函數(shù)。根據(jù)求解的問題不同,在不同場合下J往往還有其它的名字,例如誤差函數(shù)、損失函數(shù)、成本函數(shù)等等。對于第一類準(zhǔn)則函數(shù),參數(shù)辨識實際上可作為一53以量測誤差或參數(shù)的概率統(tǒng)計性質(zhì)為基礎(chǔ)的第二類準(zhǔn)則函數(shù)的參數(shù)辨識,事先考慮了輸出信號量測誤差的統(tǒng)計特性,把待求參數(shù)作為確定性常數(shù)或隨機變量。參數(shù)的最優(yōu)并不是象第一類準(zhǔn)則函數(shù)直接以輸出的偏差最小為衡量準(zhǔn)則,而是以參數(shù)誤差(參數(shù)真值與參數(shù)估計值的差)為最小或以特定輸出量測值出現(xiàn)可能性為最大等概率統(tǒng)計特性為衡量準(zhǔn)則。

對于第二類準(zhǔn)則函數(shù),參數(shù)辨識作為估計問題處理,參數(shù)估計的具體實現(xiàn)同樣離不開最優(yōu)化技術(shù)。以量測誤差或參數(shù)的概率統(tǒng)計性質(zhì)為基礎(chǔ)的第二類準(zhǔn)則函數(shù)的參數(shù)54

兩類準(zhǔn)則函數(shù)相比,由于后者利用了一些概率統(tǒng)計知識,所以后者比前者的最大優(yōu)點是可以計算量測噪聲對參數(shù)辨識的影響程度,有時所求出的參數(shù)估計值具有較好的統(tǒng)計特性。兩類準(zhǔn)則函數(shù)相比,由于后者利用了一些概率統(tǒng)計知識,所以后55第二節(jié)參數(shù)辨識的方法分類第二節(jié)參數(shù)辨識的方法分類56參數(shù)辨識具有多種方法。根據(jù)不同的準(zhǔn)則函數(shù)可得出一系列參數(shù)辨識法,例如,以第一類準(zhǔn)則函數(shù)為基礎(chǔ)的最小二乘法、加權(quán)最小二乘法,以第二類準(zhǔn)則函數(shù)為基礎(chǔ)的最小方差法、極大似然法、貝葉斯法等等。以第一類準(zhǔn)則函數(shù)為基礎(chǔ)的各種參數(shù)辨識方法統(tǒng)稱為確定性方法,以第二類準(zhǔn)則函數(shù)為基礎(chǔ)的各種參數(shù)辨識方法統(tǒng)稱為隨機性方法。參數(shù)辨識具有多種方法。57

根據(jù)辨識的方式可分為離線辨識和在線辨識,所謂離線辨識是在全部量測數(shù)據(jù)的基礎(chǔ)上求解模型參數(shù);而在線辨識是指收集到新的量測值以后,就在前一次參數(shù)估計值的基礎(chǔ)上立刻進行遞推計算,盡快地給出新的估計值,例如,序貫最小二乘法就是一種在線辨識。準(zhǔn)則函數(shù)選定以后,參數(shù)辨識的過程是尋求準(zhǔn)則函數(shù)的極值點,對于巖土工程問題,根據(jù)問題的性質(zhì)及尋求準(zhǔn)則函數(shù)極值點的算法,參數(shù)辨識方法可分為逆法和正法兩大類。根據(jù)辨識的方式可分為離線辨識和在線辨識,所謂離線58以第一類準(zhǔn)則函數(shù)(2-1)為例說明逆法和正法。所謂逆法是指能把模型輸出表示成待求參數(shù)的顯函數(shù),由模型輸出的量測值,利用這個函數(shù)關(guān)系反求出待求參數(shù),這個過程恰好與正問題的求解過程相反,逆法由此而得名。若考慮誤差的存在,則這個方法的具體實施過程是這樣的:由(2-1)的J達到極小值的必要條件(即J關(guān)于參數(shù)的一階偏導(dǎo)數(shù)等于零)所列的方程組,求解待求參數(shù)。以第一類準(zhǔn)則函數(shù)(2-1)為例說明逆法和正法。59

逆法的應(yīng)用決定于模型輸出是否能表示成待求參數(shù)的函數(shù),以及函數(shù)關(guān)系的性質(zhì)如何?當(dāng)模型輸出是參數(shù)的線性函數(shù)時,一般才利用逆法。此時,由極值必要條件所列的以參數(shù)為未知量的方程組為線性方程組,線性方程組的求解是輕而易舉的事。逆法的應(yīng)用決定于模型輸出是否能表示成待求參數(shù)的函60

模型輸出可以是待解的微分方程組,也可以是它的解析解。若已有解析解,參數(shù)辨識就可以以解析解為出發(fā)點,這時計算量少。若無解析解則需要以待解方程組及具體問題的定解條件為出發(fā)點,在巖土工程中,這是一種普遍情形,這時要利用有限單元法等數(shù)值方法。模型輸出可以是待解的微分方程組,也可以是它61

正法與逆法不同,它不是利用極值的必要條件求出待求參數(shù),而是首先對待求參數(shù)指定“初值”,然后計算模型輸出值并和輸出量測值比較,如果吻合良好,假設(shè)的參數(shù)“初值”就是要找的參數(shù)值,實際上當(dāng)然不會這么巧,這時修改參數(shù)值,重新計算模型輸出值,重新比較一直到準(zhǔn)則函數(shù)達到極小值,此時的參數(shù)值即為所要求的參數(shù)。若模型輸出是待解的微分方程組,則由參數(shù)“初值”計算模型輸出是求解正問題,由此看出此時的參數(shù)辨識過程是解一系列正問題,正法由此而得名。正法與逆法不同,它不是利用極值的必要條件求出待求62

可以看出,正法和逆法都是尋求準(zhǔn)則函數(shù)的極小點,但尋求的算法不同。正法比逆法具有更廣泛的適用性,它既適用于模型輸出是參數(shù)的線性函數(shù)的情形,也適用于模型輸出是參數(shù)的非線性函數(shù)的情形。它的另一個優(yōu)點是仍可沿用現(xiàn)成的正問題計算方法及程序。

最優(yōu)化技術(shù)中的直接法是求解正法的有力工具,模式搜索法(Hooke-Jeeves)(也有稱步長加速法)、變量輪換法、單純形法、鮑威爾(Powell)法等方法都是最優(yōu)化技術(shù)中廣泛應(yīng)用的直接法。以上用第一類準(zhǔn)則函數(shù)說明了正法和逆法,同樣對第二類準(zhǔn)則函數(shù)也存在正法和逆法??梢钥闯?,正法和逆法都是尋求準(zhǔn)則函數(shù)的極小點,但63第三節(jié)參數(shù)辨識方法簡述第三節(jié)參數(shù)辨識方法簡述64

本節(jié)主要講述按第一、二類準(zhǔn)則函數(shù)分類的各種參數(shù)辨識方法的基本思想,而不涉及方法的本身細節(jié)。本節(jié)主要講述按第一、二類準(zhǔn)則函數(shù)分類的各種參數(shù)辨識方法的65一、觀測變量和參數(shù)之間的關(guān)系一、觀測變量和參數(shù)之間的關(guān)系66一組可觀測變量(y,x1,…,xk),一批參數(shù)(β1,…,βm)和一組隨機變量(ε,ε(1),…,ε(p))總可以假定以一定的函數(shù)關(guān)系存在。這里,我們只討論每次觀測只包含一個隨機變量的情形,即只有一個ε存在,其它的ε(1),…,ε(p)不考慮,不同次的觀測用下標(biāo)i區(qū)別,即第i次的觀測包含的隨機變量用εi表示。一組可觀測變量(y,x1,…,xk),一批參數(shù)(67

選擇一個量測變量y,并用其它量測變量x1,…,xk表示,即y=f(x1,…,xk;β1,…,βm;ε)(2-2)通常稱y為因變量,稱x1,…,xk為自變量。如果誤差ε是可加的,即y=η(x1,…,xk;β1,…,βm)+ε(2-3)那么這是很幸運的,這對于我們求解問題是方便的,在式(2-3)中,ε的分布與未知參數(shù)β1,…,βm無關(guān)。選擇一個量測變量y,并用其它量測變量x1,…,xk表68

把式(2-3)用矢量記法進行縮寫對于書寫是方便的,記

X=(x1,x2,…,xk)T則:第i次觀測通過下標(biāo)i表示,即yi=η(xi1,…,xik;β1,…,βm)+εi

=η(Xi;β)+εi=ηi+εi把式(2-3)用矢量記法進行縮寫對于書寫是方便的,記69

進行了n次量測,則有y1,…,yn,ε1,…,εn等等,為了書寫更方便,則可記Y=(y1,…,yn)T

ε=(ε1,…,εn)T(X1,…,Xn)可寫成矩陣形式,即X=[X1,…,Xn]T=進行了n次量測,則有y1,…,yn,ε1,…,εn等等70

ε的分布一般來說是未知的,如果εi(i=1,…,n)是相關(guān)的,那么以第二類準(zhǔn)則函數(shù)為基礎(chǔ)的參數(shù)辨識困難較大,本文主要討論εi(i=1,…,n)不相關(guān)的情形。ε的分布一般來說是未知的,如果εi(i=1,…,n)是相71二、線性問題二、線性問題72如果能夠把η(X;β)寫成以下形式

η(X;β)=β1x1+β2x2+…+βmxm(2-4)即在同一時刻(或同一位置),模型輸出η(X;β)是參數(shù)β的線性函數(shù),則稱式(2-4)為線性模型。對于線性模型,有

y=β1x1+β2x2+…+βmxm+ε(2-5)由式(2-5)來確定參數(shù)β的估計值,稱為線性估計。如果模型輸出η(X;β)是參數(shù)β的非線性函數(shù),則稱非線性模型,非線性模型的參數(shù)估計比線性模型的參數(shù)估計復(fù)雜。如果能夠把η(X;β)寫成以下形式73三、常規(guī)最小二乘估計

三、常規(guī)最小二乘估計

74已有一組量測值y1,…,yn則在模型結(jié)構(gòu)已知的情形下可寫出使式(2-6)達到極小值的稱為參數(shù)估計值。這個參數(shù)估計方法稱為常規(guī)最小二乘法(ordinaryleastsquaresmethod)。對于線性模型,由逆法可以求出的解析式,對于非線性模型,一般用正法求解。常規(guī)最小二乘法沒有利用ε的概率統(tǒng)計特性。已有一組量測值y1,…,yn則在模型結(jié)構(gòu)已知的情形下可寫75四、高斯—馬爾可夫估計(Gauss-markovestimation)四、高斯—馬爾可夫估計(Gauss-markovestim76如果對于不同的量測時刻(或量測位置),式(2-5)中的εi(i=1,…,n)是不相關(guān)的,但εi的方差不盡相同,若令εi相應(yīng)的方差分別為:σ12,…,σn2則可令準(zhǔn)則函數(shù)為由(2-7)極小求出的參數(shù)估計值

一般比常規(guī)最小二乘法求得的參數(shù)估計值好,這是因為量測精度越高,相應(yīng)的量測數(shù)據(jù)占的比重越大,這由式(2-7)可清楚看出(量測精度越高,誤差εi的方差σi2越小)。如果對于不同的量測時刻(或量測位置),式(2-5)中的ε77五、最大似然估計(maximumlikelihoodestimation)

五、最大似然估計(maximumlikelihoodes78如果已知εi(i=1,…,n)的聯(lián)合分布形式,那么yi(i=1,…,n)的聯(lián)合分布即可確定,此時把參數(shù)作為未知的確定性常量,則yi的聯(lián)合分布為條件分布,它可由概率密度函數(shù)p(Y/β)描述。由p(Y/β)極大求出的參數(shù)估計值稱為參數(shù)β的最大似然估計。p(Y/β)即為準(zhǔn)則函數(shù)。最大似然估計與εi(i=1,…,n)的分布有關(guān),后面我們將會發(fā)現(xiàn),如果εi是零均值同方差的獨立正態(tài)分布(高斯分布)時,最大似然估計量與常規(guī)最小二乘估計量是相同的。如果已知εi(i=1,…,n)的聯(lián)合分布形式,那么yi(79六、最大驗后估計與貝葉斯估計六、最大驗后估計與貝葉斯估計80如果隨機變量ε的分布已知(并知道ε的分布參數(shù),例如方差是已知的),待求參數(shù)β也為隨機變量,并且它的概率密度函數(shù)p(β)(稱為參數(shù)β的驗前分布)也為已知,那么根據(jù)貝葉斯定理,我們可以獲得最大驗后估計(MAPestimation,MAP是MaximumAPosterior的簡寫)和貝葉斯估計(Bayes′sestimation)。最大驗后估計量是根據(jù)驗后分布p(β/Y)取極大值的條件求得的,它是觀測值為Y的條件下,參數(shù)β的“最可能”數(shù)值。p(β/Y)即為準(zhǔn)則函數(shù)。如果隨機變量ε的分布已知(并知道ε的分布參數(shù),例如方差是已81巖石力學(xué)反問題呂愛鐘課件82

最大似然估計、最大驗后估計、貝葉斯估計與最小二乘估計、高斯—馬爾可夫估計一樣,既適合線性模型的情形,也適合非線性模型的情形,但對于非線性模型,難于直接求出概率密度函數(shù)p(Y/β)或p(β/Y),所以此時的參數(shù)估計也存在一定的困難,它們可通過線性模型的估計值經(jīng)多次迭代而求得。當(dāng)模型結(jié)構(gòu)和參數(shù)β的驗前分布滿足一定的要求時,最大似然估計量、最大驗后估計量、貝葉斯估計量與最小二乘估計量、高斯—馬爾可夫估計量是相同的。最大似然估計、最大驗后估計、貝葉斯估計與最小二乘83第四節(jié)參數(shù)估計量的統(tǒng)計特性第四節(jié)參數(shù)估計量的統(tǒng)計特性84上節(jié)介紹的各種參數(shù)辨識方法,一種情形是事先把參數(shù)作為確定性的量,一種情形是事先把參數(shù)作為隨機變量。而兩種情形求出的參數(shù)估計量都是隨機變量,后種情形是顯然的。前種情形也不難理解,由n次量測可求出參數(shù)估計值,由于量測誤差的存在,所求出的估計值不可能是參數(shù)真值,如果另取一組n個量測值去求參數(shù),由于誤差的隨機性,則得到的和上次不同,所以說,盡管參數(shù)β本身不是隨機變量,但是這樣求出的估計量卻總是隨機變量。估計量是隨機變量,必須從統(tǒng)計的觀點分析,衡量估計量的優(yōu)劣,無偏性、有效性和一致性是鑒別和比較估計量好壞的重要標(biāo)準(zhǔn)。上節(jié)介紹的各種參數(shù)辨識方法,一種情形是事先把參數(shù)作85一、無偏性一、無偏性86我們總是希望未知參數(shù)β與它的估計值在某種意義上最接近,當(dāng)然作為某一次的估計值它與真值可能是不同的,然而,如果通過一系列試驗求出的不同估計值,我們很自然地要求這些估計值的平均值與未知參數(shù)的真值相等,這就是說,要求參數(shù)β的估計量的數(shù)學(xué)期望(也有稱數(shù)學(xué)期望為均值)等于參數(shù)的真值β,即如果關(guān)系式E()=β成立,那么我們稱滿足這種要求的估計量為參數(shù)β的無偏估計量。估計量的無偏性意味著無論重復(fù)多少次量測,要求估計值能在被估計參數(shù)的真值附近擺動,而其平均值就等于參數(shù)真值。我們總是希望未知參數(shù)β與它的估計值在某種意義上最接近,87二、有效性二、有效性88無偏性還不能完全決定估計量的性質(zhì),對于一個估計量,還需要進一步考慮到估計值和參數(shù)真值的平均偏離的大小,或者說估計值圍繞真值擺動幅度的大小問題,方差能夠反映估計值的這種離散程度,一個估計量的方差愈小,這個估計量取得接近它的數(shù)學(xué)期望的值就愈頻繁,或者說未知參數(shù)的估計值處在它的真值附近的概率愈大。用不同估計方法得到的各種無偏估計中,某估計量的方差達到最小,則稱該估計量為參數(shù)的有效估計。在參數(shù)β的所有無偏估計量中,可能存在一個方差最小的估計量,這個估計量叫做佳效估計量。無偏性還不能完全決定估計量的性質(zhì),對于一個估計量,89三、一致性三、一致性90一個估計量,不論它是無偏的還是有偏的,也不論它的方差大小如何,我們總是希望當(dāng)量測次數(shù)增加時,對未知參數(shù)β的估計值會愈來愈精確?;蛘哒f,估計值會越來越靠近參數(shù)的真值。因此提出了估計量的一致性要求,按照數(shù)學(xué)定義,如果隨著量測次數(shù)n增加,依概率收斂于β,則稱為β的一致估計。一致性也有這樣定義的:估計差-β的協(xié)方差矩陣cov[-β]作為估計值對真值的平均偏離程度的量度,若為無偏估計,則cov[-β]=E[(-β)(-β)T]。如果滿足則就是β的一致估計,也有稱是相容估計量。一個估計量,不論它是無偏的還是有偏的,也不論它的方差大小如91第三章簡單線性模型

的參數(shù)辨識第一節(jié)引言第三章簡單線性模型

的參數(shù)辨識第一節(jié)引92處理問題都是從簡單到復(fù)雜,參數(shù)辨識也是一樣,本章研究2個簡單的線性代數(shù)模型的參數(shù)辨識問題,通過這些簡單線性代數(shù)模型的討論可以引出許多參數(shù)辨識有關(guān)的概念,對于非線性代數(shù)模型或者由微分方程表示的模型的參數(shù)辨識,在概念理解上沒有增加任何復(fù)雜性。簡單的代數(shù)模型除有利于教學(xué)外,實際上,在許多問題中也得到了廣泛的應(yīng)用。簡單的代數(shù)模型也稱為回歸函數(shù)。本章只討論以下兩個模型:模型1ηi=β1xi

(3-1)模型2ηi=β1xi1+β2xi2

(3-2)變量η稱為因變量,xi,xi1,xi2稱為自變量,它可以表示時間、位置、溫度等等。在這些模型中,自變量xi也可以是時間t(或位置等)的各種函數(shù),或者是它們的某些組合。處理問題都是從簡單到復(fù)雜,參數(shù)辨識也是一樣,本章93在這些模型中,自變量xi也可以是時間t(或位置等)的各種函數(shù),或者是它們的某些組合。本章討論的誤差一般假定是可加的,例如,對于模型1有:

yi=β1xi+εi

(3-3)這里εi是未知誤差,yi是在xi時(處)的量測值。式(3-3)給出的模型可以表示下列兩種情形:誤差模型A,誤差在量測中產(chǎn)生,即

ηi=β1xiyi=ηi+εi

(3-4)誤差模型B,誤差(噪聲)在過程中,即

ηi=β1xi+εiyi=ηi

(3-5)這里ηi表示要量測的量,yi表示它的量測值。在這些模型中,自變量xi也可以是時間t(或位置等)94必須注意,在這些模型中有這樣的假定:在xi中沒有誤差,即xi不是一個隨機變量,而只有yi和εi是隨機變量,在模型B中,ηi同樣也是一個隨機變量。在誤差模型A中,只存在量測誤差,而在ηi中不存在誤差,為了確定εi,我們可以研究量測裝置的誤差特性,量測裝置越精確,這些誤差越小,隨著技術(shù)不斷改進,誤差會愈來越小,系統(tǒng)模型本身假定是無誤差的(無噪聲的)是指對物理現(xiàn)象有充分的了解,以致于沒有隨機噪聲參入ηi。必須注意,在這些模型中有這樣的假定:在xi中沒有95在誤差模型B中,量測假定是無誤差的,但模型(η)含有誤差,誤差是由某些隨機性引起的,實際上,誤差也可能是由于模型本身的近似性引起的。誤差模型A和B分別表示了誤差存在于量測中和模型中,實際上誤差可以同時存在于量測和模型中。無論是誤差模型A正確還是誤差模型B正確,對于本章討論的模型,參數(shù)辨識形式上是相同的,我們將把模型A作為本章討論的模型。在誤差模型B中,量測假定是無誤差的,但模型(η)含96第二節(jié)常規(guī)最小二乘估計(簡稱OLS估計)第二節(jié)常規(guī)最小二乘估計(簡稱OLS估計)97常規(guī)最小二乘估計的準(zhǔn)則函數(shù)由式(2-6)已經(jīng)給出,即式中ηi是參數(shù)的函數(shù),n表示n次量測,量測次數(shù)必須大于待求參數(shù)的個數(shù)。使(3-6)達到極小的參數(shù)值便為常規(guī)最小二乘估計量。常規(guī)最小二乘法的最早應(yīng)用可以追溯到大約1795年,那時高斯為了完成行星軌道預(yù)測工作首先開創(chuàng)了此法,以后這種方法成為參數(shù)辨識的主要工具,雖然目前有其它幾種方法可利用,例如,最大似然法、貝葉斯法等等,但最小二乘法仍然是工程師和科學(xué)家最熟悉的方法,這方法之所以普及,是因為它比其它方法容易理解,并且在獲得參數(shù)估計量時不需要任何統(tǒng)計假設(shè)。但獲得了參數(shù)估計量后,為了討論估計量的統(tǒng)計特性,這時量測誤差的統(tǒng)計信息必須給出。常規(guī)最小二乘估計的準(zhǔn)則函數(shù)由式(2-6)已經(jīng)給出98巖石力學(xué)反問題呂愛鐘課件99由xi時(處)的量測值yi,我們求得了參數(shù)估計值,在xi處模型輸出的估計值我們可以根據(jù)模型求出,此時模型中的參數(shù)用估計值代替。用yi*表示xi處的估計值,則估計值為yi*=β1*

xi

(3-10)設(shè)xi處的量測值yi減去估計值yi的差為ei,則ei=yi-yi*

(3-11)ei稱為殘差,注意ei不等于誤差εi,但ei能夠用來估計εi。由xi時(處)的量測值yi,我們求得了參數(shù)估計值,在100(一)估計量的均值和方差若誤差εi是可加的,有零均值,且β1不是隨機變量,由此我們可以求得模型1的參數(shù)估計值β1*的均值為

E(β1*)=(∑xi2)-1∑xiE(yi)=(∑xi2)-1∑xiβ1xi=β1因此,在以上所述的假設(shè)下,最小二乘估計β1*是無偏估計。若再假定誤差εi是互不相關(guān)的且具有相同的方差,則可求得β1*的方差為

V(β1*)=(∑xi2)-2∑xi2σ2=σ2(∑xi2)-1

(3-12)從(3-12)可以看出:量測次數(shù)越多,估計量的方差越小,當(dāng)xi滿足一定的取值要求時,有

,這說明β1*是一致估計量。隨著量測次數(shù)的增多,估計精度越來越高,這自然要求量測誤差滿足以上的假定,例如,量測是相關(guān)的,則以上結(jié)論不一定成立。同樣必須注意,對于該模型有一個優(yōu)化的量測位置,當(dāng)量測位置(時刻)取在xi值較大處時,估計值的方差(3-12)越小,這樣(3-12)給我們提供了最優(yōu)量測位置,根據(jù)估計值方差安排量測位置,這是優(yōu)化實驗設(shè)計的內(nèi)容。(一)估計量的均值和方差101(二)例題軸對稱圓形巷道徑向位移計算公式為此式是按平面應(yīng)變條件求得的,式中μ為圍巖的泊松比,E為圍巖的彈性模量,R0為巷道半徑,P0為原始地應(yīng)力,r為圍巖內(nèi)任一點距巷道中心的距離。現(xiàn)假設(shè)ri處的徑向位移uri量測值為yi,圍巖的彈性模量和泊松比是已知的,根據(jù)yi使用常規(guī)最小二乘法確定原始地應(yīng)力P0的估計值P0*。(二)例題102(3-23)表示的模型,在E、μ、R0已知的情況下,符合模型1的情形,即β1=P0,xi=(1+μ)R02/(Eri),則直接利用(3-9)可得P0*的方差可由(3-12)得到由此可以看出,ri越小,V(P0*)越小,即量測點越靠近巷道周邊估計值P0*的方差越小,從而估計精度越高;反之,ri越大,V(P0*)越大,即量測點越遠離巷道,估計值P0*的方差越大,從而估計精度越差。(3-23)表示的模型,在E、μ、R0已知的情況下,103第三節(jié)最大似然估計(maximumlikelihoodEstimation)第三節(jié)最大似然估計(maximumlikelihood104最大似然估計在估計理論中是一個很老的估計方法,1906年弗希爾(R.A.Fisher)首先使用了這個方法。為了方便,我們把最大似然估計簡記為ML估計。ML估計是在量測誤差分布已知的情形下的參數(shù)估計,它利用了有關(guān)量測的所有信息。ML估計的前提條件為:誤差是可加的,即yi=η(Xi;β)+εi;式中的誤差εi(i=1,…,n)是相互獨立的正態(tài)分布,且有零均值和已知方差σi2;參數(shù)β是確定性的量,即不是隨機變量。因ε1,…,εn是n個隨機變量,則由以上的假定知:y1,…,yn也是n個隨機變量。一次試驗所獲得的n次量測只是n個隨機變量的樣本值y1,…,yn,這里隨機變量和樣本使用同一符號yi(i=1,…,n)。最大似然估計在估計理論中是一個很老的估計方法,1906年弗105

量測值yi是隨機變量是指在同樣的條件下,重復(fù)量測所得的各次量測值也會各不相同。這意味著同一觀測者使用相同的儀器,如果試驗是可重復(fù)的,那么在同一時刻(或位置)的量測值也可能是不會相同的,這主要是偶然誤差引起的,例如,觀測者本身感官分辨本領(lǐng)的限制,就是偶然誤差的一個來源。

為了辨識參數(shù),對系統(tǒng)輸出進行了n次量測yi(i=1,…,n),因εi(i=1,…,n)是相互獨立的,則這n次量測是相互獨立的,每個yi的概率密度函數(shù)可由εi的概率密度函數(shù)確定,yi(i=1,…,n)的聯(lián)合概率密度函數(shù)稱為樣本的似然函數(shù)。因yi(i=1,…,n)是相互獨立的,則樣本的似然函數(shù)為每個yi的概率密度之積,即量測值yi是隨機變量是指在同樣的條件下,重復(fù)量測所得的各次106對于一組給定的量測值y1,…,yn,似然函數(shù)(3-34)只是未知參數(shù)β的函數(shù),選擇使似然函數(shù)取得最大值的參數(shù)β*作為參數(shù)的估計值,這是很自然的一種選取估計值的辦法,稱β*為β的最大似然估計,即ML估計。(3-34)表示的似然函數(shù)即為ML估計的準(zhǔn)則函數(shù),使準(zhǔn)則函數(shù)達到最大的似然估計β*應(yīng)當(dāng)是方程的解。由于似然函數(shù)L是多個因子的乘積,利用對數(shù)lnL進行計算比較方便(lnL是單調(diào)函數(shù),并且當(dāng)L為最大時,lnL也為最大,所以這樣做是可行的),所以通常解似然方程以求得ML估計β*。對于一組給定的量測值y1,…,yn,似然函數(shù)(3-34)只107由ML估計的前提條件可知εi的概率密度函數(shù)為

在yi=η(Xi;β)+εi中,εi的概率密度函數(shù)已知,η(Xi;β)是非隨機的確定性量,則可以求出yi的概率密度函數(shù)為這樣似然函數(shù)可根據(jù)式(3-36)寫出由ML估計的前提條件可知εi的概率密度函數(shù)為108式(3-37)兩邊取對數(shù),可得式(3-37)兩邊取對數(shù),可得109巖石力學(xué)反問題呂愛鐘課件110第四節(jié)最大驗后估計(貝葉斯估計)第四節(jié)最大驗后估計(貝葉斯估計)111在最大似然估計中,利用了有關(guān)量測的所有信息,認為誤差是可加的,誤差εi(i=1,…,n)是相互獨立的正態(tài)分布,且有零均值和已知方差,事先把參數(shù)β作為是確定性的量。而在本節(jié)討論的最大驗后估計中,除把參數(shù)作為隨機變量外,其它假設(shè)條件與最大似然估計相同。在以上假設(shè)條件下,同樣可求出yi(i=1,…,n)的聯(lián)合概率密度函數(shù)p(y1,…,yn/β),在求p(y1,…,yn/β)的時候把β作為常量,這時求得的p(y1,…,yn/β)與最大似然估計中求得的p(y1,…,yn/β)完全相同。在最大驗后估計中,只知道p(y1,…,yn/β)還不夠,還必須知道參數(shù)β的概率密度函數(shù)p(β),p(β)稱為驗前分布,這里我們假定p(β)是已知均值和方差的正態(tài)分布。在最大似然估計中,利用了有關(guān)量測的所有信息,認為誤差112

在p(Y/β)[p(Y/β)是p(y1,…,yn/β)的簡寫]和p(β)已知的情形下,貝葉斯給出了驗后概率密度函數(shù)p(β/Y),p(β/Y)表示當(dāng)量測結(jié)果恰好為某一組特定值的條件下,參數(shù)β的概率分布,即使式(3-49)達到極大值的β*稱為最大驗后估計,簡記為MAP估計,因MAP估計是以貝葉斯公式(3-49)為基礎(chǔ)的,所以也有稱MAP估計為貝葉斯估計(Bayes′sestimation)。在p(Y/β)[p(Y/β)是p(y1,…,yn/β113式(3-49)給出的驗后概率密度函數(shù)為貝葉斯估計的準(zhǔn)則函數(shù),它比ML估計的準(zhǔn)則函數(shù)(似然函數(shù))多了兩項p(β),p(Y),并且p(Y/β)和p(β)是相乘的,不言而喻通過式(3-49)求MAP估計比ML估計要復(fù)雜。本節(jié)我們只討論模型1:ηi=β1xi,在此β1是隨機變量,貝葉斯估計除上面已給的假設(shè)條件外,還有一條假設(shè),即β1與εi(i=1,…,n)相互獨立,由此可以得到β1與εi不相關(guān),由獨立性可以推出不相關(guān)性,但是反過來不一定成立,不過當(dāng)β1和εi都為正態(tài)分布時,獨立性與不相關(guān)性卻是一致的。式(3-49)給出的驗后概率密度函數(shù)為貝葉斯估計的114因p(β1)為正態(tài)概率分布,有E(β1)=μβ,V(β1)=Vβ,p(εi)也為正態(tài)概率分布,并有E(εi)=0,V(εi)=σi2,所以由yi=β1xi+εi知,在β1和εi互相獨立的條件下,yi也服從正態(tài)分布,這可由數(shù)理統(tǒng)計中已知的定理得證。定理:若ξ1和ξ2是兩個互相獨立的正態(tài)變量,其概率密度函數(shù)分別為N(ξ1,μ1,σ12)和N(ξ2,μ2,σ22),則隨機變量ξ=ξ1+ξ2也服從正態(tài)分布,其均值及方差分別為ξ1和ξ2的均值及方差之和,即ξ=ξ1+ξ2~N(ξ,μ1+μ2,σ12+σ22)在此不給出定理的證明,這里我們利用了N()表示概率密度函數(shù)。因p(β1)為正態(tài)概率分布,有E(β1)=μβ,V(β1)115對于我們的問題yi=β1xi+εi,這與ξ=ξ1+ξ2的形式大體相同,稍有不同的是,β1xi項為一隨機變量β1與一確定性量xi之積。我們知道,β1的概率密度函數(shù)已知,則可求出β1xi的概率密度函數(shù)為p(β1xi)=1/|xi|p(β1/xi),式中p(β1/xi)與p(β1)的形式完全相同,不同的是把p(β1)中的β1換為β1/xi,這說明p(β1/xi)與p(β1)為同分布,即都為正態(tài)分布,但分布的均值和方差不同。由此證明了yi也服從正態(tài)分布。對于我們的問題yi=β1xi+εi,這與ξ=ξ116因即p(β1xi)的均值和方差分別為μβxi和Vβxi2,這個結(jié)果實際可以更方便地求出為:E(β1xi)=xiE(β1)=xiμβV(β1xi)=xiV(β1)=xi2Vβ這樣yi的均值和方差可根據(jù)定理和已知條件求得

E(yi)=E(β1xi)+E(εi)=xiμβ+0=xiμβV(yi)=V(β1xi+εi)=V(β1xi)+V(εi)=xi2Vβ+σi2因117由此可以寫出yi的概率密度函數(shù)則yi的聯(lián)合概率密度函數(shù)為式(3-49)中的p(Y/β)在式(3-37)中已經(jīng)給出,將ηi=β1xi代入,則由此可以寫出yi的概率密度函數(shù)118驗后概率密度函數(shù)p(β/Y)即為式(3-54)與式(3-50)之積并除以式(3-53)。因式(3-53)中不含有參數(shù)β1,故在求使p(β/Y)達到極大值的β1*時,可去掉p(Y)。這樣準(zhǔn)則函數(shù)變?yōu)槭?3-54)與式(3-50)之積,即在上式兩邊取對數(shù)得驗后概率密度函數(shù)p(β/Y)即為式(3-54)與式(119巖石力學(xué)反問題呂愛鐘課件120因所以β1*為β1的無偏估計,這與以前定義的無偏估計稍有不同,那時無偏估計的條件是:E(β1*)=β1,β1是確定性量。對于貝葉斯估計,β1是隨機變量,所以按E(β1*)=E(β1)定義無偏估計是合理的。因121巖石力學(xué)反問題呂愛鐘課件122在推導(dǎo)(3-61)的過程中,利用了V(-β1)=V(β1),對于OLS估計和ML估計,若也求β1*-β1的方差,則因β1為確定性量,故V(β1*-β1)=V(β1),即β1*的方差與估計誤差的方差相同。由式(3-61)可以看出:量測次數(shù)越多,越大,則V(β1*-β1)越小,這說明量測次數(shù)越多,估計的精度越高。另外,量測次數(shù)越多,參數(shù)β1的先驗信息Vβ-1對式(3-61)的影響相對削弱。在推導(dǎo)(3-61)的過程中,利用了V(-β1)=V(123將式(3-61)和式(3-44)比較可知,貝葉斯估計的誤差方差總小于ML估計的誤差方差,就此而言,貝葉斯估計優(yōu)于ML估計。從式(3-59)可以看了,若Vβ=∞,那么可得式(3-62)表示的估計量β1與式(3-43)表示的估計量完全相同。Vβ=∞表明我們對參數(shù)β1的驗前信息毫無了解,這是貝葉斯估計(MAP估計)的一種特殊情形,此時參數(shù)估計值與ML估計值完全相同,不言而喻,當(dāng)σi2=σ2時,此時的貝葉斯估計與常規(guī)最小二乘估計也是相同的。將式(3-61)和式(3-44)比較可知,貝葉斯估計的誤差124第四章線性模型參數(shù)辨識

的矩陣方法

及非線性模型參數(shù)辨識方法

的最優(yōu)化方法第四章線性模型參數(shù)辨識

的矩陣方法

及非線性模型參125第三章討論的線性模型參數(shù)辨識是在模型參數(shù)不多于兩個(而本次課討論了只有一個模型參數(shù))的情形下進行的。對于許多問題,模型的參數(shù)往往多于兩個,這時根據(jù)第三章求解問題的思路當(dāng)然也可以得到這種情形的解,但得到的解沒有一般性,有了矩陣的知識,我們可以把各種各樣的線性模型,歸結(jié)為一個用矩陣表示的通用式子,這樣可以有效地進行參數(shù)辨識,使運算符號更緊湊,運算起來更方便,適用性更強。第三章討論的線性模型參數(shù)辨識是在模型參數(shù)不多于兩個(而本126

在此有必要再強調(diào)一下什么是線性模型?所謂線性模型是指模型輸出是參數(shù)的線性函數(shù),這有別于固體力學(xué)中所提的線性問題,若把位移作為模型輸出,則位移可以是彈性模量和泊松比的非線性函數(shù),這時,在固體力學(xué)中雖是線性問題,但在參數(shù)辨識中就是非線性問題。本章前三節(jié)用矩陣方法討論與第三章相應(yīng)的各種參數(shù)估計方法,為了討論方便起見,附錄A給出了矩陣的有關(guān)基本知識,以便于后面各節(jié)的使用。在此有必要再強調(diào)一下什么是線性模型?所謂線性模型是指模型127一、線性模型的矩陣表示一、線性模型的矩陣表示128用矩陣表示的線性模型比用代數(shù)符號表示的線性模型一般性強,用矩陣表示的線性模型的一般式為

η=Xβη表示模型輸出,β表示參數(shù)矢量,它是一個m維的列矩陣,若對η量測n次,則η可記為n維列矩陣,由上式可以看出,此時X必為一n×m的矩陣,我們稱X為靈敏矩陣,這是因為它是η關(guān)于參數(shù)的導(dǎo)數(shù)。η,X和β的矩陣表示為此式包括了第三章討論的所有模型。用矩陣表示的線性模型比用代數(shù)符號表示的線性模型一般性強,用129二、常規(guī)最小二乘法二、常規(guī)最小二乘法130

對于線性模型η=Xβ,常規(guī)最小二乘法的準(zhǔn)則函數(shù)為J=(Y-Xβ)T(Y-Xβ)(4-1)顯然,準(zhǔn)則函數(shù)J的值,隨著所選的參數(shù)的不同而不同,使J為最小的β*,應(yīng)該是β的最好估計。當(dāng)XTX為非奇異陣,可解得β*為

β*=(XTX)-1XTY

(4-4)式(4-4)這個結(jié)果稱為參數(shù)的最小二乘估計量,由式(4-4)可以看出,估計量β*是量測值Y的線性函數(shù)。也有稱這樣的估計為線性估計??梢宰C明估計量式(4-4)是無偏、有效估計,只有特定的某些X,才是一致估計。對于線性模型η=Xβ,常規(guī)最小二乘法的準(zhǔn)則函數(shù)為131三、加權(quán)最小二乘法三、加權(quán)最小二乘法132一般地說,由于量測往往是在不同條件(時刻或位置,儀器精度、環(huán)境)下進行的,這些量測所得的數(shù)據(jù)對于參數(shù)估計,有的“價值”大,有的“價值”小,在利用這些數(shù)據(jù)來估計時,往往希望“價值”大的數(shù)據(jù)占有較大的比重,使其對估計結(jié)果產(chǎn)生較多的影響,我們就用一個數(shù)值來表示量測的“信任程度”,這就稱之為“權(quán)”,引入“權(quán)”這個概念以后,最小二乘法就進一步推廣為加權(quán)最小二乘法。它與上述的常規(guī)最小二乘法的不同點是在準(zhǔn)則函數(shù)(4-1)中乘上一個權(quán)矩陣,即

J=(Y-Xβ)TW(Y-Xβ)(4-25)這里W限于對稱正定矩陣。顯然,準(zhǔn)則函數(shù)J的值,除了隨著β的不同而不同外,它也隨著所選權(quán)的不同而不同,即當(dāng)J(β*)=minJ(β)時,所求的參數(shù)估計值β*也與權(quán)有關(guān)。當(dāng)權(quán)矩陣W取為ψ-1時加權(quán)最小二乘估計就變?yōu)楦咚埂R爾可夫估計()。一般地說,由于量測往往是在不同條件(時刻或位置,儀器精度、133可求得加權(quán)最小二乘估計量為

β*=(XTWX)-1XTWY(4-26)為了唯一地求出β*,XTWX必須為非奇異矩陣。由式(4-26)可以看出,當(dāng)權(quán)矩陣為單位矩陣In時,則表示不同時刻(或不同位置)的量測數(shù)據(jù)一樣好,此時的加權(quán)最小二乘估計就是常規(guī)最小二乘估計,因此常規(guī)最小二乘法只是加權(quán)最小二乘法的一種特殊情形。如何選擇權(quán),對這個問題并沒有普遍適用的規(guī)律,需要根據(jù)實際量測情況選取權(quán)的形式。一般來說,權(quán)的形式通常根據(jù)各次量測的精度來選擇??汕蟮眉訖?quán)最小二乘估計量為134四、最大似然估計四、最大似然估計135與式(3-37)類似,這里取似然函數(shù)為將線性模型η=Xβ代入(4-31)得由此看出,這是加權(quán)最小二乘法中準(zhǔn)則函數(shù)(4-25)的特例。故最大似然估計可以直接由(4-26)寫出

當(dāng)量測誤差不相關(guān),且有相同的方差σ2時,ψ=σ2In,則由式(4-36)可得

β*=(XTX)-1XTY這與常規(guī)最小二乘法的估計值完全相同。與式(3-37)類似,這里取似然函數(shù)為136五、最大驗后估計(貝葉斯估計)

五、最大驗后估計(貝葉斯估計)

137由第三章第四節(jié)知,最大驗后估計也叫貝葉斯估計,這種估計不但要利用量測誤差的統(tǒng)計特性,而且也要利用參數(shù)的統(tǒng)計特性,與最大似然估計的不同點是:貝葉斯估計事先把參數(shù)作為隨機變量。而其它假設(shè)條件與最大似然估計完全相同,且認為參數(shù)也是正態(tài)分布,本節(jié)我們?nèi)杂懻摼€性模型,這樣有

Y=Xβ+ε,ε~N(0,ψ)(4-43ab)

β~N(μβ,Vβ),cov(β,ε)=0(4-43cd)這里ψ,μβ,Vβ都是已知矩陣,若有n次量測yi(i=1,…,n),m個參數(shù)要辨識,則ψ是n×n的對稱陣;μβ是m×1的列矩陣,它由每個參數(shù)的均值組成,Vβ是m×m的方陣,它是參數(shù)的協(xié)方差矩陣。(4-43d)表明β和ε是不相關(guān)的。由第三章第四節(jié)知,最大驗后估計也叫貝葉斯估計,這種估計不但138巖石力學(xué)反問題呂愛鐘課件139由式(4-37)可知,最大似然估計誤差的協(xié)方差為cov(β-β*)=cov(β*)=(XTψ-1X)-1與式(4-57)比較,顯然有(Vβ-1+XTψ-1X)-1<(XTψ-1X)-1所以貝葉斯估計的誤差小于最大似然估計的誤差,就此而言,貝葉斯估計比最大似然估計好。由式(4-37)可知,最大似然估計誤差的協(xié)方差為140六、各種估計的關(guān)系六、各種估計的關(guān)系141

由以上幾節(jié)我們可以看出:貝葉斯估計是各種估計的最一般情形,它包括了最大似然估計和常規(guī)最小二乘估計,而最大似然估計又是常規(guī)最小二乘估計的一般情形,但它是加權(quán)最小二乘估計的特殊情形,所以加權(quán)最小二乘估計是最大似然估計和常規(guī)最小二乘估計的一般情形。討論的幾種估計,只有貝葉斯估計事先把參數(shù)作為隨機變量,當(dāng)對參數(shù)的統(tǒng)計特性一無所知(Vβ=∞Im)時,貝葉斯估計退化為最大似然估計。當(dāng)量測誤差不相關(guān)且有相同的方差時,最大似然估計又退化為常規(guī)最小二乘估計。當(dāng)權(quán)矩陣取為ψ-1時,加權(quán)最小二乘估計與最大似然估計相同,當(dāng)權(quán)矩陣取為單位陣時,加權(quán)最小二乘估計又與常規(guī)最小二乘估計完全相同,所以Vβ=∞Im時的貝葉斯估計與權(quán)矩陣為ψ-1時的加權(quán)最小二乘估計完全相同。從參數(shù)估計值的統(tǒng)計特性來看:討論的幾種估計都為無偏估計。從估計誤差的協(xié)方差可知,貝葉斯估計的參數(shù)估計誤差最小,就此而言,貝葉斯估計是最優(yōu)估計。本章前三節(jié)僅限于線性模型η=Xβ的討論,求解參數(shù)的方法都為逆法,所得結(jié)果都能表示成解析式。由以上幾節(jié)我們可以看出:貝葉斯估計是各種估計142七、非線性模型的參數(shù)辨識及最優(yōu)化方法七、非線性模型的參數(shù)辨識及最優(yōu)化方法143所謂非線性模型是指模型輸出η是參數(shù)β的非線性函數(shù)。前面討論了線性模型的參數(shù)辨識,無論是以第一類準(zhǔn)則函數(shù)為基礎(chǔ)的確定性方法,還是以第二類準(zhǔn)則函數(shù)為基礎(chǔ)的隨機性方法,都是根據(jù)準(zhǔn)則函數(shù)達到極值的必要條件所列的線性方程組,解出待求參數(shù),所用方法都歸結(jié)為逆法。對于非線性模型,我們是否能沿用這種逆法求解待求參數(shù)呢?答案是一般不能。以模型輸出有解析解的簡單情形為例,此時模型輸出能表示成參數(shù)的非線性函數(shù),以準(zhǔn)則函數(shù)的極值必要條件列出的方程組為非線性方程組,非線性方程組的求解比線性方程組復(fù)雜得多,只有少數(shù)情形下才能求出非線性方程組的解析解。這是模型輸出有解析解的情形,對于實際中的很多問題,模型輸出是待解的微分方程組,我們能求出的解析解是很有限的,若無解析表達式,我們必須用有限元等數(shù)值方法列出模型輸出和參數(shù)之

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論