統(tǒng)計假設檢驗_第1頁
統(tǒng)計假設檢驗_第2頁
統(tǒng)計假設檢驗_第3頁
統(tǒng)計假設檢驗_第4頁
統(tǒng)計假設檢驗_第5頁
已閱讀5頁,還剩117頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第一章測量平差總論

§1-1測量平差的基本概念

一、測量平差問題

測量誤差,也稱觀測誤差,是待觀測量的真值與其觀測值之差。觀測只是指

用一定的儀器、工具、傳感器或其他手段獲取反映地球及其他實體與空間分布有

關信息的過程和數(shù)據(jù)。不論觀測條件如何,測量誤差總是不可避免的。

多余觀測,為了確定一定的幾何模型,并不需要知道該模型中所有元素大小,

而只需要知道其中必要的部分元素的大小就行了。例如確定一個平面三角形的形

狀,只需要知道其中任意二個內角的大小。這二個內角觀測值就稱為必要觀測。

在幾何模型中多于必要觀測數(shù)的觀測數(shù)稱為多余觀測數(shù),如三角形中共觀測了三

個內角,則多余觀測數(shù)為1。為了檢查觀測值中是否存在錯誤,并提高觀測成果

的精度,一定要進行多余觀測。

不可避免的測量誤差和一定要進行的多余觀測這兩個原因導致了觀測值之

間,或觀測值與已知值之間出現(xiàn)矛盾(不符值)。比如,對同一量的多次觀測,

其觀測結果不相等;觀測值或觀測值的函數(shù)與其理論值不相等(最典型的是三角

形的三內角觀測值之和不等于理論值180°)。觀測值之間的這種矛盾(不符值),

使得測量問題的解不惟一。為了消除這種矛盾(不符值),得到測量問題的惟一

解,就要對引起這種矛盾(不符值)的主要原因一一測量誤差進行研究和處理。

處理帶有誤差的觀測值,按最小二乘原理消除觀測值之間的矛盾,求出測量問題

的惟一解并評定精度的理論和方法被稱為“測量平差”。

“測量平差”一詞在我國最早出現(xiàn)在夏堅白、王之卓和陳永齡三位教授合著

的我國第一本測量方面的教材。“二十八年秋,著者三人同在昆明,分別任教于

同濟大學、西南聯(lián)大及中山大學。教學之際,深感國內關于測量課本及參考書之

缺乏,學者苦之,乃有編輯測量學叢書之決心,而以《測量平差法》川一書為始?!?/p>

(引自《學部委員夏堅白》)?!皽y量平差”主要研究測量誤差的理論、測量平差

的方法和測量成果的精度評定。

二、誤差理論

研究內容包括:誤差分布、精度指標、誤差估計、誤差檢驗、誤差分析以及

誤差預測和控制。

在《誤差理論與測量平差基礎》⑵一書中,假定系統(tǒng)誤差已經通過某種手段

得以消除,而且不存在粗差。在這一前提下,測量誤差服從正態(tài)分布,其數(shù)學期

望(真值)為零。方差為衡量觀測值或觀測誤差的精度指標。隨機向量X的方

差的定義為:

O(X)=E[(X-E(X))(X—E(X))T](1-1-1)

當x為一個隨機變量時,其方差可以記為:

O(X)=b;=E(X-E(X))2(1-1-2)

q就是X的中誤差(即標準差,下同)。

方差D(X)定義式(1-1-1)的顯式為:

?(T

。x;\%盧2,x\xn

2

(y(J.??a

D(X)=xY\Yx2xY2xrn

*???

?,?

(T.???CT;

LXiXnr

式中主對角元素為X,的方差,非主對角元素°;內為X,與Xj的協(xié)方差,協(xié)方差

的定義式為:

?「仇(X「E(X,))(XJ-E(XJ))](1-1-3)

方差還可表達為相應的協(xié)因數(shù)與單位權方差的乘積,即:

O(X)=a?念(M-4)

式中2”稱為協(xié)因數(shù)矩陣。當2a非奇異時,。工「=P,P為x的權陣。當x為--

個隨機變量時,則權的定義為:

P、再(1-1-5)

上式表明,權與方差成反比。比例常數(shù)加稱為單位權方差。權是一個相對精度

指標。

誤差估計總是與平差參數(shù)估計同時進行,而且依附于平差參數(shù)估計之中,因

為誤差也是平差系統(tǒng)中所要估計的參數(shù)。

誤差檢驗的目的是要在平差問題中排除系統(tǒng)誤差和粗差的影響,以保證測量

成果的精度。

三、平差方法

在《誤差理論與測量平差基礎》中,介紹了條件平差、間接平差、附有參數(shù)

的條件平差、附有限制條件的間接平差和附有限制條件的條件平差等五種平差方

法。這五種平差方法并無本質的差別,只是所選參數(shù)的個數(shù)不同,以及參數(shù)之間

是否相關所至。因此,我們通常稱這五種平差方法為經典平差,它們是測量平差

的基礎方法。

在經典平差中,如果不選參數(shù),即當所選參數(shù)的個數(shù)"=0時,平差的函數(shù)模

型為:

AU+W=O(1-1-6)

rx.n,?xlrxlrxl

式中〃為觀測值的個數(shù),r為多余觀測的個數(shù)。以(1-1-6)式為函數(shù)模型的平差

問題,稱為條件平差。

當所選參數(shù)的個數(shù)為〃,為必要觀測數(shù)),且參數(shù)之間相互獨立時,

平差的函數(shù)模型為:

AV+BX+W=0(1-1-7)

cxnwxlcxu“xlcxlcxl

式中c=r+u為條件方程的個數(shù),X為所選取的M個參數(shù)向量。以(1-1-7)式

為函數(shù)模型的平差問題,稱為附有參數(shù)的條件平差。

當所選參數(shù)的個數(shù)為〃=3且參數(shù)之間相互獨立時,平差的函數(shù)模型為:

V=BX-L(1-1-8)

nxt/xl〃xl

以(1-1-8)式為函數(shù)模型的平差問題,稱為間接平差。

當所選參數(shù)的個數(shù)為〃>3且包含f個獨立的參數(shù)時,其余“7個參數(shù)都可

以表示成/個獨立參數(shù)的函數(shù),于是平差的函數(shù)模型為:

V=B災一乙

7?xlnxuwxlMX1

(1-1-9)

C玄+W\—o

sxuMxlsx]sxl

式中s=為限制條件的個數(shù)。以(1-1-9)式為函數(shù)模型的平差問題,稱為附

有限制條件的間接平差。

當所選參數(shù)的個數(shù)為0<,,<3且參數(shù)之間不獨立時,平差的函數(shù)模型為:

AV+BX+W=O

cxnMXIcx.u〃xlcxlcxl

(1-1-10)

CX+WX=Q

MXl$x]$xl

以(1-1-10)式為函數(shù)模型的平差問題,稱為附有限制條件的條件平差。

通常將間接平差和限制條件的間接平差稱為參數(shù)平差,其應用最為廣泛。其

它三種總稱為條件平差。各種平差方法可以互相轉換。以上經典平差法的最優(yōu)估

計準則為最小二乘原理。

四、平差結果的精度評定

精度評定包括兩個內容,第一內容是根據(jù)平差后求得的改正數(shù)來估計單位權

中誤差,即

lvTPV

a°=^r("

式中V為觀測值的改正數(shù)(殘差)向量,P為觀測值的權矩陣,「為平差問

題的自由度,即多余觀測數(shù)。

第二內容是應用協(xié)因數(shù)傳播律,計算觀測值函數(shù)。=4的協(xié)因數(shù)。加,

其公式為:

Q^=fQfT(1-M2)

最后e的方差估值為:

/=蘇。加(1-1-13)

§1-2參數(shù)平差原理總述

一、附有限制條件的間接平差原理⑵

1、平差模型

附有限制條件的間接平差的函數(shù)模型和隨機模型分別為:

乙=3X+△

nxAnxuuxlz?xl

(1-2-1)

C7X+Wx.—Oa

sxuux\$x]

D=^Q=^P-1(1-2-2)

相應的誤差方程和條件方程為:

V=BX-1

>(1-2-3)

CX+=O

式中

l=L-BX°(1-2-4)

按最小二乘原理,在

T

0=VPV+2K;(C戈+WX)=min

下得法方程及其解為

Tr

NBBX+CKs-BPI=0

>d-2-5)

C戈+%=0

T(1-2-6)

K°,=N-CC\CNBB-'BPI+WXV)'

X=(A^-1-N-'CTN-'CN-')B'Pl-N-'CrN-'W.

BBBBCCBBBBCCx

式中

NBB=B「PB,N,『=CN:CT(1-2-7)

2、精度評定

(1)、單位權方差

單位權方差估值為:

-2VTPVVTPV

b=-------=------------(1-2-8)

rn-(u-s)

(2)、協(xié)因數(shù)陣

協(xié)因數(shù)陣的計算公式列于表1-1

表1-1附有限制條件的間接平差的協(xié)因數(shù)陣

LXVL

LQBQ效-QvvQ-Qvv

1T

XQWN-BB-NB-B'CNCC-'CNBB-'00H

V~Qvr0Q-BQH0

0

LQ~QvvBQ效Q~QyV

二、間接平差原理

在附有限制條件的間接平差中,當參數(shù)的個數(shù)正好等于必要觀測數(shù),即u=t,

且參數(shù)之間彼此獨立時,有$=上1=0,即此時不存在條件。于是函數(shù)模型(1-2-1)

式就變?yōu)椋?/p>

L=BX+A(1_2.9)

/1X1MX1〃X1一

相應的誤差方程、法方程及其解為:

V=BX-I(1-2-10)

T(1-2-11)

NBBX-BPI=O

T(1-2-12)

X-NBB'BPI

間接平差中單位權方差的估值為:

QVrPVVTPV

(1-2-13)

間接平差中的協(xié)因數(shù)陣見表1-2。

表1-2間接斗F差中的協(xié)因數(shù)陣

LXVL

BN-1BN-'BT-QBN-'B'

LQBBBBQBB

N-'BTN-l0N-'Br

XBBBBBB

VBN-'BB'-QQ0Q-BN-BB'B'0

BN-'BTBN」'BN-'B1

LBBBB0BB

§1-3測量平差的若干進展

僅考慮偶然誤差的經典平差在整個測量史上發(fā)揮了巨大的作用,至今仍廣泛

應用。但隨著科學技術的不斷擴展,測量數(shù)據(jù)采集的現(xiàn)代化、自動化和高精度化,

使得有時經典平差模型不能適應實際問題的需要,因此,測量平差的研究內容也

不斷擴展。這些擴展主要體現(xiàn)在:

1、從法方程系數(shù)矩陣滿秩擴展到法方程系數(shù)矩陣虧秩

在經典平差中,任何一個平差問題總是具有足夠的起算數(shù)據(jù),或稱為具有足

夠的基準條件。在這個前提下,我們得到的法方程的系數(shù)矩陣總是滿秩的。由于

法方程的系數(shù)矩陣滿秩,法方程具有唯一解。但在實際工作中,有時存在沒有足

夠的起算數(shù)據(jù)的情況。例如,在水準測量中沒有已知水準點但卻以高程位參數(shù)就

是這種情況。當一個平差問題沒有足夠的起算數(shù)據(jù)時,法方程的系數(shù)矩陣就會秩

虧,致使法方程沒有唯一解。為了解決這個問題,1962年邁塞爾(P.Meissl)提

出了秩虧自由網平差的思想,將經典平差擴展到秩虧自由網平差。

2、從僅處理靜態(tài)數(shù)據(jù)擴展到處理動態(tài)數(shù)據(jù)

在經典平差中,觀測值和待估參數(shù)都是不隨時間變化的靜態(tài)數(shù)據(jù)。但在現(xiàn)

代測量中,很多情況下觀測值和待估參數(shù)都是隨時間變化的動態(tài)數(shù)據(jù)。例如,

GPS導航中的觀測值和待估參數(shù)就是隨時間變化的動態(tài)數(shù)據(jù)。為了處理觀測值和

待估參數(shù)都是隨時間變化的動態(tài)數(shù)據(jù),1960年卡爾曼(R.E.Kalman)提出了著

名的卡爾曼濾波。應用卡爾曼濾波和其他動態(tài)平差方法,使僅能處理觀測值和待

估參數(shù)都是不隨時間變化的靜態(tài)數(shù)據(jù)的經典測量平差,擴展到能處理觀測值和待

估參數(shù)都是隨時間變化的動態(tài)數(shù)據(jù)。

3、從無偏估計擴展到有偏估計

經典平差的優(yōu)良統(tǒng)計性質是估計結果的無偏性和方差最小性,即經典平差中

估計出來的參數(shù)是最優(yōu)無偏估計。但當法方程病態(tài)時,由于觀測值的很小的誤差,

就會使待估參數(shù)產生很大的變化,不僅解極不穩(wěn)定,而且方差的數(shù)值還會很大。

1955年,Stein證明了若法方程病態(tài),則當參數(shù)的個數(shù)f大于2時,基于正態(tài)隨

機變量(觀測值)的最小二乘估計(經典平差)為不可容許估計,即總能找到另

一個估計,在均方誤差意義下一致優(yōu)于最小二乘估計。統(tǒng)計學家們將這種現(xiàn)象稱

為Stein現(xiàn)象。根據(jù)Stein現(xiàn)象,Stein于1955年提出了通過壓縮改進最小二乘估

計的方法。通過對最小二乘估計結果進行壓縮改進后,其估計結果就不再具有無

偏性。因此,就稱對最小二乘估計結果進行壓縮改進后的結果為有偏估計。有偏

估計被提出以后,至今以擴展了很多有偏估計方法。在大量的有偏估計方法中,

研究得最多的是嶺估計。

4、從線性模型的參數(shù)估計擴展到非線性模型的參數(shù)估計

經典平差方法實際上是線性模型的參數(shù)估計。但測量實踐中卻存在大量的非

線性模型。在經典平差中總是對非線性模型進行線性近似,即將其展開為臺勞級

數(shù),取至一次項,而略去二次以上各項。如此線性近似,必然會引起模型誤差。

如果線性近似所引起的模型誤差小于觀測誤差,則線性近似所引起的模型誤差可

忽略不計。隨著科學技術的不斷擴展,現(xiàn)在的測量精度已大大提高,致使線性近

似所引起的模型誤差與觀測誤差相當。甚至還會大于觀測誤差。因此,用近似的

理論、模型、方法去處理具有很高精度的觀測結果,從而導致精度損失,顯然是

不合理的?,F(xiàn)代科學技術要求估計結果的精度盡可能提高。這樣,傳統(tǒng)的線性近

似的方法就不能滿足當今科學技術的要求。更重要的是,有些非線性模型對參數(shù)

的近似值十分敏感,若近似值的精度較差,線性近似時就會產生較大的模型誤差。

此時用線性模型的精度評定理論去評定估計結果的精度,會得到一些虛假的優(yōu)良

統(tǒng)計性質,人為地拔高了估計結果的精度。為此,人們提出直接處理非線性模型,

這樣就使線性模型的參數(shù)估計擴展到非線性模型的參數(shù)估計。

5、從待估參數(shù)為非隨機量擴展到待估參數(shù)為隨機量

在經典平差中,待估參數(shù)為非隨機量。但在有些實際問題中,某些待估參數(shù)

的先驗統(tǒng)計性質(如期望和方差)是已知的,這就導致帶有隨機參數(shù)的平差問題

的出現(xiàn)。如1969年,克拉魯普(T.Krarup)提出的最小二乘配置,就將待估參

數(shù)僅為非隨機量推廣到待估參數(shù)為隨機量。此外,待估參數(shù)為隨機量的估計還有

貝葉斯(Bayes)估計。

6、從觀測值僅含偶然誤差擴展到有含有系統(tǒng)誤差和粗差

經典平差的最大特點就是假定觀測值為僅含偶然誤差、服從正態(tài)分布的隨機

量。但實際觀測值中往往既含有偶然誤差,又含有系統(tǒng)誤差和(或)粗差。當觀

測值中含有粗差時,由于最小二乘估計不具備抵抗粗差的能力,估計結果將嚴重

地受到粗差的污染。為此,統(tǒng)計學家自然地希望尋求一種能抵抗粗差的估計方法。

于是1953年薄克斯(G.E.P.Box)提出了穩(wěn)健估計(RobustEstimation)概念。

但只到二十世紀六十年代,才出現(xiàn)研究穩(wěn)健估計的熱烈局面。因此,人們公認穩(wěn)

健估計始于1964年,即認為1964年胡倍爾(P.J.Huber)發(fā)表的“位置參數(shù)的

穩(wěn)健估計”一文為穩(wěn)健估計方面的開創(chuàng)性論文。穩(wěn)健估計的出現(xiàn),就使測量平差

擴展到可以處理除含偶然誤差外還含有粗差的觀測值。

同樣,系統(tǒng)誤差在測量過程中也是存在的,為了處理系統(tǒng)誤差,往往在經典

平差的基礎上附加系統(tǒng)參數(shù)。因此,有了附加參數(shù)的平差方法。近年來,又開展

了對應用半?yún)?shù)估計理論來處理系統(tǒng)誤差的平差問題的研究。

7、從主要研究函數(shù)模型擴展到深入研究隨機模型

在經典平差中,主要研究函數(shù)模型。例如,五種經典平差的函數(shù)模型及其內

在聯(lián)系。1923年,赫爾墨特(F.R.Helmert)提出了方差分量估計理論,使兩類

以上觀測值同時平差時正確確定各類觀測值之間的權比成為可能。隨著方差分量

估計理論的提出,開辟了深入研究隨機模型的途徑。

8、從最小二乘估計準則擴展到其它多種估計準則

在經典平差中,實際上只是應用了最小二乘估計準則。隨著科學技術的擴展,

參數(shù)估計理論得到了巨大的發(fā)展。出現(xiàn)了極大似然估計、最小二乘估計、極大驗

后估計、最優(yōu)無偏估計,貝葉斯估計、穩(wěn)健估計、a范估計、信息擴散估計、極

大可能性估計、半?yún)?shù)估計等等多種估計方法。應用上述各種估計的測量平差問

題已取得了許多成果,并在進一步深入研究之中。

§1-4本課程的任務和內容

高等測量平差是在經典測量平差及其相應的誤差理論的基礎上進行擴展,著

重介紹在測量數(shù)據(jù)處理實踐中一些常用的近代平差方法及其相應的誤差理論知

識。本課程是《誤差理論與測量平差基礎》的后續(xù)課程,故本課程取名為高等測

量平差。

本課程內容的選取,主要考慮培養(yǎng)測繪工程專業(yè)本科生這一層次所必須掌握

的平差理論知識的要求,同時也兼顧后續(xù)專業(yè)課教學的需求。為此,本課程主要

內容為:

1、平差模型的統(tǒng)計假設檢驗。介紹測量平差中常用的假設檢驗統(tǒng)計量及

其各種假設檢驗方法。

2、回歸分析理論和方法。介紹回歸分析在測量數(shù)據(jù)處理中的應用以及各

種常用模型的回歸分析方法。

3、秩虧自由網平差理論與方法。介紹廣義逆矩陣以及測量中常用的秩虧

自由網平差的各種方法。

4、穩(wěn)健估計理論和方法。介紹穩(wěn)健估計原理、選全迭代揭發(fā)、以及針對

處理粗差的幾種常用抗查最小二乘法。

5、非線性模型的平差理論和方法。介紹非線性最小二乘估計原理、算法

和估計量的統(tǒng)計性質。

第二章統(tǒng)計假設檢驗

測量數(shù)據(jù)處理的主要內容之一是根據(jù)觀測數(shù)據(jù)做出統(tǒng)計推斷。統(tǒng)計推斷分為參數(shù)估計和假設

檢驗,我們所熟悉的測量平差就屬于參數(shù)平差的范疇。假設檢驗則是根據(jù)樣本來查明總體是

否服從某個特定的概率分布。因為假設檢驗與概率分布有關,故先介紹幾種常用的抽樣分布。

一、兒種常用的抽樣分布

1、正態(tài)分布

設平差系統(tǒng)觀測向量為L=[乙???LJ,其中b;),真誤差△,=2一4

n1

的期望E(AJ=O,參數(shù)向量為N=K…通過平差計算,可獲得其中參數(shù)占的

估值£,并可表示為觀測值的線性函數(shù)

X=a,1L,+<z,2L,+???+ainLn=L

a'=<??即],按誤差傳播定律得crj.=Q%

由于戈,.是正態(tài)變量4的線性函數(shù),戈,~N(X,,W)。

對正態(tài)變量戈,.標準化

文「X,

u=--------L

外,

因為

E(u)—后(文).~-o,er:=(o■:+0)=1>

所以

M~N(0,1)為標準正態(tài)變量。

L

P<-ua<---------<ua>=\-a

I0■兄.5,

有標準正態(tài)分布表終可查得

a0.31730.100.050.04550.010.00270.001

ua1.01.6451.962.02.5763.03.29

2

有正態(tài)分布引出下列三種分布

2,%2分布統(tǒng)計量

在平差系統(tǒng)中,殘差平方和V’PV是個重要的統(tǒng)計量,在平差參數(shù)估計和假設檢驗

中往往要用到,為此,要了解其概率分布。

已知統(tǒng)計數(shù)學中的二次型分布定理為:

設X~N(u,E),例為對稱陣,且有為基等陣,則二次型X,MX服從非中心化

的%2分布:XTMX-x\R^M),uTMu)

I~N(6X,b;0),MZ==PQVV,PQVVPQVV=PQw為幕等陣,

b()

V1py

所以——~/2(/?(M),(5X)rMBX)

R(M)=nT

九=(BX)TMBX=0

VTPV

-z2(/)-f=n-t

T

,2VPV

P\X<——<z|?=1-a

2%3,

3、t分布統(tǒng)計量

定義:隨機變量x、Y相互獨立,X~N(O,I),y~z2(/),

X

t-i--------~,(/),

y/yTf

前面標準正態(tài)統(tǒng)計量

O■。為母體單位權標準差,在實際問題中經常是未知的,

X1-X

概率表達式為P\-ta<―----<fa5=1-a

II6。匹IJ

4、F分布統(tǒng)計量

2

定義:隨機變量X、Y相互獨立,X~%2(〃j,Y~X(n2),

F=3

Y/n2

p["5bo”5J=1-a

二、統(tǒng)計檢驗常用方法

統(tǒng)計檢驗是根據(jù)樣本來查明總體是否服從某個特定的概率分布

(1)首先對母體概率分布作出陳述(即假設);

(2)根據(jù)從該母體中抽出的樣本來判斷是否與前陳述一致(即檢驗)

(3)通過檢驗來決定是接受還是拒絕假設.

某基線場設置的基線,經精密測定,其長度為Lo=12OO.252m,為了檢驗兩臺測距儀的精度,

分別用兩臺儀器對該基線各復測25測回,得平均長度L=12()0.264m,L2=1200.249m。

已知兩臺儀器的觀測精度相同,每測回的標準差均為0.015m,試用顯著水平0.05檢驗則兩

個平均長度和基線長度的差別是否完全有觀測的隨機性而引起的。

設某廠生產,種燈管,其壽命服從N(u,40000),從過去情況看,燈管平均壽命為1500小時,

現(xiàn)采用新工藝后,從新產品中抽出16個,測得平均壽命為1675小時,問新產品的壽命是否

有顯著提高?(顯著水平為0.05)

設有2人觀測某地緯度,已知此二人觀測緯度一次的中誤差為0.63秒,現(xiàn)在甲觀測該地緯

度12次,得平均值秒數(shù)為1.20秒,乙觀測該地緯度8次,得平均值秒數(shù)為1.15秒,問他們

所得結果的差異是否顯著?(顯著水平為0.05)

二、統(tǒng)計假設檢驗的概念

1.接受域與拒絕域

統(tǒng)計假設檢驗所解決的問題,就是根據(jù)觀測樣本,通過檢驗來判斷母體分布是否具有指定的

特征。在這里,我們通過對改正數(shù)的檢驗,構造統(tǒng)計量,在所作的假設下,判斷是否有模型

誤差。例如,統(tǒng)計量(4-3-6)式是在平差模型不存在粗差即E(匕)=0的假設下得出的,此

時的統(tǒng)計檢驗在于將標準化殘差W,與所選定的臨界值卬區(qū)進行比較,叱的置信區(qū)間為

2

-'

P<-wa<<wa>=l-a(4-3-9)

.22.

P<|w-|<wa>=\-a(4-3-10)

、五

上式中,-Wq,卬q是區(qū)間的上下限,其數(shù)值可根據(jù)給定的。從正態(tài)分布表中查得。

2~2

這就是說,當我們作了假設E(匕)=0。為了檢驗這一假設是否成立,計算統(tǒng)計量

IvJ、一、一,

vv.=—J——,使(4-3-10)式成立,那么,就表不明是落在(-w,w)區(qū)間內,在

叵22

這種情況下,沒有理由否定原先所作的石(匕)=0假設,即接受原假設,通常將區(qū)間(?2,

2

卬里)稱之為接受域。反之,如果計算結果明>叩名或VWg,就表示概率很小的事件居然

發(fā)生了。根據(jù)小概率事件在一次實驗中不可能出現(xiàn)的原理,就有足夠的理由否定原來所做的

E(匕)=0假設,即應拒絕原假設E(匕)=0,而認為石(匕)W0。。通常將(-卬。,w0)

2~2

區(qū)間以外的范圍稱之為拒絕域(圖4-4)。

2、原假設與備選假設

由以上所述可見,當需要根據(jù)子樣信息來判斷母體分布是否具有指定的特征時,總是

先作一.個假設,稱為原假設(或零假設),記為4.。然后,找一個適當?shù)那移浞植紴橐阎?/p>

的統(tǒng)計量,確定該統(tǒng)計量經常出現(xiàn)的區(qū)間,使統(tǒng)計量落入此區(qū)間的概率接近于1,如果由抽

樣的結果計算出的統(tǒng)計量的數(shù)值不落在這一經常出現(xiàn)的區(qū)間內,那就表示小概率事件發(fā)生

了,則應拒絕原假設"°,當"°遭到拒絕,相當于接受了另一個假設,稱為備選假設,記

為小。因此,假設檢驗實際上就是要在原假設與備選假設之間做出選擇。

3、顯著(性)水平

接受域和拒絕域的范圍大小是與我們所給定的a值大小有關的,a值愈大,則拒絕域

愈大,被拒絕的機會就愈大,a的大小通常應根據(jù)問題的性質來選定,當不應輕易拒絕原

假設”o時,應選擇較小的a,一-般使用的a值可以是0.04、0.01等。

對于上述統(tǒng)計量而言,當帆卜」工>卬〃時,則稱匕與0的差異是顯著的,反之,則

九2

稱匕與0之間的差異不顯著。因此,數(shù)a稱之為檢驗的顯著(性)水平,上述的假設檢驗問

題通常敘述成:在顯著水平a下,檢驗假設“o:E(匕);/:E(匕)=0。

4、單、雙尾檢驗法

上述假設檢驗的例子,是將拒絕域布置在統(tǒng)計量分布密度曲線兩端的尾巴上,這

種檢驗稱為雙尾檢驗法;有時根據(jù)實際情況,需要判斷母體均值是否增大了,即檢驗假設

HQ:〃=E(x);乩:fj>E(x)

為了進行這樣的假設檢驗,只要將a布置在右尾上。如需檢驗假設

Ho:〃=E(x);H]:/J<£(x)

則將a布置在左尾上,這樣的檢驗方法稱為單尾檢驗法。

5、棄真與納偽的概率

假設檢驗是以小概率事件在一次實驗中實際上是不可能發(fā)生的這一前提為依據(jù)的。必

須指出,小概率事件雖然其出現(xiàn)的概率很小,但并不是說這種事件就完全不可能發(fā)生。事實

上,如果我們重復抽取許多組子樣,由于抽樣的隨機性,由此算得的統(tǒng)計量數(shù)值也具有隨機

性。若檢驗的顯著水平a定為0.05,那么,即使原假設“°是真的,其中仍約有5%的計算

數(shù)值將會落入拒絕域中。由此可見,進行任何假設檢驗總是有做出不正確判斷的可能性,不

可能絕對不犯錯誤,當"o為真而遭到拒絕的錯誤稱為犯第一類錯誤,也稱為棄真錯誤,犯

棄真錯誤的概率是a。同樣地,當〃。為不真時,我們也有可能接受"o,這種錯誤稱為犯

第二類錯誤,也稱為納偽錯誤。犯納偽錯誤的概率為夕(見圖4-6)。

例4-3子樣均值x的抽樣分布是正態(tài)的,均值為片,中誤差a*=2。

原假設"°:4=0,備選假設^0表4-3置信度a與臨界值VV&的關系

2

選定顯著水平a=0.05,查正態(tài)分布表4-3得卬〃=1.96

a

~2

原假設為真時,確定檢驗統(tǒng)計量卬=±互=七9

0.051.96

22

0.012.57

根據(jù)(4-3-10)式,有接受域P兇<x2=3.92?=l-a0.0013.29

和拒絕域(見圖4-5).

此時,當“。為真時而遭到拒絕,稱為犯第一類錯誤,也稱

圖4-5接受域與拒絕域圖4-6犯納偽錯誤的概率

若備選假設為真時,如J=2,亦即“0為偽,則X的分布實為N(2,2),見圖4-6。

如x的觀測值落在拒絕域中,我們拒絕“。,這是正確的,如x的觀測值落在接受域中,使

我們作出錯誤的判斷,認為%為真,這就犯了第二類錯誤(納偽/),期率/是圖6-6

中當"i為真時接受域范圍內密度曲線下的面積。,值的計算:將±3.92標準化得

嗎=]_(—3.92—2)=—2.96,

w2(3.92-2)=+0.96

查正態(tài)分布表得①(卬J=0.0015,①(卬2)=0.8314

則£=0)(^2)—①(嗎)=0.830

6、檢驗功效

在上例中,作出錯誤的判斷(納偽)的概率為0.83,作出正確判斷(棄偽)的概率為

1-^=0.170?如果重復抽取許多組子樣,其中將有83%使我們犯第二類錯誤,有17%使

我們作出正確的判斷,這種作出正確判斷的概率稱為檢驗功效,其概率為1-尸。

根據(jù)以上所述,將假設檢驗的四種可能性列于表4-4中。

表4-4假設檢驗的四利『可能性

現(xiàn)象判斷結果概率

接受正確\-a

也為真

拒絕第一類錯誤(棄真)a

接受第二類錯誤(納偽)

”o為不真B

拒絕正確

為真)\-/3(檢驗功效)

對于一個檢驗問題,總希望棄真概率a和納偽概率/均盡可能的小,但這是做不到的,

從圖4-6和表4-3可以看出,a減小,£就跟著增大。通常認為棄真的錯誤較之納偽的錯誤

更為嚴重,因此,總是先控制a,例如,根據(jù)問題的性質,選用a為0.05、0.01或0.001

等,然后,在不改變a的前提下,盡可能使減小,即使檢驗功效1-夕增大。檢驗功效代

表為某?數(shù)值的粗差被正確發(fā)現(xiàn)的概率。

第三章回歸模型的參數(shù)估計與假設檢驗

§3-1概述

在測量數(shù)據(jù)處理中,經常遇到要研究變量與變量之間的關系。變量之間的關系一般可分

為兩類。一類是變量之間具有確定性關系,稱為函數(shù)相關。例如矩形面積S與其兩邊a、b

之間存在確定性關系為s=ab;一個平面三角形的一個內角7與其它兩個內角。、,之間關

系為y=180°-0-/;兩點間的縱坐標增量Ac等于邊長S乘以方位角。的余弦,即

Ax=scosa等,這些變量之間可用一個確定的函數(shù)模型表達。在我們學過的《誤差理論與

測量平差基礎》課程中,所討論的大多是這種確定性的函數(shù)模型。另一類是變量之間并不存

在確定的函數(shù)關系,而是存在所謂相關關系,或者說是統(tǒng)計上的相關關系,稱為統(tǒng)計相關。

例如,每年春季氣溫與降雨量,人的高度與體重之間就存在著統(tǒng)計相關。這種現(xiàn)象在測繪學

中也大量存在。例如測距結果與儀器中電子線路受固定的干擾信號引起誤差之間;重力測量

結果與氣壓、溫度、地下水等因素之間;海平面變化與氣象、海洋天文因素之間;斷層位移

與斷層活動趨勢、氣溫、地溫、蒸發(fā)、降雨量之間等等都是這種現(xiàn)象。這種統(tǒng)計相關的特點

是,它們之間既存在著一定的制約關系,又不能由一個(或幾個)變量數(shù)值精確地求出另一

個變量的值來,由變量之間統(tǒng)計相關所建立的函數(shù)模型稱為回歸模型。

回歸分析方法是研究相關關系的一種有力的數(shù)學工具。它是建立在對客觀事物進行大量

實驗和觀測的基礎上,尋找隱藏在不確定性關系后面的統(tǒng)計性規(guī)律的數(shù)理統(tǒng)計方法。

在進行回歸分析時,將研究相關關系的各變量分為自變量和因變量,例如因變量y隨著

m個自變量芯,々…,x,“而變化,y是正態(tài)分布的隨機量,觀測數(shù)據(jù)(?,…X"”)

(i=l,2…〃),稱為樣本,如果因變量與自變量之間的關系為線性的,稱為線性回歸模型,

否則,就稱為非線性回歸模型。在線性回歸模型中,若自變量x的個數(shù)只有一個稱為一元線

性回歸模型,自變量x的個數(shù)大于一個,稱為多元線性回歸模型.回歸分析主要研究的問題

是:

(1)如何根據(jù)樣本(y^xu,x2i,---xmi)?(i=1,2…〃)建立回歸模型;

(2)如何估計回歸模型參數(shù):

(3)如何檢驗模型參數(shù)的顯著性;

(4)如何利用回歸方程進行預報和控制。

§3-2線性回歸模型

設一個隨機變量y與m個自變量X1,4,…之間存在線性形式的統(tǒng)計相關關系,因為

它們并不是確定的函數(shù)關系,即使給定了修,々,/之值也不唯一決定y值,因此它們之

間的表達式應寫成

y=A)+4匹+42了2+…+凡,x,“+£(3-2-1)

式中£是隨機誤差,它是N(0變量,即£的期望£(£)=0,方差。(£)=〃。領

40=1,2…機),稱為回歸方程的系數(shù)。

取(3-2-1)式的期望和方差

E(y)=0[X[+設2+…+仇(3-2-2)

O(y)=O(£)=/(3-2-3)

(3-2-2)式說明片+川*+夕2々+…+&x,“是再,々…,x,“對y的平均影響,隨機變量

y~N(E(y)/)。

(3-2-1)式是線性回歸模型,(3-2-2)式是線性回歸理論模型。

為了估計模型參數(shù),需要對變量進行n次觀測,得n組觀測數(shù)據(jù)(yt,xu,xv,---xmi)

(z=1,2,???,?),代入方程(3-2-1)有n個方程。

y(=片+占應+x2a2+,,'+X""£"+與('=1,2,“.,”)(3-2-4)

其矩陣形式為

Y=Xp+£(3-2-5)

n\ntn+1/n+|jn1

這是回歸參數(shù)估計的函數(shù)模型,其隨機模型為

D(s)=a2I(3-2-6)

nn

式中I為單位陣。Y為觀測值向量,力為待求的參數(shù)向量。

當觀測數(shù)〃〉(m+1)時,可用最小二乘原則估計參數(shù)/,設其估值為力,代入(3-2-2)

式可得E(y)的估值即

§=儲+8\X[+隈?+…+(327)

稱為線性回歸方程,給定一組數(shù)(番,》2…七”)由上式求出9稱為預報值。

如果將回歸參數(shù)估計的函數(shù)模型(3-2-5)和隨機模型(3-2-6)與測量中間接平差

函數(shù)模型和隨機模型相比較,可以看出,在不考慮模型物理性質前提下,兩者的參數(shù)最

小二乘估計模型形式完全一致,從這個意義上來說,線性回歸模型的參數(shù)估計也可看成

是一種等權觀測的間接平差問題。因此,我們學過的間接平差理論和方法完全可以用于

回歸模型的參數(shù)估計。

§3-3回歸參數(shù)的最小二乘估計

一、一元線性回歸參數(shù)估計

先以一個例子說明一元線性回歸問題。

例3-1,某水電站為了監(jiān)測和預報庫水位和大壩壩基沉陷量之間的關系,統(tǒng)計了某

年12個月的月平均庫水位和沉陷量的數(shù)據(jù)如表3-1所示,試分析庫水位與壩基沉陷量之

間的關系。

表3-1觀測數(shù)據(jù)

庫水位沉陷量庫水位沉陷量

編號編號

(m)(mm)(m)(mm)

1102.714-1.967135.046-5.46

295.154-1.888140.373-5.69

3114.364-3.969144.958-3.94

4120.170-3.3110141.011-5.82

5126.630-4.9411130.308-4.18

6129.393-5.6912121.234-2.90

現(xiàn)以X軸表示庫水位,以Y軸表示大壩壩基沉陷量,作散點圖(圖3-1)由圖認

為,這些散點的分布可用一條直線方程表示,即

50蹙150200

y=0o+Ax,這是一元回歸分析問題。-2

-1

-6

-8

3-1

下面闡述參數(shù)估計原理。

為了估計參數(shù)為、四,設對y進行n次獨立觀測(x,x,),有

yi=&+4玉+弓(i=l,2…〃)(3-3-1)

這是一元回歸參數(shù)估計的函數(shù)模型,相應的理論模型為

E(y)=0o+0內(3-3-2)

在回歸分析中,假定自變量七是非隨機變量,且沒有測量誤差,這就使我們研究的

問題大大簡化,令

丫=[月為…y』,£=k&…£」,

1

Y1%2

A=,pR=

??????B、

Jx?_

則(3-3-1)式可寫成矩陣形式:

Y=X/3+£(3-3-3)

設V為誤差£的負估值,稱為Y的改正數(shù)或殘差,成為回歸參數(shù)夕的估值,

則有誤差方程

V=Xp-Y(3-3-4)

根據(jù)最小二乘原理VrV=min,對求自由極值,得

T

dVV=2萬r土dv=2LrX=0,

dp明

XW=0

將誤差方程(3-3-4)代入上式,即得法方程為

XTXfi=XTY(3-3-5)

式中

Z

Z

E

T

T

Xy

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論