版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第四章、水文統(tǒng)計(jì)學(xué)隨機(jī)變量及其分布參數(shù)水文中常用的概率分布曲線統(tǒng)計(jì)參數(shù)估計(jì)方法相關(guān)分析水文時(shí)間序列分析第四章、水文統(tǒng)計(jì)學(xué)隨機(jī)變量及其分布參數(shù)1學(xué)習(xí)要求:(1)了解概率、隨機(jī)變量及其概率分布的基本概念;
(2)了解水文頻率曲線常用的線型,要掌握P-III型分布曲線和經(jīng)驗(yàn)頻率曲線的性質(zhì)和計(jì)算方法;
(3)掌握水文頻率計(jì)算適線法的具體步驟和方法,特別是參數(shù)對頻率曲線的影響;
(5)了解相關(guān)分析的基本概念和方法,特別要掌握兩變量直線相關(guān)、曲線相關(guān)的方法和具體步驟;(6)水文過程的隨機(jī)模擬。
學(xué)習(xí)要求:
2水文現(xiàn)象具有二重性:水文現(xiàn)象包含著必然性水文現(xiàn)象也包含著偶然性,對水文的偶然現(xiàn)象(或稱隨機(jī)現(xiàn)象)所遵循的規(guī)律一般稱做統(tǒng)計(jì)規(guī)律。物理成因分析法概率論和數(shù)理統(tǒng)計(jì)分析方法水文現(xiàn)象具有二重性:水文現(xiàn)象也包含著偶然性34.1.1概率的基本概念與定理1.事件:是指隨機(jī)試驗(yàn)的結(jié)果。事件有兩種屬性:
數(shù)量性質(zhì):直接測量的量或計(jì)算的量,如年降雨量,年徑流量...
屬性性質(zhì):
直接觀測到的現(xiàn)象,如天氣的雨天和晴天,嬰兒性別,錢幣的正面和背面...4.1.隨機(jī)變量及其分布參數(shù)4.1.1概率的基本概念與定理4.1.隨機(jī)變量及其分41)必然事件2)不可能事件3)隨機(jī)事件事件可以分為三種類型:2.概率
為了比較某隨機(jī)事件出現(xiàn)(或不出現(xiàn))的可能性大小,必然賦予一種量化的(以數(shù)量表示)指標(biāo),這個(gè)數(shù)量指標(biāo)就是事件的概率。1)必然事件事件可以分為三種類型:2.概率5
式中,P(A):一定條件下隨機(jī)事件A的概率;
n:試驗(yàn)中所有可能的出現(xiàn)的結(jié)果數(shù);
m:出現(xiàn)隨機(jī)事件A的結(jié)果數(shù)。簡單(古典)的隨機(jī)事件的概率定義用下式表示:古典的隨機(jī)試驗(yàn)是指所有試驗(yàn)的可能結(jié)果都是等可能的,而且試驗(yàn)的可能結(jié)果的總數(shù)是有限的。但水文事件不一定符合這種性質(zhì)。 式中,P(A):一定條件下隨機(jī)事件A的概6對于不是古典概型事件,只能通過多次重復(fù)試驗(yàn)來估計(jì)事件的概率。設(shè)事件A在n次隨機(jī)試驗(yàn)中出現(xiàn)了m次,則稱:3.頻率為事件A在n次試驗(yàn)中出現(xiàn)的頻率。注意:n
不是所有可能的結(jié)果總數(shù),僅是隨機(jī)試驗(yàn)的次數(shù)。對于不是古典概型事件,只能通過多次重復(fù)試驗(yàn)來估計(jì)事件7頻率:
頻率是通過若干次試驗(yàn)后才能求得的經(jīng)驗(yàn)值,事先不能確定,當(dāng)試驗(yàn)次數(shù)n愈大,即當(dāng)n趨于無窮大時(shí),理論上,n變成試驗(yàn)中所有可能的結(jié)果總數(shù),則頻率愈接近概率。概率和頻率的區(qū)別:概率:
在等可能條件下,表達(dá)事件客觀上出現(xiàn)的可能性大小,是一個(gè)理論值。頻率:概率和頻率的區(qū)別:概率:
在等可能條件81.隨機(jī)變量
用以表示隨機(jī)試驗(yàn)結(jié)果的一個(gè)數(shù)量(事先是未知的),由于它事先不能確定,是隨機(jī)的,稱為隨機(jī)變量。水文現(xiàn)象中的隨機(jī)變量,一般指某個(gè)水文特征值(如年徑流量、年降雨量、洪峰流量等)。4.1.2.隨機(jī)變量及其分布參數(shù)1.隨機(jī)變量4.1.2.隨機(jī)變量及其分布參數(shù)9
總體
在統(tǒng)計(jì)數(shù)學(xué)中,把某種隨機(jī)變量所取數(shù)值的全體,稱為總體。如年徑流量的總體數(shù)是無窮的。統(tǒng)計(jì)學(xué)中幾個(gè)概念:
樣本
從總體中不帶主觀成分任意抽取的一部分,稱為樣本。樣本所包含的項(xiàng)數(shù),稱為樣本容量。如實(shí)測的水文資料是有限的,是一樣本??傮w統(tǒng)計(jì)學(xué)中幾個(gè)概念:樣本10
它是指隨機(jī)試驗(yàn)結(jié)果的一個(gè)數(shù)量。在水文學(xué)中,常用大寫字母表示,記作X,而隨機(jī)變量的可能取的值記作x,即:
X=x1,X=x2,
X=xn
一般稱之為隨機(jī)系列或隨機(jī)數(shù)列。
隨機(jī)變量的表示:它是指隨機(jī)試驗(yàn)結(jié)果的一個(gè)數(shù)量。在水文學(xué)中,常用大寫字11離散型隨機(jī)變量
隨機(jī)變量僅取得區(qū)間內(nèi)某些間斷的離散值,則稱為離散型隨機(jī)變量。如洪峰次數(shù),只能取0,1,2…,不能取相鄰兩數(shù)值之間的任何值。隨機(jī)變量的分類:連續(xù)型隨機(jī)變量
隨機(jī)變量可以取得一個(gè)有限區(qū)間內(nèi)的任何數(shù)值,則稱為連續(xù)型隨機(jī)變量。如某河流斷面的流量可以取0~極限值之間的任何實(shí)數(shù)值。離散型隨機(jī)變量隨機(jī)變量的分類:連續(xù)型隨機(jī)變量12對于離散型隨機(jī)變量:
隨機(jī)變量的取某一可能值的機(jī)會有的大有的小,即隨機(jī)變量取值都有一定的概率與之相對應(yīng),可表示為:2.隨機(jī)變量的概率分布
上式中P1,P2,…Pn
表示隨機(jī)變量X
取值x1,x2,…xn
所對應(yīng)的概率。對于離散型隨機(jī)變量:2.隨機(jī)變量的概率分布13
x1x2x3x4……xnXP
離散型隨機(jī)變量概率分布圖一般將這種對應(yīng)關(guān)系稱作隨機(jī)變量的概率分布規(guī)律,簡稱為分布律??梢杂靡韵碌姆植紙D形表示:x1x2x3x4…14
由于它的所有可能取值有無限個(gè),而取個(gè)別值的概率為零,故無法研究個(gè)別值的概率。水文學(xué)上習(xí)慣研究隨機(jī)變量的取值等于或大于某個(gè)值的概率,表示為:
它是x的函數(shù),稱作隨機(jī)變量X的分布函數(shù),記作F(x),即F(x)=P(Xx)
表示隨機(jī)變量X大于或等于值
x的概率,其幾何曲線稱作隨機(jī)變量的概率分布曲線(水文學(xué)上通常稱累計(jì)頻率曲線,簡稱頻率曲線)。
對于連續(xù)型隨機(jī)變量:由于它的所有可能取值有無限個(gè),而取個(gè)別值的概15
由圖中可知,X=900,相應(yīng)的P(Xx)=0.15,說明大于900mm降雨的可能性為15%;同理,大于500mm降雨的可能性為60%00.20.40.60.81.0500900年降雨量(mm)某站年雨量概率分布曲線
P(Xx)由圖中可知,X=900,相應(yīng)的P(Xx)=16
P(Xx)=P(X>x+x)+P(x+x>Xx)
P(x+x>Xx)=P(Xx)-P(X>x+x)=F(x)-F(x+x)
(8-1)由概率的加法定理:則,降雨量落在900和500mm的可能性為:60%-15%=45%
x
x+
x
PXP(Xx)P(X>x+x)隨機(jī)變量X落在(x,x+x)
的概率可用下式表示:
P(Xx)=P(X>x+x)+17平均概率密度:
隨機(jī)變量落在區(qū)間(x,x+x)的概率與該區(qū)間長度的比值稱作隨機(jī)變量落在區(qū)間(x,x+x)平均概率。概率密度函數(shù):平均概率密度:隨機(jī)變量落在區(qū)間(x,x+x)18稱f(x)為概率密度函數(shù),簡稱密度函數(shù)。而密度函數(shù)的幾何曲線稱作密度曲線。當(dāng)x
0,取極限得:稱f(x)為概率密度函數(shù),簡稱密度函數(shù)。當(dāng)x019f(x)f(xi)F(x)xi密度曲線分布曲線xxdxf(x)f(xi)F(x)xi密度曲線分布曲線xxdx20通過密度函數(shù)f(x)可求出隨機(jī)變量X落在(x~x+dx)區(qū)間即dx上的概率=f(x)dx,稱之為概率元素,即為圖中的陰影面積;通過密度函數(shù)f(x)可求出隨機(jī)變量X概率分布函數(shù)F(x),其與密度函數(shù)f(x)有如下的數(shù)學(xué)關(guān)系:通過密度函數(shù)f(x)可求出隨機(jī)變量X落在(x~x+dx21
F(x)分布函數(shù),反映隨機(jī)變量X超過某個(gè)值x的概率。這兩個(gè)函數(shù)能完整地描述隨機(jī)變量的分布規(guī)律。
f(x)密度函數(shù),反映隨機(jī)變量X落入dx區(qū)間的平均概率;可見,隨機(jī)變量的二個(gè)函數(shù):
F(x)分布函數(shù),反映隨機(jī)變量X超過某個(gè)值x的22
在實(shí)際問題中,隨機(jī)變量的分布函數(shù)不易確定,或有時(shí)不一定需要用完整的形式來說明隨機(jī)變量,而只要知道其主要特征就可以。隨機(jī)變量的分布函數(shù)和密度函數(shù)中都包含一些參數(shù)(如均值、變差系數(shù)、偏態(tài)系數(shù)),而這些參數(shù)能反映隨機(jī)變量分布的特點(diǎn):如有的分布集中,有的分布分散,有的分布對稱,有的分布非對稱,等等。在統(tǒng)計(jì)學(xué)中用以表示隨機(jī)變量這些分布特征的某些數(shù)值,稱之為隨機(jī)變量統(tǒng)計(jì)參數(shù)。3.隨機(jī)變量統(tǒng)計(jì)參數(shù)在實(shí)際問題中,隨機(jī)變量的分布函數(shù)不易確定,或有時(shí)不一23平均數(shù)/數(shù)學(xué)期望離散型隨機(jī)變量的平均數(shù)是以概率為權(quán)重的加權(quán)平均值。a.反映位置特征參數(shù)
對于離散型隨機(jī)變量:平均數(shù)/數(shù)學(xué)期望離散型隨機(jī)變量的平均數(shù)是以24
式中,a、b分別為隨機(jī)變量X取值的上下限。
數(shù)學(xué)期望或平均數(shù)代表整個(gè)隨機(jī)變量的總水平的高低,它為分布的中心。
對于連續(xù)的隨機(jī)變量:式中,a、b分別為隨機(jī)變量X取值的上下限。25
表示概率密度分布峰點(diǎn)所對應(yīng)的數(shù)。對于離散型隨機(jī)變量:
M0(x)
是使概率P(=xi)等于最大時(shí)所相應(yīng)的xi值。M0(x)=xiPi-1PiPi+1
Px離散型隨機(jī)變量的眾數(shù)眾數(shù),記為M0(x)表示概率密度分布峰點(diǎn)所對應(yīng)的數(shù)。M0(x)=26M0(x)是概率密度函數(shù)f(x)等于最大時(shí)所對應(yīng)的xi值M0(x)f(x)x連續(xù)的隨機(jī)變量的眾數(shù)對于連續(xù)型隨機(jī)變量:M0(x)是概率密度函數(shù)f(x)等于最大27把概率密度分布分為二個(gè)相等部分的數(shù)。對于離散型的隨機(jī)變量:
將所有變量的可能取值按大小次序排列,位置居中的數(shù)字。中位數(shù),記為Me(x)把概率密度分布分為二個(gè)相等部分的數(shù)。中位28對于連續(xù)的隨機(jī)變量中位數(shù)滿足:式中,a,b分別為隨機(jī)變量X取值的上下限Me(x)xf(x)1/21/2ab對于連續(xù)的隨機(jī)變量式中,a,b分別為隨機(jī)變量X29
該參數(shù)用以反映隨機(jī)變量分布離散程度(相對于隨機(jī)變量分布中心即平均值的差距)的指標(biāo),通常有以下幾種:b.反映離散特征參數(shù)
值愈大,分布愈分散;值愈小,分布愈集中。
標(biāo)準(zhǔn)差(均方差)
(Standarddeviation)(8-6)122>1f(x)x標(biāo)準(zhǔn)差對密度函數(shù)的影響該參數(shù)用以反映隨機(jī)變量分布離散程度(相對于隨30變差系數(shù)(離差系數(shù),離勢系數(shù)〕CV1CV2CV2>CV1f(x)x變差系數(shù)對密度函數(shù)的影響CV值愈大,分布愈分散;CV
值愈小,分布愈集中。對于均值不同的二個(gè)系列,用均方差來比較其離散程度就不合適,則要采用均方差和均值的比來表示:變差系數(shù)(離差系數(shù),離勢系數(shù)〕CV1CV2CV2>CV31f(x)x偏態(tài)系數(shù)對密度函數(shù)的影響Cs=0Cs>0Cs<0若不對稱:CS
>0,稱為正偏;CS
<0,稱為負(fù)偏。c.反映對稱特征的參數(shù):
偏態(tài)系數(shù)(偏差系數(shù))f(x)x偏態(tài)系數(shù)對密度函數(shù)的影響Cs=0Cs>0Cs<0若324.2.水文中常用的概率分布曲線1.正態(tài)分布(8-9)式中,:平均數(shù);
:標(biāo)準(zhǔn)差。
許多隨機(jī)變量如水文測量誤差、抽樣誤差等一般服從正態(tài)分布。4.2.水文中常用的概率分布曲線1.正態(tài)分布(8-9)式中,33f(x)
a.單峰,只有一個(gè)眾數(shù);b.對于平均數(shù)對稱,Cs=0;c.曲線二端趨于±∞,并以x軸為漸近線;d.正態(tài)分布曲線的特點(diǎn):f(x)a.單峰,只有一個(gè)眾數(shù);正態(tài)分布曲線的特點(diǎn):34概率密度函數(shù)表達(dá)式:
2.皮爾遜Ⅲ型分布式中,()~的伽瑪函數(shù),,,a
0:三個(gè)參數(shù),它們與三個(gè)統(tǒng)計(jì)參數(shù)有一定的關(guān)系,其表達(dá)式為:可見,當(dāng)以上三個(gè)參數(shù)確定后,P-III型密度函數(shù)亦完全確定。概率密度函數(shù)表達(dá)式: 2.皮爾遜Ⅲ型分布式中,(35f(x)皮爾遜Ⅲ型概率密度曲線
a0M0(x)Me(x)xPxP-III型曲線的特點(diǎn):一端有限另一端無限的不對稱單峰正偏曲線f(x)皮爾遜Ⅲ型概率密度曲線a0M0(x)Me(x)x36在水文計(jì)算中,一般要求出指定概率P所相應(yīng)的隨機(jī)變量的取值xP,即求出的xP滿足下列等式:按上式計(jì)算相當(dāng)復(fù)雜,故實(shí)用中,采用標(biāo)準(zhǔn)化變換:取標(biāo)準(zhǔn)變量(離均系數(shù)),即代入上式,,
,a0以相應(yīng)的和關(guān)系式表示,簡化后得:在水文計(jì)算中,一般要求出指定概率P所相應(yīng)370.031.302.473.384.160.20.021.292.403.233.940.10.001.282.333.093.720.0501010.10.01P(%)pCsP-III型曲線離均系數(shù)
P值表注:詳表見附表1,p266被積函數(shù)含有參數(shù),Cs,而包含在
中,制成對應(yīng)關(guān)系表:0.031.302.473.384.160.20.021.238因此,由給定的CS
及P,從P-III型曲線離均系數(shù)
值表,查出P,再由下式求:
即求出指定概率P所相應(yīng)的隨機(jī)變量的取值xP因此,由給定的CS及P,從P-III型曲線39已知:某地年平均降雨量
=1000mm,CV=0.5,CS=1.0,若年降雨量符合P-III型分布試求:P=1%
的年降雨量?!舅憷壳蠼猓河蒀S=1.0及P=1%,查附表1得p=3.02已知:某地年平均降雨量=1000mm,CV=40引入模比系數(shù):
另一種求解方法:由由此建立的對應(yīng)數(shù)值關(guān)系[P-III型曲線模比系數(shù)KP
值表(見附表2)]上例的解法:由CV=0.5,CS
=1.0=2
CV
,P=1%查附表2得:引入模比系數(shù):另一種求解方法:由由此建立的41P-III型曲線模比系數(shù)KP值表(附表2,P266)
P(%)CV0.010.10.20.330.512510205075909599(一)
CS=CV0.051.191.161.151.141.131.121.111.091.071.041.000.970.940.920.89……………………………………1.5011.68.858.027.366.876.005.113.923.002.040.64-0.10-0.53-0.70-0.89(二)CS=1.5CV0.05(三)CS=2CV。。。。。。(三)CS=6CVP-III型曲線模比系數(shù)KP值表(附表2,P266)42
水文隨機(jī)變量的總體是無限的,這就需要在總體不知道的情況下,靠抽出的樣本(觀測的系列)去估計(jì)總體參數(shù)。4.3.隨機(jī)變量系列統(tǒng)計(jì)參數(shù)的估計(jì)估算方法有:
矩法;
適線法;
極大似然法;
權(quán)函數(shù)法;………水文隨機(jī)變量的總體是無限的,這就需要在總體不知道的情43現(xiàn)行水文頻率計(jì)算方法~配線法(適線法)是以經(jīng)驗(yàn)頻率點(diǎn)據(jù)為基礎(chǔ),在一定的適線準(zhǔn)則下,求解與經(jīng)驗(yàn)點(diǎn)據(jù)擬合最優(yōu)的頻率曲線參數(shù),這是一種較好的參數(shù)估計(jì)方法,是我國估計(jì)洪水頻率曲線統(tǒng)計(jì)參數(shù)的主要方法?,F(xiàn)行水文頻率計(jì)算方法~配線法(適線法)是以經(jīng)44有關(guān)的概念介紹:1)經(jīng)驗(yàn)頻率及經(jīng)驗(yàn)頻率曲線:【例】已知某地年降雨量的觀測資料(n=12),并由大到小排列,按計(jì)算頻率。式中,P:大于或等于某一變量值x的經(jīng)驗(yàn)頻率;m:x由大到小排列的序號,即在n次觀測資料中出現(xiàn)大于或等于某一值x的次數(shù)。有關(guān)的概念介紹:1)經(jīng)驗(yàn)頻率及經(jīng)驗(yàn)頻率曲線:【例】已知45經(jīng)驗(yàn)頻率計(jì)算表:n=12經(jīng)驗(yàn)頻率計(jì)算表:n=1246其反映年降雨量(Xx)的經(jīng)驗(yàn)頻率P(Xx)和x的關(guān)系。隨著樣本容量n的增加,頻率P就非常接近于概率,而該經(jīng)驗(yàn)分布曲線就非常接近于總體的分布曲線。由此得到經(jīng)驗(yàn)分布曲線:P(Xx)x其反映年降雨量(Xx)的經(jīng)驗(yàn)頻率P(Xx)和x的47注意:樣本的每一項(xiàng)的經(jīng)驗(yàn)頻率用公式P=m/n進(jìn)行計(jì)算,當(dāng)m=n時(shí),P=100%,說明樣本的最末項(xiàng)為總體的最小值,這是不合理的。故必須進(jìn)行修正,中國常采用下面的公式進(jìn)行計(jì)算:經(jīng)驗(yàn)頻率的計(jì)算公式:這樣,當(dāng)m=n=12
時(shí),該公式在水文計(jì)算中通常稱為期望公式注意:樣本的每一項(xiàng)的經(jīng)驗(yàn)頻率用公式P=m/n進(jìn)行計(jì)算,當(dāng)m=48
所謂的重現(xiàn)期是指某一隨機(jī)事件在很長時(shí)期內(nèi)平均多長時(shí)間出現(xiàn)一次(水文學(xué)中常稱為“多少年一遇”)。即在許多試驗(yàn)中,某一隨機(jī)事件重復(fù)出現(xiàn)的時(shí)間間隔的平均數(shù),即平均的重現(xiàn)間隔期。在水文分析中,重現(xiàn)期可以等效地替代頻率。2)重現(xiàn)期所謂的重現(xiàn)期是指某一隨機(jī)事件在很長時(shí)期內(nèi)平49a.當(dāng)研究洪水或暴雨問題
水文上關(guān)心的是大于某洪水或某暴雨量發(fā)生的頻率,因此,重現(xiàn)期指在很長時(shí)期N年內(nèi),出現(xiàn)大于某水文變量XP事件的平均重現(xiàn)的間隔期T:式中,T:重現(xiàn)期,以年計(jì);
P:大于某水文變量XP事件的頻率,頻率P與重現(xiàn)期T關(guān)系的兩種表示法:a.當(dāng)研究洪水或暴雨問題式中,T:重現(xiàn)期,以年計(jì);頻率P50
水文上關(guān)心的是小于xP的事件出現(xiàn)的頻率及相應(yīng)的重現(xiàn)期。重現(xiàn)期指在很長的時(shí)期內(nèi)(N年)出現(xiàn)小于某水文變量xP事件的平均重現(xiàn)間隔期。若水文變量大于xP的頻率為P
,則小于xP事件的頻率應(yīng)為1-P,在N年內(nèi)小于xP事件出現(xiàn)的次數(shù)應(yīng)為N(1-P),因此其重現(xiàn)期為:b.當(dāng)研究枯水問題水文上關(guān)心的是小于xP的事件出現(xiàn)的頻率及相應(yīng)51具體求解步驟:a
根據(jù)實(shí)測樣本資料進(jìn)行點(diǎn)繪[縱坐標(biāo)為隨機(jī)變量X=x,橫坐標(biāo)為對應(yīng)的經(jīng)驗(yàn)頻率P(Xx)],經(jīng)驗(yàn)頻率計(jì)算公式為:b
假定一組參數(shù)
,可選用矩法的估值作為的初始值,一般不求CS,假定,K為比例系數(shù),可選K=1.5,2,2.5,3...3)適線法(配線法)的步驟已知:經(jīng)驗(yàn)頻率分布,求:總體分布參數(shù)具體求解步驟:b假定一組參數(shù),可選用矩法52d根據(jù)選定的參數(shù),由P-III型曲線離均系數(shù)值(附表1)或P-III型曲線模比系數(shù)KP值表(附表2),求出xP~P
的頻率曲線,將其繪在有經(jīng)驗(yàn)點(diǎn)據(jù)的同一張圖上,看它們的配合好壞,若不理想,則修改有關(guān)的參數(shù)(主要調(diào)整CV及K=CS/CV),重復(fù)以上的步驟,重新配線;c選定線型,對于水文的隨機(jī)變量,一般選P-III型;e根據(jù)配合的情況,選出一配合最佳的頻率曲線作為采用曲線,則相應(yīng)的參數(shù)作為總體參數(shù)的估值。d根據(jù)選定的參數(shù),由53PxP
適線法的實(shí)質(zhì)是通過樣本經(jīng)驗(yàn)分布來推求總體分布,適線法的關(guān)鍵在于“最佳配合”的判別。經(jīng)驗(yàn)點(diǎn)據(jù)理論頻率曲線PxP適線法的實(shí)質(zhì)是通過樣本經(jīng)驗(yàn)分布來推求總體分布,適線54為避免修改參數(shù)的盲目性,要了解參數(shù)對頻率曲線形狀的影響:a)值愈大,頻率曲線位置愈高;xPPPxPPxPc)CS值愈大,頻率曲線上段變陡,下段變緩,中部向左偏。b)CV值愈大,頻率曲線愈陡;為避免修改參數(shù)的盲目性,要了解參數(shù)556.5.1相關(guān)關(guān)系的概念
水文現(xiàn)象中許多變量不是孤立的,相互之間存在聯(lián)系,則分析研究二個(gè)或二個(gè)以上隨機(jī)變量之間的關(guān)系,稱作相關(guān)關(guān)系。6.5相關(guān)分析6.5.1相關(guān)關(guān)系的概念6.5相關(guān)分析56
如果兩個(gè)變量x,y,其中變量x的每一個(gè)值,變量y都有一個(gè)或多個(gè)確定值與之對應(yīng),而且x,y成函數(shù)關(guān)系,即x,y的關(guān)系點(diǎn)完全落在直線或曲線上,則稱這二個(gè)變量是完全相關(guān)的。完全相關(guān)yx完全相關(guān)(函數(shù)關(guān)系〕直線關(guān)系曲線關(guān)系二個(gè)隨機(jī)變量之間的關(guān)系有以下三種情況:如果兩個(gè)變量x,y,其中變量x的每一個(gè)值57零相關(guān)YXb.零相關(guān)(沒有關(guān)系)如果兩個(gè)變量x,y之間互不影響互不相關(guān),則稱這二個(gè)變量沒有關(guān)系或零相關(guān)。即x,y的關(guān)系點(diǎn)毫無規(guī)律,十分分散。零相關(guān)YXb.零相關(guān)(沒有關(guān)系)如果兩個(gè)58yx如果兩個(gè)變量x,y之間關(guān)系介于以上二者之間,x,y的關(guān)系點(diǎn)雖有點(diǎn)分散,但有明顯的趨勢,數(shù)學(xué)上可以用一定的表達(dá)式進(jìn)行擬合。則稱這二個(gè)變量關(guān)系為:
統(tǒng)計(jì)相關(guān)或相關(guān)關(guān)系。統(tǒng)計(jì)相關(guān)c.統(tǒng)計(jì)相關(guān)(相關(guān)關(guān)系〕yx如果兩個(gè)變量x,y之間關(guān)系介于以上二者59a.確定二個(gè)變量間相關(guān)關(guān)系的數(shù)學(xué)表達(dá)式,以相關(guān)方程或回歸方程表示,用以由已知變量推求未知變量;b.判斷二個(gè)變量間相關(guān)關(guān)系的密切程度,用一稱為相關(guān)系數(shù)的參數(shù)來表示。水文計(jì)算中的相關(guān)分析的主要任務(wù):a.確定二個(gè)變量間相關(guān)關(guān)系的數(shù)學(xué)表達(dá)式,60水文計(jì)算中,一般處理兩個(gè)變量間的相關(guān)關(guān)系,稱簡相關(guān),有時(shí)也要處理三個(gè)或三個(gè)以上變量關(guān)系,稱為復(fù)相關(guān)。簡相關(guān)可分為直線相關(guān)和曲線相關(guān)。曲線相關(guān)直線相關(guān)6.5.2
簡相關(guān)水文計(jì)算中,一般處理兩個(gè)變量間的相關(guān)關(guān)系,稱61圖解法:根據(jù)實(shí)測值,將對應(yīng)點(diǎn)繪于方格紙上,如果點(diǎn)群分布平均趨勢為一直線,則可以直線來近似代表這種相關(guān)關(guān)系。通過點(diǎn)群中心目估繪出一條直線,然后在圖上量出直線的斜率a和截距b,則直線方程:
y=a+bx即為所求的相關(guān)方程。該方法簡便實(shí)用,而且一般情況下精度可以保證。1)回歸方程及其誤差分析圖解法:1)回歸方程及其誤差分析62相關(guān)分析法:若相關(guān)點(diǎn)分布較散,目估定線有一定任意性,為保證一定精確性,最好采用分析法來確定相關(guān)線的方程。設(shè)該直線方程形式為:
y=a+bx式中,x:自變量y:倚變量a,b:分別為一常數(shù),待定。則相關(guān)點(diǎn)與直線在縱軸方向必然存在離差。相關(guān)分析法:若相關(guān)點(diǎn)分布較散,目估定線有一定任意性,為保63配合曲線與觀測點(diǎn)在縱軸方向的離差為:xiy配合曲線與觀測點(diǎn)在縱軸方向的離差為:xiy64要求配合曲線與所有的觀測點(diǎn)能“最佳”擬合,即滿足所有的觀測點(diǎn)的離差y的平方和為最小,即:分別對a,b求一階偏導(dǎo)數(shù),并令其為零:要求配合曲線與所有的觀測點(diǎn)能“最佳”擬合,即65求解上列兩聯(lián)立方程式,可得求解上列兩聯(lián)立方程式,可得66式中,:分別為x,y系列的均方差/標(biāo)準(zhǔn)差; :分別為x,y系列的平均值; :x,y系列的變差系數(shù)(按不偏估計(jì)公式計(jì)算):
:相關(guān)系數(shù);Kxi,Kyi:分別為xi,yi系列的模比系數(shù):式中,:分別為x,y系列的均67為回歸線的斜率,稱y為x倚的回歸系數(shù)(8-37)式即為y倚x的回歸方程,其曲線稱為回歸線/相關(guān)線(僅是對點(diǎn)據(jù)擬合最佳一條線),亦可表示為:將
,
代入y=a+bx中得:為回歸線的斜率,稱y為x倚的回歸系數(shù)(8-37)式即68注意:由于x,y并非確定性關(guān)系,對于x=x0,無法知道其相應(yīng)的真正值y0,通過回歸方程求到:僅僅是真正值y0的一個(gè)估計(jì)值。故其與真正值y0存在偏差。根據(jù)統(tǒng)計(jì)學(xué)的研究,由于隨機(jī)因素的影響,y0在估計(jì)值上下波動呈正態(tài)分布,其均方誤差可用公式表示。注意:由于x,y并非確定性關(guān)系,對于x=x69式中,Sy:y倚x回歸線的均方誤;
yi
:觀測點(diǎn)的縱坐標(biāo)值;y:由回歸方程求到的縱坐標(biāo)值;n:觀測項(xiàng)的數(shù)目
y倚x回歸線的均方誤估算公式:如前所述,可以用均方誤進(jìn)行誤差分析,即對于任一固定的x=x0值,若以作為y的估值,其誤差不超過Sy的可能性為68.3%;其誤差不超過3Sy的可能性為99.7%。式中,Sy:y倚x回歸線的均方誤; y倚x回歸線的均方誤70另外,可以證明回歸線的均方誤與系列標(biāo)準(zhǔn)差及相關(guān)系數(shù)
有以下關(guān)系:式中,為y系列的標(biāo)準(zhǔn)差(無偏估計(jì)量)根據(jù)均方誤公式,也可以用
2來判斷相關(guān)程度:
若
2=1,Sy=0,則y=yi
,屬函數(shù)關(guān)系;
若
2=0,Sy=y,誤差最大,屬零相關(guān);
若0<
2<1,為統(tǒng)計(jì)相關(guān),
2
1,x,y關(guān)系愈密切。可知,均方誤Sy值愈大,則回歸方程的誤差愈大。另外,可以證明回歸線的均方誤與系列標(biāo)準(zhǔn)差及相71相關(guān)系數(shù)的均方誤可用下式來估算:式中,為相關(guān)系數(shù);n為觀測項(xiàng)數(shù)。相關(guān)系數(shù)是根據(jù)有限的實(shí)測資料(樣本)計(jì)算出來的,故相關(guān)系數(shù)也不免帶有抽樣誤差
故水文上為了推斷二個(gè)變量的相關(guān)性,必須對樣本相關(guān)系數(shù)作統(tǒng)計(jì)檢驗(yàn)。相關(guān)系數(shù)的均方誤:相關(guān)系數(shù)的均方誤可用下式來估算:式中,為相關(guān)系數(shù);72相關(guān)系數(shù)的統(tǒng)計(jì)檢驗(yàn)的思路---反證法:
檢驗(yàn)二個(gè)變量是否相關(guān),先假定二個(gè)變量不相關(guān),由此如果導(dǎo)致“不合理的現(xiàn)象”發(fā)生,則表明原先的假定不成立,拒絕“不相關(guān)”的假定,如果沒有導(dǎo)致“不合理現(xiàn)象”發(fā)生,則原假定成立,稱原假定是相容的。這里所謂的“不合理”不是指形式邏輯上的絕對矛盾,而是基于實(shí)踐中廣泛采用的一個(gè)原則:
"小概率事件在一次觀測中是不可能發(fā)生的"。相關(guān)系數(shù)的統(tǒng)計(jì)檢驗(yàn):相關(guān)系數(shù)的統(tǒng)計(jì)檢驗(yàn)的思路---反證法:相關(guān)系數(shù)的統(tǒng)計(jì)檢驗(yàn)73-
α0+
αf(r)樣本相關(guān)系數(shù)密度曲線示意圖具體的檢驗(yàn)步驟:
假設(shè)兩變量X,Y在總體上不相關(guān);
從不相關(guān)的兩變量總體中抽出大量的樣本(如n個(gè)),進(jìn)行相關(guān)分析,并分別計(jì)算各樣本的相關(guān)系數(shù)1,2,…n,由于假設(shè)總體不相關(guān),可以判斷1,2,…n,為較小值的可能性大,而較大值的可能性小,其概率分布密度曲線f(r)~r如右圖所示:-α0+αf(r)樣本相關(guān)系數(shù)74
選定一個(gè)衡量事件發(fā)生可能性(概率)很小的指標(biāo)(水文統(tǒng)計(jì)學(xué)中稱顯著性水平),對于容量為n的樣本,則有一相應(yīng)的臨界值(為較大值),樣本相關(guān)系數(shù)(根據(jù)原先假定
應(yīng)為很小的值)
超過±的可能性(概率)應(yīng)為較小值(水文上一般選
=0.05或0.01作為小概率),即:由于
值很小,故≥為一小概率事件.選定一個(gè)衡量事件發(fā)生可能性(概率)很小的指標(biāo)(水文統(tǒng)計(jì)學(xué)75
取某一個(gè)具體的樣本所計(jì)算的
與作比較,以判斷總體是否相關(guān):
若≥,說明樣本相關(guān)系數(shù)絕對值較大,且超過了臨界值,說明“小概率事件”發(fā)生了,則原先的假定是不能接受的,總體很大可能性是相關(guān)的。
若≤,說明樣本相關(guān)系數(shù)絕對值較小,未超過臨界值,則原先的假定可以成立,即總體很大可能性是不相關(guān)的。實(shí)用上,可查n~~(表8-7,p158)求取某一個(gè)具體的樣本所計(jì)算的與作比較,以判斷76不同顯著性水平下所需相關(guān)系數(shù)最低值n-2(n為樣本容量)0.10.050.020.0180.54940.63190.71550.764690.52140.60210.68510.7348100.49730.57600.65810.7079……………120.45750.53240.61200.6614……………1000.16380.19460.23010.2540不同顯著性水平下所需相關(guān)系數(shù)最低值n-20.10.0577則上式可寫成:
----直線關(guān)系故可按直線相關(guān)的方法求Y與X的回歸方程,再還原成y與x的函數(shù)關(guān)系。6.5.3
曲線相關(guān)1)冪函數(shù)方程二邊取對數(shù):令:則上式可寫成:故可按直線相關(guān)的方法求Y與X的回歸方程,再還原78故可按直線相關(guān)的方法求Y倚X的回歸方程,再還原成y與x的函數(shù)關(guān)系則上式可寫成----直線關(guān)系2)指數(shù)函數(shù)方程二邊取對數(shù):令故可按直線相關(guān)的方法求Y倚X的回歸方程,再還原成y79End!End!80第四章、水文統(tǒng)計(jì)學(xué)隨機(jī)變量及其分布參數(shù)水文中常用的概率分布曲線統(tǒng)計(jì)參數(shù)估計(jì)方法相關(guān)分析水文時(shí)間序列分析第四章、水文統(tǒng)計(jì)學(xué)隨機(jī)變量及其分布參數(shù)81學(xué)習(xí)要求:(1)了解概率、隨機(jī)變量及其概率分布的基本概念;
(2)了解水文頻率曲線常用的線型,要掌握P-III型分布曲線和經(jīng)驗(yàn)頻率曲線的性質(zhì)和計(jì)算方法;
(3)掌握水文頻率計(jì)算適線法的具體步驟和方法,特別是參數(shù)對頻率曲線的影響;
(5)了解相關(guān)分析的基本概念和方法,特別要掌握兩變量直線相關(guān)、曲線相關(guān)的方法和具體步驟;(6)水文過程的隨機(jī)模擬。
學(xué)習(xí)要求:
82水文現(xiàn)象具有二重性:水文現(xiàn)象包含著必然性水文現(xiàn)象也包含著偶然性,對水文的偶然現(xiàn)象(或稱隨機(jī)現(xiàn)象)所遵循的規(guī)律一般稱做統(tǒng)計(jì)規(guī)律。物理成因分析法概率論和數(shù)理統(tǒng)計(jì)分析方法水文現(xiàn)象具有二重性:水文現(xiàn)象也包含著偶然性834.1.1概率的基本概念與定理1.事件:是指隨機(jī)試驗(yàn)的結(jié)果。事件有兩種屬性:
數(shù)量性質(zhì):直接測量的量或計(jì)算的量,如年降雨量,年徑流量...
屬性性質(zhì):
直接觀測到的現(xiàn)象,如天氣的雨天和晴天,嬰兒性別,錢幣的正面和背面...4.1.隨機(jī)變量及其分布參數(shù)4.1.1概率的基本概念與定理4.1.隨機(jī)變量及其分841)必然事件2)不可能事件3)隨機(jī)事件事件可以分為三種類型:2.概率
為了比較某隨機(jī)事件出現(xiàn)(或不出現(xiàn))的可能性大小,必然賦予一種量化的(以數(shù)量表示)指標(biāo),這個(gè)數(shù)量指標(biāo)就是事件的概率。1)必然事件事件可以分為三種類型:2.概率85
式中,P(A):一定條件下隨機(jī)事件A的概率;
n:試驗(yàn)中所有可能的出現(xiàn)的結(jié)果數(shù);
m:出現(xiàn)隨機(jī)事件A的結(jié)果數(shù)。簡單(古典)的隨機(jī)事件的概率定義用下式表示:古典的隨機(jī)試驗(yàn)是指所有試驗(yàn)的可能結(jié)果都是等可能的,而且試驗(yàn)的可能結(jié)果的總數(shù)是有限的。但水文事件不一定符合這種性質(zhì)。 式中,P(A):一定條件下隨機(jī)事件A的概86對于不是古典概型事件,只能通過多次重復(fù)試驗(yàn)來估計(jì)事件的概率。設(shè)事件A在n次隨機(jī)試驗(yàn)中出現(xiàn)了m次,則稱:3.頻率為事件A在n次試驗(yàn)中出現(xiàn)的頻率。注意:n
不是所有可能的結(jié)果總數(shù),僅是隨機(jī)試驗(yàn)的次數(shù)。對于不是古典概型事件,只能通過多次重復(fù)試驗(yàn)來估計(jì)事件87頻率:
頻率是通過若干次試驗(yàn)后才能求得的經(jīng)驗(yàn)值,事先不能確定,當(dāng)試驗(yàn)次數(shù)n愈大,即當(dāng)n趨于無窮大時(shí),理論上,n變成試驗(yàn)中所有可能的結(jié)果總數(shù),則頻率愈接近概率。概率和頻率的區(qū)別:概率:
在等可能條件下,表達(dá)事件客觀上出現(xiàn)的可能性大小,是一個(gè)理論值。頻率:概率和頻率的區(qū)別:概率:
在等可能條件881.隨機(jī)變量
用以表示隨機(jī)試驗(yàn)結(jié)果的一個(gè)數(shù)量(事先是未知的),由于它事先不能確定,是隨機(jī)的,稱為隨機(jī)變量。水文現(xiàn)象中的隨機(jī)變量,一般指某個(gè)水文特征值(如年徑流量、年降雨量、洪峰流量等)。4.1.2.隨機(jī)變量及其分布參數(shù)1.隨機(jī)變量4.1.2.隨機(jī)變量及其分布參數(shù)89
總體
在統(tǒng)計(jì)數(shù)學(xué)中,把某種隨機(jī)變量所取數(shù)值的全體,稱為總體。如年徑流量的總體數(shù)是無窮的。統(tǒng)計(jì)學(xué)中幾個(gè)概念:
樣本
從總體中不帶主觀成分任意抽取的一部分,稱為樣本。樣本所包含的項(xiàng)數(shù),稱為樣本容量。如實(shí)測的水文資料是有限的,是一樣本??傮w統(tǒng)計(jì)學(xué)中幾個(gè)概念:樣本90
它是指隨機(jī)試驗(yàn)結(jié)果的一個(gè)數(shù)量。在水文學(xué)中,常用大寫字母表示,記作X,而隨機(jī)變量的可能取的值記作x,即:
X=x1,X=x2,
X=xn
一般稱之為隨機(jī)系列或隨機(jī)數(shù)列。
隨機(jī)變量的表示:它是指隨機(jī)試驗(yàn)結(jié)果的一個(gè)數(shù)量。在水文學(xué)中,常用大寫字91離散型隨機(jī)變量
隨機(jī)變量僅取得區(qū)間內(nèi)某些間斷的離散值,則稱為離散型隨機(jī)變量。如洪峰次數(shù),只能取0,1,2…,不能取相鄰兩數(shù)值之間的任何值。隨機(jī)變量的分類:連續(xù)型隨機(jī)變量
隨機(jī)變量可以取得一個(gè)有限區(qū)間內(nèi)的任何數(shù)值,則稱為連續(xù)型隨機(jī)變量。如某河流斷面的流量可以取0~極限值之間的任何實(shí)數(shù)值。離散型隨機(jī)變量隨機(jī)變量的分類:連續(xù)型隨機(jī)變量92對于離散型隨機(jī)變量:
隨機(jī)變量的取某一可能值的機(jī)會有的大有的小,即隨機(jī)變量取值都有一定的概率與之相對應(yīng),可表示為:2.隨機(jī)變量的概率分布
上式中P1,P2,…Pn
表示隨機(jī)變量X
取值x1,x2,…xn
所對應(yīng)的概率。對于離散型隨機(jī)變量:2.隨機(jī)變量的概率分布93
x1x2x3x4……xnXP
離散型隨機(jī)變量概率分布圖一般將這種對應(yīng)關(guān)系稱作隨機(jī)變量的概率分布規(guī)律,簡稱為分布律。可以用以下的分布圖形表示:x1x2x3x4…94
由于它的所有可能取值有無限個(gè),而取個(gè)別值的概率為零,故無法研究個(gè)別值的概率。水文學(xué)上習(xí)慣研究隨機(jī)變量的取值等于或大于某個(gè)值的概率,表示為:
它是x的函數(shù),稱作隨機(jī)變量X的分布函數(shù),記作F(x),即F(x)=P(Xx)
表示隨機(jī)變量X大于或等于值
x的概率,其幾何曲線稱作隨機(jī)變量的概率分布曲線(水文學(xué)上通常稱累計(jì)頻率曲線,簡稱頻率曲線)。
對于連續(xù)型隨機(jī)變量:由于它的所有可能取值有無限個(gè),而取個(gè)別值的概95
由圖中可知,X=900,相應(yīng)的P(Xx)=0.15,說明大于900mm降雨的可能性為15%;同理,大于500mm降雨的可能性為60%00.20.40.60.81.0500900年降雨量(mm)某站年雨量概率分布曲線
P(Xx)由圖中可知,X=900,相應(yīng)的P(Xx)=96
P(Xx)=P(X>x+x)+P(x+x>Xx)
P(x+x>Xx)=P(Xx)-P(X>x+x)=F(x)-F(x+x)
(8-1)由概率的加法定理:則,降雨量落在900和500mm的可能性為:60%-15%=45%
x
x+
x
PXP(Xx)P(X>x+x)隨機(jī)變量X落在(x,x+x)
的概率可用下式表示:
P(Xx)=P(X>x+x)+97平均概率密度:
隨機(jī)變量落在區(qū)間(x,x+x)的概率與該區(qū)間長度的比值稱作隨機(jī)變量落在區(qū)間(x,x+x)平均概率。概率密度函數(shù):平均概率密度:隨機(jī)變量落在區(qū)間(x,x+x)98稱f(x)為概率密度函數(shù),簡稱密度函數(shù)。而密度函數(shù)的幾何曲線稱作密度曲線。當(dāng)x
0,取極限得:稱f(x)為概率密度函數(shù),簡稱密度函數(shù)。當(dāng)x099f(x)f(xi)F(x)xi密度曲線分布曲線xxdxf(x)f(xi)F(x)xi密度曲線分布曲線xxdx100通過密度函數(shù)f(x)可求出隨機(jī)變量X落在(x~x+dx)區(qū)間即dx上的概率=f(x)dx,稱之為概率元素,即為圖中的陰影面積;通過密度函數(shù)f(x)可求出隨機(jī)變量X概率分布函數(shù)F(x),其與密度函數(shù)f(x)有如下的數(shù)學(xué)關(guān)系:通過密度函數(shù)f(x)可求出隨機(jī)變量X落在(x~x+dx101
F(x)分布函數(shù),反映隨機(jī)變量X超過某個(gè)值x的概率。這兩個(gè)函數(shù)能完整地描述隨機(jī)變量的分布規(guī)律。
f(x)密度函數(shù),反映隨機(jī)變量X落入dx區(qū)間的平均概率;可見,隨機(jī)變量的二個(gè)函數(shù):
F(x)分布函數(shù),反映隨機(jī)變量X超過某個(gè)值x的102
在實(shí)際問題中,隨機(jī)變量的分布函數(shù)不易確定,或有時(shí)不一定需要用完整的形式來說明隨機(jī)變量,而只要知道其主要特征就可以。隨機(jī)變量的分布函數(shù)和密度函數(shù)中都包含一些參數(shù)(如均值、變差系數(shù)、偏態(tài)系數(shù)),而這些參數(shù)能反映隨機(jī)變量分布的特點(diǎn):如有的分布集中,有的分布分散,有的分布對稱,有的分布非對稱,等等。在統(tǒng)計(jì)學(xué)中用以表示隨機(jī)變量這些分布特征的某些數(shù)值,稱之為隨機(jī)變量統(tǒng)計(jì)參數(shù)。3.隨機(jī)變量統(tǒng)計(jì)參數(shù)在實(shí)際問題中,隨機(jī)變量的分布函數(shù)不易確定,或有時(shí)不一103平均數(shù)/數(shù)學(xué)期望離散型隨機(jī)變量的平均數(shù)是以概率為權(quán)重的加權(quán)平均值。a.反映位置特征參數(shù)
對于離散型隨機(jī)變量:平均數(shù)/數(shù)學(xué)期望離散型隨機(jī)變量的平均數(shù)是以104
式中,a、b分別為隨機(jī)變量X取值的上下限。
數(shù)學(xué)期望或平均數(shù)代表整個(gè)隨機(jī)變量的總水平的高低,它為分布的中心。
對于連續(xù)的隨機(jī)變量:式中,a、b分別為隨機(jī)變量X取值的上下限。105
表示概率密度分布峰點(diǎn)所對應(yīng)的數(shù)。對于離散型隨機(jī)變量:
M0(x)
是使概率P(=xi)等于最大時(shí)所相應(yīng)的xi值。M0(x)=xiPi-1PiPi+1
Px離散型隨機(jī)變量的眾數(shù)眾數(shù),記為M0(x)表示概率密度分布峰點(diǎn)所對應(yīng)的數(shù)。M0(x)=106M0(x)是概率密度函數(shù)f(x)等于最大時(shí)所對應(yīng)的xi值M0(x)f(x)x連續(xù)的隨機(jī)變量的眾數(shù)對于連續(xù)型隨機(jī)變量:M0(x)是概率密度函數(shù)f(x)等于最大107把概率密度分布分為二個(gè)相等部分的數(shù)。對于離散型的隨機(jī)變量:
將所有變量的可能取值按大小次序排列,位置居中的數(shù)字。中位數(shù),記為Me(x)把概率密度分布分為二個(gè)相等部分的數(shù)。中位108對于連續(xù)的隨機(jī)變量中位數(shù)滿足:式中,a,b分別為隨機(jī)變量X取值的上下限Me(x)xf(x)1/21/2ab對于連續(xù)的隨機(jī)變量式中,a,b分別為隨機(jī)變量X109
該參數(shù)用以反映隨機(jī)變量分布離散程度(相對于隨機(jī)變量分布中心即平均值的差距)的指標(biāo),通常有以下幾種:b.反映離散特征參數(shù)
值愈大,分布愈分散;值愈小,分布愈集中。
標(biāo)準(zhǔn)差(均方差)
(Standarddeviation)(8-6)122>1f(x)x標(biāo)準(zhǔn)差對密度函數(shù)的影響該參數(shù)用以反映隨機(jī)變量分布離散程度(相對于隨110變差系數(shù)(離差系數(shù),離勢系數(shù)〕CV1CV2CV2>CV1f(x)x變差系數(shù)對密度函數(shù)的影響CV值愈大,分布愈分散;CV
值愈小,分布愈集中。對于均值不同的二個(gè)系列,用均方差來比較其離散程度就不合適,則要采用均方差和均值的比來表示:變差系數(shù)(離差系數(shù),離勢系數(shù)〕CV1CV2CV2>CV111f(x)x偏態(tài)系數(shù)對密度函數(shù)的影響Cs=0Cs>0Cs<0若不對稱:CS
>0,稱為正偏;CS
<0,稱為負(fù)偏。c.反映對稱特征的參數(shù):
偏態(tài)系數(shù)(偏差系數(shù))f(x)x偏態(tài)系數(shù)對密度函數(shù)的影響Cs=0Cs>0Cs<0若1124.2.水文中常用的概率分布曲線1.正態(tài)分布(8-9)式中,:平均數(shù);
:標(biāo)準(zhǔn)差。
許多隨機(jī)變量如水文測量誤差、抽樣誤差等一般服從正態(tài)分布。4.2.水文中常用的概率分布曲線1.正態(tài)分布(8-9)式中,113f(x)
a.單峰,只有一個(gè)眾數(shù);b.對于平均數(shù)對稱,Cs=0;c.曲線二端趨于±∞,并以x軸為漸近線;d.正態(tài)分布曲線的特點(diǎn):f(x)a.單峰,只有一個(gè)眾數(shù);正態(tài)分布曲線的特點(diǎn):114概率密度函數(shù)表達(dá)式:
2.皮爾遜Ⅲ型分布式中,()~的伽瑪函數(shù),,,a
0:三個(gè)參數(shù),它們與三個(gè)統(tǒng)計(jì)參數(shù)有一定的關(guān)系,其表達(dá)式為:可見,當(dāng)以上三個(gè)參數(shù)確定后,P-III型密度函數(shù)亦完全確定。概率密度函數(shù)表達(dá)式: 2.皮爾遜Ⅲ型分布式中,(115f(x)皮爾遜Ⅲ型概率密度曲線
a0M0(x)Me(x)xPxP-III型曲線的特點(diǎn):一端有限另一端無限的不對稱單峰正偏曲線f(x)皮爾遜Ⅲ型概率密度曲線a0M0(x)Me(x)x116在水文計(jì)算中,一般要求出指定概率P所相應(yīng)的隨機(jī)變量的取值xP,即求出的xP滿足下列等式:按上式計(jì)算相當(dāng)復(fù)雜,故實(shí)用中,采用標(biāo)準(zhǔn)化變換:取標(biāo)準(zhǔn)變量(離均系數(shù)),即代入上式,,
,a0以相應(yīng)的和關(guān)系式表示,簡化后得:在水文計(jì)算中,一般要求出指定概率P所相應(yīng)1170.031.302.473.384.160.20.021.292.403.233.940.10.001.282.333.093.720.0501010.10.01P(%)pCsP-III型曲線離均系數(shù)
P值表注:詳表見附表1,p266被積函數(shù)含有參數(shù),Cs,而包含在
中,制成對應(yīng)關(guān)系表:0.031.302.473.384.160.20.021.2118因此,由給定的CS
及P,從P-III型曲線離均系數(shù)
值表,查出P,再由下式求:
即求出指定概率P所相應(yīng)的隨機(jī)變量的取值xP因此,由給定的CS及P,從P-III型曲線119已知:某地年平均降雨量
=1000mm,CV=0.5,CS=1.0,若年降雨量符合P-III型分布試求:P=1%
的年降雨量。【算例】求解:由CS=1.0及P=1%,查附表1得p=3.02已知:某地年平均降雨量=1000mm,CV=120引入模比系數(shù):
另一種求解方法:由由此建立的對應(yīng)數(shù)值關(guān)系[P-III型曲線模比系數(shù)KP
值表(見附表2)]上例的解法:由CV=0.5,CS
=1.0=2
CV
,P=1%查附表2得:引入模比系數(shù):另一種求解方法:由由此建立的121P-III型曲線模比系數(shù)KP值表(附表2,P266)
P(%)CV0.010.10.20.330.512510205075909599(一)
CS=CV0.051.191.161.151.141.131.121.111.091.071.041.000.970.940.920.89……………………………………1.5011.68.858.027.366.876.005.113.923.002.040.64-0.10-0.53-0.70-0.89(二)CS=1.5CV0.05(三)CS=2CV。。。。。。(三)CS=6CVP-III型曲線模比系數(shù)KP值表(附表2,P266)122
水文隨機(jī)變量的總體是無限的,這就需要在總體不知道的情況下,靠抽出的樣本(觀測的系列)去估計(jì)總體參數(shù)。4.3.隨機(jī)變量系列統(tǒng)計(jì)參數(shù)的估計(jì)估算方法有:
矩法;
適線法;
極大似然法;
權(quán)函數(shù)法;………水文隨機(jī)變量的總體是無限的,這就需要在總體不知道的情123現(xiàn)行水文頻率計(jì)算方法~配線法(適線法)是以經(jīng)驗(yàn)頻率點(diǎn)據(jù)為基礎(chǔ),在一定的適線準(zhǔn)則下,求解與經(jīng)驗(yàn)點(diǎn)據(jù)擬合最優(yōu)的頻率曲線參數(shù),這是一種較好的參數(shù)估計(jì)方法,是我國估計(jì)洪水頻率曲線統(tǒng)計(jì)參數(shù)的主要方法?,F(xiàn)行水文頻率計(jì)算方法~配線法(適線法)是以經(jīng)124有關(guān)的概念介紹:1)經(jīng)驗(yàn)頻率及經(jīng)驗(yàn)頻率曲線:【例】已知某地年降雨量的觀測資料(n=12),并由大到小排列,按計(jì)算頻率。式中,P:大于或等于某一變量值x的經(jīng)驗(yàn)頻率;m:x由大到小排列的序號,即在n次觀測資料中出現(xiàn)大于或等于某一值x的次數(shù)。有關(guān)的概念介紹:1)經(jīng)驗(yàn)頻率及經(jīng)驗(yàn)頻率曲線:【例】已知125經(jīng)驗(yàn)頻率計(jì)算表:n=12經(jīng)驗(yàn)頻率計(jì)算表:n=12126其反映年降雨量(Xx)的經(jīng)驗(yàn)頻率P(Xx)和x的關(guān)系。隨著樣本容量n的增加,頻率P就非常接近于概率,而該經(jīng)驗(yàn)分布曲線就非常接近于總體的分布曲線。由此得到經(jīng)驗(yàn)分布曲線:P(Xx)x其反映年降雨量(Xx)的經(jīng)驗(yàn)頻率P(Xx)和x的127注意:樣本的每一項(xiàng)的經(jīng)驗(yàn)頻率用公式P=m/n進(jìn)行計(jì)算,當(dāng)m=n時(shí),P=100%,說明樣本的最末項(xiàng)為總體的最小值,這是不合理的。故必須進(jìn)行修正,中國常采用下面的公式進(jìn)行計(jì)算:經(jīng)驗(yàn)頻率的計(jì)算公式:這樣,當(dāng)m=n=12
時(shí),該公式在水文計(jì)算中通常稱為期望公式注意:樣本的每一項(xiàng)的經(jīng)驗(yàn)頻率用公式P=m/n進(jìn)行計(jì)算,當(dāng)m=128
所謂的重現(xiàn)期是指某一隨機(jī)事件在很長時(shí)期內(nèi)平均多長時(shí)間出現(xiàn)一次(水文學(xué)中常稱為“多少年一遇”)。即在許多試驗(yàn)中,某一隨機(jī)事件重復(fù)出現(xiàn)的時(shí)間間隔的平均數(shù),即平均的重現(xiàn)間隔期。在水文分析中,重現(xiàn)期可以等效地替代頻率。2)重現(xiàn)期所謂的重現(xiàn)期是指某一隨機(jī)事件在很長時(shí)期內(nèi)平129a.當(dāng)研究洪水或暴雨問題
水文上關(guān)心的是大于某洪水或某暴雨量發(fā)生的頻率,因此,重現(xiàn)期指在很長時(shí)期N年內(nèi),出現(xiàn)大于某水文變量XP事件的平均重現(xiàn)的間隔期T:式中,T:重現(xiàn)期,以年計(jì);
P:大于某水文變量XP事件的頻率,頻率P與重現(xiàn)期T關(guān)系的兩種表示法:a.當(dāng)研究洪水或暴雨問題式中,T:重現(xiàn)期,以年計(jì);頻率P130
水文上關(guān)心的是小于xP的事件出現(xiàn)的頻率及相應(yīng)的重現(xiàn)期。重現(xiàn)期指在很長的時(shí)期內(nèi)(N年)出現(xiàn)小于某水文變量xP事件的平均重現(xiàn)間隔期。若水文變量大于xP的頻率為P
,則小于xP事件的頻率應(yīng)為1-P,在N年內(nèi)小于xP事件出現(xiàn)的次數(shù)應(yīng)為N(1-P),因此其重現(xiàn)期為:b.當(dāng)研究枯水問題水文上關(guān)心的是小于xP的事件出現(xiàn)的頻率及相應(yīng)131具體求解步驟:a
根據(jù)實(shí)測樣本資料進(jìn)行點(diǎn)繪[縱坐標(biāo)為隨機(jī)變量X=x,橫坐標(biāo)為對應(yīng)的經(jīng)驗(yàn)頻率P(Xx)],經(jīng)驗(yàn)頻率計(jì)算公式為:b
假定一組參數(shù)
,可選用矩法的估值作為的初始值,一般不求CS,假定,K為比例系數(shù),可選K=1.5,2,2.5,3...3)適線法(配線法)的步驟已知:經(jīng)驗(yàn)頻率分布,求:總體分布參數(shù)具體求解步驟:b假定一組參數(shù),可選用矩法132d根據(jù)選定的參數(shù),由P-III型曲線離均系數(shù)值(附表1)或P-III型曲線模比系數(shù)KP值表(附表2),求出xP~P
的頻率曲線,將其繪在有經(jīng)驗(yàn)點(diǎn)據(jù)的同一張圖上,看它們的配合好壞,若不理想,則修改有關(guān)的參數(shù)(主要調(diào)整CV及K=CS/CV),重復(fù)以上的步驟,重新配線;c選定線型,對于水文的隨機(jī)變量,一般選P-III型;e根據(jù)配合的情況,選出一配合最佳的頻率曲線作為采用曲線,則相應(yīng)的參數(shù)作為總體參數(shù)的估值。d根據(jù)選定的參數(shù),由133PxP
適線法的實(shí)質(zhì)是通過樣本經(jīng)驗(yàn)分布來推求總體分布,適線法的關(guān)鍵在于“最佳配合”的判別。經(jīng)驗(yàn)點(diǎn)據(jù)理論頻率曲線PxP適線法的實(shí)質(zhì)是通過樣本經(jīng)驗(yàn)分布來推求總體分布,適線134為避免修改參數(shù)的盲目性,要了解參數(shù)對頻率曲線形狀的影響:a)值愈大,頻率曲線位置愈高;xPPPxPPxPc)CS值愈大,頻率曲線上段變陡,下段變緩,中部向左偏。b)CV值愈大,頻率曲線愈陡;為避免修改參數(shù)的盲目性,要了解參數(shù)1356.5.1相關(guān)關(guān)系的概念
水文現(xiàn)象中許多變量不是孤立的,相互之間存在聯(lián)系,則分析研究二個(gè)或二個(gè)以上隨機(jī)變量之間的關(guān)系,稱作相關(guān)關(guān)系。6.5相關(guān)分析6.5.1相關(guān)關(guān)系的概念6.5相關(guān)分析136
如果兩個(gè)變量x,y,其中變量x的每一個(gè)值,變量y都有一個(gè)或多個(gè)確定值與之對應(yīng),而且x,y成函數(shù)關(guān)系,即x,y的關(guān)系點(diǎn)完全落在直線或曲線上,則稱這二個(gè)變量是完全相關(guān)的。完全相關(guān)yx完全相關(guān)(函數(shù)關(guān)系〕直線關(guān)系曲線關(guān)系二個(gè)隨機(jī)變量之間的關(guān)系有以下三種情況:如果兩個(gè)變量x,y,其中變量x的每一個(gè)值137零相關(guān)YXb.零相關(guān)(沒有關(guān)系)如果兩個(gè)變量x,y之間互不影響互不相關(guān),則稱這二個(gè)變量沒有關(guān)系或零相關(guān)。即x,y的關(guān)系點(diǎn)毫無規(guī)律,十分分散。零相關(guān)YXb.零相關(guān)(沒有關(guān)系)如果兩個(gè)138yx如果兩個(gè)變量x,y之間關(guān)系介于以上二者之間,x,y的關(guān)系點(diǎn)雖有點(diǎn)分散,但有明顯的趨勢,數(shù)學(xué)上可以用一定的表達(dá)式進(jìn)行擬合。則稱這二個(gè)變量關(guān)系為:
統(tǒng)計(jì)相關(guān)或相關(guān)關(guān)系。統(tǒng)計(jì)相關(guān)c.統(tǒng)計(jì)相關(guān)(相關(guān)關(guān)系〕yx如果兩個(gè)變量x,y之間關(guān)系介于以上二者139a.確定二個(gè)變量間相關(guān)關(guān)系的數(shù)學(xué)表達(dá)式,以相關(guān)方程或回歸方程表示,用以由已知變量推求未知變量;b.判斷二個(gè)變量間相關(guān)關(guān)系的密切程度,用一稱為相關(guān)系數(shù)的參數(shù)來表示。水文計(jì)算中的相關(guān)分析的主要任務(wù):a.確定二個(gè)變量間相關(guān)關(guān)系的數(shù)學(xué)表達(dá)式,140水文計(jì)算中,一般處理兩個(gè)變量間的相關(guān)關(guān)系,稱簡相關(guān),有時(shí)也要處理三個(gè)或三個(gè)以上變量關(guān)系,稱為復(fù)相關(guān)。簡相關(guān)可分為直線相關(guān)和曲線相關(guān)。曲線相關(guān)直線相關(guān)6.5.2
簡相關(guān)水文計(jì)算中,一般處理兩個(gè)變量間的相關(guān)關(guān)系,稱141圖解法:根據(jù)實(shí)測值,將對應(yīng)點(diǎn)繪于方格紙上,如果點(diǎn)群分布平均趨勢為一直線,則可以直線來近似代表這種相關(guān)關(guān)系。通過點(diǎn)群中心目估繪出一條直線,然后在圖上量出直線的斜率a和截距b,則直線方程:
y=a+bx即為所求的相關(guān)方程。該方法簡便實(shí)用,而且一般情況下精度可以保證。1)回歸方程及其誤差分析圖解法:1)回歸方程及其誤差分析142相關(guān)分析法:若相關(guān)點(diǎn)分布較散,目估定線有一定任意性,為保證一定精確性,最好采用分析法來確定相關(guān)線的方程。設(shè)該直線方程形式為:
y=a+bx式中,x:自變量y:倚變量a,b:分別為一常數(shù),待定。則相關(guān)點(diǎn)與直線在縱軸方向必然存在離差。相關(guān)分析法:若相關(guān)點(diǎn)分布較散,目估定線有一定任意性,為保143配合曲線與觀測點(diǎn)在縱軸方向的離差為:xiy配合曲線與觀測點(diǎn)在縱軸方向的離差為:xiy144要求配合曲線與所有的觀測點(diǎn)能“最佳”擬合,即滿足所有的觀測點(diǎn)的離差y的平方和為最小,即:分別對a,b求一階偏導(dǎo)數(shù),并令其為零:要求配合曲線與所有的觀測點(diǎn)能“最佳”擬合,即145求解上列兩聯(lián)立方程式,可得求解上列兩聯(lián)立方程式,可得146式中,:分別為x,y系列的均方差/標(biāo)準(zhǔn)差; :分別為x,y系列的平均值
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年C語言程序設(shè)計(jì)教案編寫思考
- 革新教學(xué)法:2024年《畫漫畫》教案設(shè)計(jì)
- 探索K2教育:《千人糕》2024課件實(shí)踐分享
- 2023年西方經(jīng)濟(jì)學(xué)考點(diǎn)版本科打印雙面
- 《棗兒》學(xué)術(shù)論文探究
- 湖南省長沙市(2024年-2025年小學(xué)五年級語文)統(tǒng)編版綜合練習(xí)(下學(xué)期)試卷及答案
- 第45屆世界技能大賽山西選拔賽技術(shù)文件-機(jī)電一體化項(xiàng)目技術(shù)文件
- 2024年肺結(jié)核病防治知識課件
- 科目三考試流程-駕考實(shí)操
- 2024年外婆的澎湖灣:地理課件
- 安全生產(chǎn)執(zhí)法課件
- 航空災(zāi)難飛機(jī)墜落事件墜機(jī)事件空難PPT模板
- 《三黑和土地》ppt一
- 工商企業(yè)管理專業(yè)案例分析報(bào)告
- 風(fēng)疹病毒實(shí)驗(yàn)活動風(fēng)險(xiǎn)評估報(bào)告
- AI人工智能(PPT頁)(共37張PPT)
- 中外美術(shù)史年表
- 裝修改造工程施工勞動力計(jì)劃及機(jī)械設(shè)備配置
- 二年級上冊道德與法治10《我們不亂扔》說課稿二篇
- 小學(xué)蘇教版六年級上冊數(shù)學(xué)《分?jǐn)?shù)四則混合運(yùn)算》市級公開課課件
- 蘇州某校蘇教版六年級數(shù)學(xué)上冊第四單元《解決問題的策略》教材分析及全部教案(共含3課時(shí))
評論
0/150
提交評論