第三章-水文統(tǒng)計(jì)原理_第1頁(yè)
第三章-水文統(tǒng)計(jì)原理_第2頁(yè)
第三章-水文統(tǒng)計(jì)原理_第3頁(yè)
第三章-水文統(tǒng)計(jì)原理_第4頁(yè)
第三章-水文統(tǒng)計(jì)原理_第5頁(yè)
已閱讀5頁(yè),還剩124頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三章水文統(tǒng)計(jì)原理第二節(jié)幾率和頻率

2第一節(jié)水文現(xiàn)象的特性和分析方法

31第三節(jié)頻率分布

33第四節(jié)經(jīng)驗(yàn)頻率曲線4第五節(jié)統(tǒng)計(jì)參數(shù)5第六節(jié)理論頻率曲線6第七節(jié)相關(guān)分析7NanjingUniversityofTechnology周期性氣候因素明顯地以年為周期而變化,一年四季氣候條件各不相同,年年如此,循環(huán)不已。因此,直接受氣候因素影響的水文現(xiàn)象,也同樣具有以年為周期而循環(huán)變化的性質(zhì)。每一條河流在一年之內(nèi),都與氣候條件相對(duì)應(yīng),而存在著洪水期、平水期和枯水期的周期性變化規(guī)律;在長(zhǎng)久年代中,還存在著豐水年、平水年和枯水年的年際周期性變化規(guī)律。3.1水文現(xiàn)象的特性和分析方法一、水文現(xiàn)象的特性NanjingUniversityofTechnology周期性3.1水文現(xiàn)象的特性和分析方法周期性就是許多水文現(xiàn)象具有周期循環(huán)變化的性質(zhì)。水文現(xiàn)象有著以年或者年際(若干年)變化的規(guī)律。長(zhǎng)江漢口水文站1954年和1955年流量過(guò)程線NanjingUniversityofTechnology地區(qū)性

地區(qū)性是表示水文現(xiàn)象隨地區(qū)而異,即每個(gè)地區(qū)都有各自的特殊性。南方同北方水文現(xiàn)象差異就很大。這主要是由于地區(qū)而異,影響水文現(xiàn)象的氣候和下墊面條件不同。相互臨近的流域,氣候和下墊面條件往往有一定的相似性,水文現(xiàn)象,在一定程度上就具有相似性。例如我國(guó)南方河流比北方河流汛期早、水量大,山區(qū)河流的洪水暴漲暴落面,平源河流漲落平緩,都是明顯的地區(qū)性表現(xiàn)。潮濕地區(qū)河流的徑流年內(nèi)分配較為均勻,而干旱地區(qū)的就很不均勻。處于同一地區(qū)或者流域特征相類似的河流,水文現(xiàn)象具有相類似的特點(diǎn),這也是地區(qū)性的變化規(guī)律。3.1水文現(xiàn)象的特性和分析方法NanjingUniversityofTechnology不重復(fù)性(偶然性)影響水文現(xiàn)象的因素很多,而且各種因素相互之間的關(guān)系錯(cuò)綜復(fù)雜。因此,水文現(xiàn)象在總體上雖然存在著周期性的變化規(guī)律,但是無(wú)論什么時(shí)候都不可能完全重復(fù)出現(xiàn)具體出現(xiàn)時(shí)間和數(shù)量大小每年都不完全相同,井帶有一定的偶然性,稱為水文現(xiàn)象的不重復(fù)性(偶然性)。3.1水文現(xiàn)象的特性和分析方法NanjingUniversityofTechnology成因分析法地區(qū)歸納法數(shù)理統(tǒng)計(jì)法3.1水文現(xiàn)象的特性和分析方法二、水文現(xiàn)象的分析方法NanjingUniversityofTechnology3.1水文現(xiàn)象的特性和分析方法研究河川水文現(xiàn)象的物理成因以及同其它自然現(xiàn)象之間的相互關(guān)系,通過(guò)成因分析尋求水文現(xiàn)象的客觀規(guī)律,建立水文現(xiàn)象各要素之間的定性、定量關(guān)系。成因分析法這種分析方法推理清楚、物理概念明確,但由于影響因素錯(cuò)綜復(fù)雜,使定性和定量分析都存在很多困難,目前公路和鐵路工程多應(yīng)用一些半經(jīng)驗(yàn)半理論公式。復(fù)雜的洪水形成數(shù)學(xué)模型路橋工程中尚未應(yīng)用。NanjingUniversityofTechnology3.1水文現(xiàn)象的特性和分析方法根據(jù)河川水文現(xiàn)象的地區(qū)性特點(diǎn),利用實(shí)測(cè)水文資料進(jìn)行綜合歸納,尋求水文區(qū)域現(xiàn)象的分布規(guī)律。地區(qū)歸納法這種分析方法以實(shí)際資料為依據(jù),雖然缺乏物理成因的分析,但應(yīng)用較為簡(jiǎn)易,對(duì)于缺乏實(shí)測(cè)資料地區(qū)有一定的實(shí)用意義,應(yīng)用較多。NanjingUniversityofTechnology3.1水文現(xiàn)象的特性和分析方法利用河川水文現(xiàn)象的隨機(jī)性特點(diǎn),對(duì)實(shí)測(cè)水文資料進(jìn)行統(tǒng)計(jì)分析,尋求水文現(xiàn)象的統(tǒng)計(jì)規(guī)律,預(yù)估其今后的變化;數(shù)理統(tǒng)計(jì)法水文統(tǒng)計(jì)法是目前大中橋水文分析計(jì)算的基本方法;采用數(shù)理統(tǒng)計(jì)法推算橋梁的設(shè)計(jì)流量時(shí),應(yīng)滿足這樣一個(gè)基本條件:建橋前后河流的自然條件必須基本相同,以保證橋梁使用期限內(nèi),河流的流量變化與建橋前基本具有相同的規(guī)律性;NanjingUniversityofTechnology3.2幾率和頻率一、隨機(jī)事件事件分為三類:必然事件、隨機(jī)事件和不可能事件。水文現(xiàn)象,既有必然性的一面,又有偶然性的一面。例如水文現(xiàn)象中年最大流量的出現(xiàn)是必然事件,但是出現(xiàn)的時(shí)間和大小,則為隨機(jī)事件。由于水文現(xiàn)象具有不重復(fù)性特點(diǎn),所以各種水文要素的具體數(shù)量的出現(xiàn),都是偶然性的,屬于隨機(jī)事件。隨機(jī)事件的統(tǒng)計(jì)規(guī)律——平均情況。

NanjingUniversityofTechnology二、隨機(jī)變量

在多次試驗(yàn)中,隨機(jī)事件出現(xiàn)的種種結(jié)果,都是以實(shí)數(shù)值來(lái)表示,這些數(shù)值就成為隨機(jī)變量。

隨機(jī)變量能代表隨機(jī)事件的出現(xiàn)結(jié)果,水文統(tǒng)計(jì)法就是利用流量、降雨量、潮水位、波浪高度等實(shí)測(cè)水文資料作為隨機(jī)變量,通過(guò)統(tǒng)計(jì)分析,推求出水文現(xiàn)象的客觀規(guī)律性。隨機(jī)變量分為兩類:連續(xù)型隨機(jī)變量和離散型隨機(jī)變量。

3.2幾率和頻率NanjingUniversityofTechnology許多隨機(jī)變量組成的一列數(shù)值,稱為隨機(jī)變量系列,一般簡(jiǎn)稱為系列。系列的范圍可以是有限的,也可以使無(wú)限的。水文資料一般都是無(wú)限系列。例如:某河流的年最大流量值所組成的隨機(jī)變量系列——年最大流量系列,應(yīng)該包括河流過(guò)去、現(xiàn)在和未來(lái)無(wú)限長(zhǎng)年代中所有的每年最大洪峰流量值,因此,為一個(gè)無(wú)限的系列。3.2幾率和頻率NanjingUniversityofTechnology3.2幾率和頻率三、幾率和頻率對(duì)于隨機(jī)事件,它在一定條件下可能現(xiàn)也可能不出現(xiàn),若用一個(gè)具體數(shù)值來(lái)表示客觀上出現(xiàn)的可能程度(可能性大小),這個(gè)數(shù)值就稱為該事件的幾率(或概率)。P(A)——一定條件下,隨機(jī)事件A的幾率;n——試驗(yàn)結(jié)果的總數(shù);m——隨機(jī)事件A出現(xiàn)的總數(shù)。NanjingUniversityofTechnology3.2幾率和頻率例:袋中有白球10個(gè),黑球20個(gè),其差別只在顏色方面,其形狀、大小及觸摸的感覺完全相同。問(wèn)摸出白球的幾率為多少?摸出黑球的幾率為多少?NanjingUniversityofTechnology在一系列重復(fù)的獨(dú)立試驗(yàn)中,某一事件出現(xiàn)的次數(shù)與試驗(yàn)總次數(shù)的比值,則稱為該事件的頻率。由實(shí)踐和理論證明,當(dāng)試驗(yàn)次數(shù)較少時(shí),事件的頻率具有明顯的偶然性,擺動(dòng)的幅度較大,但隨著試驗(yàn)次數(shù)的增多,事件的頻率則逐漸趨于穩(wěn)定,最終將十分接近于它的幾率。

P(A)=1,則表明試驗(yàn)結(jié)果全部出現(xiàn)事件A,則事件A為必然事件;

P(A)=0,則表明每次試驗(yàn)結(jié)果都不出現(xiàn)事件A,則事件A成為不可能事件;

0<P(A)<1,則表明A為隨機(jī)事件。3.2幾率和頻率NanjingUniversityofTechnology3.2幾率和頻率

頻率與幾率的不同:

幾率是隨機(jī)事件在客觀上出現(xiàn)的可能程度,是事件固有的客觀性質(zhì),不隨人們?cè)囼?yàn)的情況和次數(shù)而變動(dòng),是一個(gè)常數(shù),是理論值;

頻率是利用有限的試驗(yàn)結(jié)果推算而得的,是一個(gè)經(jīng)驗(yàn)值,將隨試驗(yàn)次數(shù)的多少而變動(dòng),只有試驗(yàn)次數(shù)達(dá)到無(wú)限多時(shí),才穩(wěn)定在一個(gè)常數(shù)并等于理論值——幾率。NanjingUniversityofTechnology幾率分為事先幾率和經(jīng)驗(yàn)幾率對(duì)于一些簡(jiǎn)單隨機(jī)事件(如擲硬幣試驗(yàn)),不必通過(guò)試驗(yàn)就能夠事先得到的幾率值,稱為事先幾率。對(duì)于那些不能事先得知幾率的復(fù)雜隨機(jī)事件,利用其頻率估計(jì)得到的幾率值,稱為經(jīng)驗(yàn)幾率。如水文現(xiàn)象中的流量、水位、降雨量等都是非常復(fù)雜的隨機(jī)事件,無(wú)法得知事先幾率,只能利用實(shí)測(cè)水文資料計(jì)算其頻率,以尋求它們的變化規(guī)律,推測(cè)未來(lái)可能出現(xiàn)的情況,滿足工程的需要。3.2幾率和頻率NanjingUniversityofTechnology3.2幾率和頻率四、總體和樣本數(shù)理統(tǒng)計(jì)中,把隨即變量系列的全體,亦即包含整體情況的全部系列,稱為總體。從總體中抽出的一部分隨機(jī)變量,稱為總體的一個(gè)樣本。從總體中抽出樣本稱為抽樣。總體或樣本中隨機(jī)變量的項(xiàng)數(shù),分別稱為總體或樣本的容量。樣本是總體的一部分,在一定程度上可反映總體的特征。從水文站歷年流量觀測(cè)資料中,每年選取一個(gè)洪水成因相同的最大洪峰流量,n年的觀測(cè)資料中,可以選出n個(gè)流量值,組成一個(gè)n項(xiàng)容量的隨機(jī)樣本,稱為年最大值法,也稱為“年最大流量法”。樣本總體NanjingUniversityofTechnology3.2幾率和頻率就是利用已有的實(shí)測(cè)水文資料組成有限的隨機(jī)變量系列,作為無(wú)限總體中的一部分,以樣本的規(guī)律推斷總體的規(guī)律,來(lái)解決工程中的水文計(jì)算問(wèn)題。就是將流量、降雨量等實(shí)測(cè)資料(實(shí)測(cè)數(shù)值)作為隨機(jī)變量,通過(guò)統(tǒng)計(jì)分析和計(jì)算,推算水文現(xiàn)象(隨機(jī)事件)客觀規(guī)律的方法。水文統(tǒng)計(jì)法:NanjingUniversityofTechnology3.3頻率分布一、頻率分布及其特性二、累積頻率和重現(xiàn)期三、設(shè)計(jì)洪水頻率NanjingUniversityofTechnology3.3頻率分布——頻率分布及其特性1、頻率分布

隨機(jī)變量的取值總是伴隨著相應(yīng)的頻率,而頻率的大小隨著隨機(jī)變量取值而變化,這種隨機(jī)變量與其頻率之間的一一對(duì)應(yīng)關(guān)系,稱為隨機(jī)變量的頻率分布。它反映了隨機(jī)變量系列的統(tǒng)計(jì)規(guī)律。

在工程中,當(dāng)隨機(jī)變量系列容量n足夠大時(shí),常把隨機(jī)變量的頻率分布近似地作為幾率(概率)分布來(lái)看待。

即N→∞,概率分布

以各組出現(xiàn)次數(shù)與總次數(shù)之比表示各組所在區(qū)間流量值出現(xiàn)的可能程度,即頻率。NanjingUniversityofTechnology3.3頻率分布——頻率分布及其特性NanjingUniversityofTechnology2、頻率密度

單位組距的頻率稱為頻率密度。為了反映系列中隨即變量大小的連續(xù)性,按其數(shù)值由大到小的遞減次序,等間距分為若干組,組距取100m3/s。3、累積頻率

是各組累計(jì)出現(xiàn)次數(shù)與總次數(shù)的比值,表示等于和大于該組所在區(qū)間的流量值出現(xiàn)的可能程度,以百分?jǐn)?shù)計(jì)。等量或超量值累計(jì)出現(xiàn)的次數(shù)與總觀測(cè)次數(shù)的比值。P(X≥Xi)3.3頻率分布——頻率分布及其特性NanjingUniversityofTechnology流量與頻率關(guān)系的直方圖3.3頻率分布——頻率分布及其特性NanjingUniversityofTechnology

如果資料無(wú)限多,組距無(wú)限小,圖中的密度直方圖將趨于光滑的鈴形曲線,稱為頻率密度曲線(簡(jiǎn)稱為密度曲線)。

它表示某一變量X可能出現(xiàn)的頻率P。

流量與頻率關(guān)系的直方圖——密度曲線

特別大的和特別小的流量出現(xiàn)次數(shù)較少,接近平均值的流量出現(xiàn)次數(shù)較多。絕大多數(shù)水文資料系列,都具有這樣的規(guī)律。3.3頻率分布——頻率分布及其特性NanjingUniversityofTechnology

若以流量x為縱坐標(biāo),累積頻率為橫坐標(biāo),則可繪出流量和累積頻率關(guān)系的階梯形折線圖來(lái)表示年最大流量的累積頻率分布。流量的實(shí)測(cè)次數(shù)趨于無(wú)窮大,組距趨于無(wú)窮小時(shí),累積頻率多邊圖將成為光滑的S形累積頻率曲線。

在水文計(jì)算中,一般采用累積頻率曲線來(lái)說(shuō)明水文特征值的統(tǒng)計(jì)規(guī)律,通稱為頻率曲線和分布曲線。3.3頻率分布——頻率分布及其特性NanjingUniversityofTechnology流量與累積頻率關(guān)系的折線圖3.3頻率分布——頻率分布及其特性NanjingUniversityofTechnology頻率密度曲線和頻率分布曲線3.3頻率分布——頻率分布及其特性NanjingUniversityofTechnology流量與累積頻率關(guān)系折線圖——分布曲線

累積頻率分布函數(shù)可以由密度函數(shù)積分而得。即某變量X對(duì)應(yīng)的密度曲線左側(cè)下圍面積P(圖中陰影部分的面積)就是x所對(duì)應(yīng)的累積頻率,。3.3頻率分布——頻率分布及其特性NanjingUniversityofTechnology4、曲線繪制(1)數(shù)據(jù)分組(2)統(tǒng)計(jì)各組出線的次數(shù)(頻數(shù))(3)計(jì)算各組的頻率、頻率密度和累計(jì)頻率(4)以隨機(jī)變量的值為橫坐標(biāo),以該組的頻率為高繪出直方形,即為頻率直方圖。(5)連接頻率密度直方圖頂部即為頻率密度分布曲線。(6)以隨機(jī)變量為縱坐標(biāo),累計(jì)頻率為橫坐標(biāo),即可繪出頻率分布曲線。3.3頻率分布——頻率分布及其特性NanjingUniversityofTechnology3.3頻率分布——累積頻率和重現(xiàn)期1、累計(jì)頻率水文統(tǒng)計(jì)中,等于或大于某一流量值出現(xiàn)的次數(shù)(即累積出現(xiàn)次數(shù))與總次數(shù)的比值,稱為該流量的累積頻率P,工程應(yīng)用簡(jiǎn)稱為該流量的頻率P,以百分?jǐn)?shù)(%)或以多少分之一表示,如P為1%。2、年最大值法(年頻率)洪峰流量的選擇中,每年只選取最大的一個(gè)瞬時(shí)洪峰流量最為頻率計(jì)算的樣本。NanjingUniversityofTechnology3、重現(xiàn)期某隨機(jī)變量的取值在長(zhǎng)時(shí)期內(nèi)平均多少年出現(xiàn)一次(多少年一遇)重現(xiàn)期與頻率之間的關(guān)系

3.3頻率分布——累積頻率和重現(xiàn)期頻率和重現(xiàn)期都是指很長(zhǎng)時(shí)期內(nèi)的平均情況,以無(wú)限長(zhǎng)的時(shí)期而論才是正確的。NanjingUniversityofTechnology3.3頻率分布——設(shè)計(jì)洪水頻率橋涵工程均采用一定的洪水頻率作為設(shè)計(jì)標(biāo)準(zhǔn),稱為設(shè)計(jì)洪水頻率設(shè)計(jì)流量:與設(shè)計(jì)洪水頻率相應(yīng)的洪峰流量;水文統(tǒng)計(jì)法就是根據(jù)頻率曲線推算對(duì)應(yīng)于設(shè)計(jì)洪水頻率的流量,作為橋涵的設(shè)計(jì)流量;公路等級(jí)高速公路一級(jí)公路二級(jí)公路三級(jí)公路四級(jí)公路設(shè)計(jì)洪水頻率1/1001/1001/501/25按具體情況確定路基設(shè)計(jì)洪水頻率NanjingUniversityofTechnology3.3頻率分布——設(shè)計(jì)洪水頻率NanjingUniversityofTechnology3.3頻率分布例:某橋位斷面有40年最高水位實(shí)測(cè)資料,見下表,設(shè)容許破壞率[P]=5%,試確定相應(yīng)的設(shè)計(jì)水位Zp。5254022.57.51005307092.5100NanjingUniversityofTechnology3.3頻率分布解:有上述計(jì)算,當(dāng)[P]=5%,Zp=30m,這表明,根據(jù)已有實(shí)測(cè)水位的逐個(gè)分析與計(jì)算結(jié)果,所求設(shè)計(jì)水位Zp=30m,其未來(lái)可能出現(xiàn)的破壞頻率[P]=5%。顯然安全率為95%。NanjingUniversityofTechnology3.4經(jīng)驗(yàn)頻率曲線

根據(jù)水文統(tǒng)計(jì)樣本的實(shí)測(cè)水文資料系列,計(jì)算各項(xiàng)隨機(jī)變量的經(jīng)驗(yàn)頻率,點(diǎn)繪經(jīng)驗(yàn)頻率與其對(duì)應(yīng)的隨機(jī)變量大小的曲線,稱為該樣本的經(jīng)驗(yàn)頻率曲線。(根據(jù)實(shí)測(cè)(樣本)資料所繪制出的頻率曲線即為經(jīng)驗(yàn)頻率曲線。)一、經(jīng)驗(yàn)頻率的計(jì)算

維泊爾公式(數(shù)學(xué)期望公式)隨機(jī)變量序號(hào)(遞減)樣本容量NanjingUniversityofTechnology二、經(jīng)驗(yàn)頻率曲線的繪制1.把研究系列(隨機(jī)變量)按照從大到小的順序排列,分別統(tǒng)計(jì)各變量的頻數(shù);2.分別計(jì)算各個(gè)變量的頻率及累積頻率;3.以水文變量為縱坐標(biāo),以頻率為橫坐標(biāo)展點(diǎn);4.過(guò)各點(diǎn)作一條光滑的曲線。3.4經(jīng)驗(yàn)頻率曲線NanjingUniversityofTechnology3.4經(jīng)驗(yàn)頻率曲線三、經(jīng)驗(yàn)頻率曲線的外延設(shè)計(jì)洪水流量都是小頻率的特大洪水流量。一般情況下,實(shí)測(cè)洪水資料的年份有限,為了求設(shè)計(jì)洪水流量,必須將經(jīng)驗(yàn)頻率曲線向上外延。普通坐標(biāo)紙:S型曲線專門的概率坐標(biāo)紙(海森概率坐標(biāo)紙):近直線NanjingUniversityofTechnology3.4經(jīng)驗(yàn)頻率曲線海森概率坐標(biāo)紙縱坐標(biāo)為普通的等分坐標(biāo),也可為對(duì)數(shù)坐標(biāo);累積頻率P的橫坐標(biāo)為不等分分格,中間密、兩端疏,橫坐標(biāo)分格數(shù)值見《公路橋涵設(shè)計(jì)手冊(cè)》。正態(tài)分布累積頻率曲線在海森概率格紙中呈直線,NanjingUniversityofTechnology3.4經(jīng)驗(yàn)頻率曲線——外延存在的問(wèn)題然而目估延長(zhǎng)法受主觀因素影響較大,也無(wú)法檢驗(yàn)外延部分的正確性。為解決累積頻率曲線的外延問(wèn)題,可利用數(shù)學(xué)方法,尋求一種適合的數(shù)學(xué)模型,即具有一定數(shù)學(xué)方程式的頻率分布曲線,一般稱之為理論累積頻率曲線。由于水文資料觀測(cè)的年代有限,目前還不能完全由水文現(xiàn)象的實(shí)測(cè)資料建立一個(gè)完善的理論累積頻率曲線公式,而只能選擇與水文現(xiàn)象變化規(guī)律類似的線型,作為水文現(xiàn)象總體的頻率曲線,進(jìn)行頻率分析計(jì)算。依據(jù)實(shí)測(cè)系列,找出一條理論的累積頻率曲線(即數(shù)學(xué)模型),以此曲線來(lái)解決經(jīng)驗(yàn)累積頻率曲線外延的任意性和求解一定設(shè)計(jì)頻率標(biāo)準(zhǔn)下的設(shè)計(jì)值。NanjingUniversityofTechnology3.5統(tǒng)計(jì)參數(shù)隨機(jī)變量系列的頻率分布特征和頻率分布曲線形狀,能夠用該系列的幾個(gè)數(shù)值特征值來(lái)確定,系列的數(shù)值特征值稱為該系列的統(tǒng)計(jì)參數(shù)。一般水文系列常用的統(tǒng)計(jì)參數(shù)有:反映系列中隨機(jī)變量數(shù)值大小的特征——均值X、中值或眾值;反映各隨機(jī)變量離均程度——均方差,或變差系數(shù)CV。反映各隨機(jī)變量對(duì)均值的對(duì)稱性——偏差系數(shù)CSNanjingUniversityofTechnology3.5統(tǒng)計(jì)參數(shù)——均值、中值、眾值均值、中值、眾值都是代表系列數(shù)值大小平均情況的參數(shù)值,能反映其頻率分布高低位置特征。

1.均值

均值是系列中隨機(jī)變量的算術(shù)平均數(shù),以X表示,但隨機(jī)變量的取值不是在試驗(yàn)前就能得知的,所以均值又不同于普通的平均數(shù)的概念,概率論中也稱為數(shù)學(xué)期望值。(1)某一隨機(jī)變量系列X1、X2、…Xn,共有n項(xiàng),若其中各變量的出現(xiàn)次數(shù)都相同,即各變量占有同等比重時(shí)(等權(quán)),均值為:NanjingUniversityofTechnology(2)若其中各變量的出現(xiàn)次數(shù)都不相同(即不等權(quán)),X1出現(xiàn)f1次,X2出現(xiàn)f2次,…Xn出現(xiàn)fn次,且f1+f2+…+fn=n,由于各變量對(duì)平均數(shù)的影響不同,則均值應(yīng)為系列中隨機(jī)變量的加權(quán)平均值:3.5統(tǒng)計(jì)參數(shù)——均值、中值、眾值NanjingUniversityofTechnology(3)對(duì)于連續(xù)型隨機(jī)變量系列,均值則為:3.5統(tǒng)計(jì)參數(shù)——均值、中值、眾值系列中各個(gè)變量與均值的比值,成為模比系數(shù),以K表示:且NanjingUniversityofTechnology3.5統(tǒng)計(jì)參數(shù)——均值、中值、眾值對(duì)于年最大流量系列,其均值為多年平均洪峰流量,以表示。若以表示系列中任一年最大流量值,以n表示流量觀測(cè)的總年數(shù),則:NanjingUniversityofTechnology3.5統(tǒng)計(jì)參數(shù)——均值、中值、眾值均值的代表意義:均值是系列中所有隨機(jī)變量的平均數(shù),與每個(gè)變量都有直接關(guān)系,是各個(gè)變量的共同代表,它反映了系列在數(shù)值上的大小(系列水平的高低),可作為不同系列間隨機(jī)變量數(shù)值大小(水平高低)的比較標(biāo)準(zhǔn);均值是系列的分布中心,也就是位于幾率分布中心處的變量。在密度曲線圖中,通過(guò)均值垂直于橫坐標(biāo)的直線,恰好是曲線以下面積的重心軸。均值的大小,能反映系列分布中心和密度曲線的位置。NanjingUniversityofTechnology3.5統(tǒng)計(jì)參數(shù)——均值、中值、眾值系列中的隨機(jī)變量為等權(quán)時(shí),按大小遞減次序排列.位置居于正中間的那個(gè)變量,稱為中值。中值僅與變量的位置(或項(xiàng)數(shù))有關(guān),而與其他各變量的數(shù)值無(wú)關(guān),也稱為中位數(shù)。系列中變量的項(xiàng)數(shù)為偶數(shù)時(shí),則中值等于中間兩項(xiàng)變量的平均數(shù)。對(duì)于連續(xù)型隨機(jī)變量系列,中值的定義則為:系列中大于中值的和小于中值的隨機(jī)變量幾率相同,各為50%,即2、中值NanjingUniversityofTechnology3.5統(tǒng)計(jì)參數(shù)——均值、中值、眾值中值是系列的中間項(xiàng),也就是幾率為50%的變量,比中值大的和比中值小的變量,恰好各占一半(項(xiàng)數(shù)相等)。在密度曲線圖中,通過(guò)中值垂直于橫坐標(biāo)的直線,恰好平分曲線以下的面積。中值的大小,能反映系列中間項(xiàng)和密度曲線的位置。NanjingUniversityofTechnology3.5統(tǒng)計(jì)參數(shù)——均值、中值、眾值系列中出現(xiàn)次數(shù)最多的那個(gè)變量,就稱為眾值。眾值與變量的項(xiàng)數(shù)以及其他各變量的數(shù)值都沒有關(guān)系。對(duì)于連續(xù)型隨機(jī)變量系列,密度函數(shù)f(x)為極大時(shí)的變量值,就是眾值。

眾值就是系列中幾率最大的變量。在密度曲線圖中,恰好是曲線峰頂處的橫坐標(biāo)值。眾值的大小,能反映系列中最大幾率項(xiàng)和密度曲線的位置。3、眾值NanjingUniversityofTechnology3.5統(tǒng)計(jì)參數(shù)——均值、中值、眾值4、三者的位置關(guān)系在密度曲線圖中,均值、中值和眾值的相對(duì)位置,如圖所示。曲線為對(duì)稱形時(shí)(峰居中),表示系列的頻率分布對(duì)稱于均值(分布中心),稱為正態(tài)分布,三者的位置重合;曲線不對(duì)稱時(shí)(峰偏離中心),表示其頻率分布偏離均值(分布中心),稱為偏態(tài)分布,三者的位置分離,中值在其他二者的中間,峰偏左時(shí)稱為正偏態(tài),峰偏右時(shí)稱為負(fù)偏態(tài)。均值、中值和眾值的大小可以表明密度曲線的位置,而且三者的差值越大表明曲線越偏,它們反映了頻率分布的位置特征。NanjingUniversityofTechnology3.5統(tǒng)計(jì)參數(shù)——均方差和變差系數(shù)均方差和變差系數(shù)都是代表系列離均分布情況的參數(shù).表明系列分布對(duì)均值是比較分散還是比較集中,反映頻率分布對(duì)均值的離散程度,可以進(jìn)一步說(shuō)明頻率分布的特征。1、離均差(離差)和均方差(方差)系列中各變量xi對(duì)均值的差值、、…

等,稱為離均差,表示變量間變化幅度的大小。離均差平方的平均數(shù)的平方根,稱為均方差:NanjingUniversityofTechnology3.5統(tǒng)計(jì)參數(shù)——均方差和變差系數(shù)

均方差的量綱與變量相同。σ值較小時(shí),表示系列的離均差較小,說(shuō)明變量間的變化幅度較小,分布比較集中,即系列的離散程度較小(對(duì)均值而言);σ值較大時(shí),則說(shuō)明變量的變化幅度較大,分布比較分散,即離散程度較大。同時(shí),均方差還可以說(shuō)明均值對(duì)系列的代表性,σ值越小,均值的代表性越強(qiáng)。例如:NanjingUniversityofTechnology3.5統(tǒng)計(jì)參數(shù)——均方差和變差系數(shù)2、變差系數(shù)對(duì)于水平不同的兩個(gè)系列(均值大小不等),由于均值的影響,均方差就不足以說(shuō)明它們的離散程度大小。在數(shù)理統(tǒng)計(jì)中,通常采用相對(duì)值(即均方差與均值的比值)來(lái)反映系列的相對(duì)離散程度,作為系列間的衡量標(biāo)準(zhǔn),稱為變差系數(shù)或離差系數(shù),以CV表示(無(wú)量綱)。利用樣本推算總體的變差系數(shù),可采用下式:NanjingUniversityofTechnology

CV值較小時(shí),表示系列的離散程度較小,即變量間的變化幅度較小,頻率分布比較集中;CV較大,表示系列離散程度大,頻率分布比較分散。3.5統(tǒng)計(jì)參數(shù)——均方差和變差系數(shù)若引入模比系數(shù)Ki,則:或NanjingUniversityofTechnology3.5統(tǒng)計(jì)參數(shù)——偏差系數(shù)三、偏差系數(shù)也是代表系列分布情況的參數(shù),表明系列分布對(duì)均值是對(duì)稱的還是不對(duì)稱的,反映頻率分布對(duì)均值的偏斜程度,以CS表示,并可按下式計(jì)算NanjingUniversityofTechnology3.5統(tǒng)計(jì)參數(shù)——偏差系數(shù)利用樣本計(jì)算時(shí):引入模比系數(shù)Ki,則:NanjingUniversityofTechnology3.5統(tǒng)計(jì)參數(shù)——偏差系數(shù)CS=0,頻率分布對(duì)稱于均值;CS〉0,正偏態(tài),大于均值的變量比小于均值的變量出現(xiàn)機(jī)會(huì)少,均值對(duì)應(yīng)的頻率小于50%CS<0,負(fù)偏態(tài),大于均值的變量比小于均值的變量出現(xiàn)機(jī)會(huì)多,均值對(duì)應(yīng)的頻率大于50%年最大流量系列,一般不出現(xiàn)負(fù)值,多呈正偏態(tài)分布。NanjingUniversityofTechnology3.5統(tǒng)計(jì)參數(shù)——統(tǒng)計(jì)參數(shù)與曲線關(guān)系四、統(tǒng)計(jì)參數(shù)同密度曲線及頻率曲線的關(guān)系均值反映密度曲線位置的變化;變差系數(shù)反映密度曲線的高矮情況;偏差系數(shù)反映密度曲線的偏斜程度NanjingUniversityofTechnology3.5統(tǒng)計(jì)參數(shù)——統(tǒng)計(jì)參數(shù)與曲線關(guān)系與頻率分布曲線形狀的關(guān)系若和值不變,則值愈大,曲線的位置愈高。NanjingUniversityofTechnology3.5統(tǒng)計(jì)參數(shù)——統(tǒng)計(jì)參數(shù)與曲線關(guān)系與頻率分布曲線形狀的關(guān)系值不變,則值愈大曲線愈陡;時(shí),將成為一條水平線(縱坐標(biāo)),而且無(wú)負(fù)值,曲線總是左高右低。NanjingUniversityofTechnology3.5統(tǒng)計(jì)參數(shù)——統(tǒng)計(jì)參數(shù)與曲線關(guān)系若值不變,則時(shí),隨值的增大,曲線頭部變陡,尾部變緩而趨平,時(shí),曲線尾部將趨向于水平線時(shí),為正態(tài)分布,其與頻率分布曲線形狀的關(guān)系頻率曲線在海森幾率格紙上將成為一條直線;時(shí),隨值的減小,曲線頭部趨平而尾部變陡,年最大流量系列的無(wú)負(fù)值,頻率曲線總是頭部較陡尾部平緩。NanjingUniversityofTechnology根據(jù)上述分析,對(duì)一個(gè)已知系列,可以用它的統(tǒng)計(jì)參數(shù)來(lái)描述頻率分布和頻率曲線的特征。同理,對(duì)一個(gè)未知系列,若能求得它的統(tǒng)計(jì)參數(shù),就可以利用這些統(tǒng)計(jì)參數(shù)來(lái)確定它的頻率分布和頻率曲線。水文統(tǒng)計(jì)中,就是利用實(shí)測(cè)水文資料系列(樣本)推求近似總體的統(tǒng)計(jì)參數(shù),并用以確定總體的頻率分布和頻率曲線.3.5統(tǒng)計(jì)參數(shù)——統(tǒng)計(jì)參數(shù)與曲線關(guān)系NanjingUniversityofTechnology3.6理論頻率曲線

由于目估定線或外延會(huì)產(chǎn)生較大的誤差,往往需要借助于某些數(shù)學(xué)形式的頻率曲線作為定線和外延的依據(jù)。這種用數(shù)學(xué)形式確定的、符合經(jīng)驗(yàn)點(diǎn)分布規(guī)律的曲線稱為理論頻率曲線。根據(jù)我國(guó)多年使用經(jīng)驗(yàn),認(rèn)為皮爾遜Ⅲ型曲線比較符合我國(guó)多數(shù)地區(qū)水文現(xiàn)象的實(shí)際情況。因此,我國(guó)水利、公路、鐵路等工程有關(guān)規(guī)范.在水文統(tǒng)計(jì)中,大多采用皮爾遜Ⅲ型曲線,作為近似于水文現(xiàn)象總體的頻率曲線線形,在洪(枯)水流量、降雨徑流以及波浪高度的頻率分析中廣泛應(yīng)用。另外,耿貝爾曲線(第Ⅰ型極值分布曲線)也適用我國(guó)洪水頻率分析,特別在最高、最低潮水位的頻率分析時(shí)普遍應(yīng)用。NanjingUniversityofTechnology3.6理論頻率曲線一、皮爾遜Ⅲ型曲線的頻率密度函數(shù)皮爾遜曲線族,是英國(guó)生物學(xué)家皮爾遜與1895年,根據(jù)某些實(shí)際資料建立的一種概括性的曲線族,該曲線族按參數(shù)的不同分為13種線型,其中第三種線型就是皮爾遜Ⅲ型曲線原點(diǎn)在眾值處的皮爾遜Ⅲ型曲線的密度函數(shù)為:ym——眾值處的縱坐標(biāo)值,即曲線的最大縱坐標(biāo)值;a——曲線左端起點(diǎn)到眾值點(diǎn)的距離;b——均值點(diǎn)到眾值點(diǎn)的距離,稱為偏差半徑。NanjingUniversityofTechnology其中:3.6理論頻率曲線NanjingUniversityofTechnology3.6理論頻率曲線一、皮爾遜Ⅲ型曲線的頻率密度函數(shù)原點(diǎn)在實(shí)際零點(diǎn)時(shí)皮爾遜型Ⅲ曲線的密度函數(shù)為:a0——曲線左端起點(diǎn)到系列零點(diǎn)的距離a0=-(a+d);——曲線的參數(shù),,;

——為函數(shù)。NanjingUniversityofTechnology經(jīng)換算,其中:3.6理論頻率曲線NanjingUniversityofTechnology3.6理論頻率曲線二、皮爾遜Ⅲ型曲線的應(yīng)用水文統(tǒng)計(jì)需推求給定頻率下的變量或某一變量的頻率;頻率分布曲線可以由密度函數(shù)積分而得?!l率為P的隨機(jī)變量;

——離均系數(shù),,是頻率P和偏差系數(shù)的函數(shù),;為了便于應(yīng)用,預(yù)先制成了離均系數(shù)表,可供查閱。

——模比系數(shù),,可以根據(jù)擬定的比值,預(yù)先制成模比系數(shù)值表,以便查閱。NanjingUniversityofTechnology對(duì)于年最大流量系列,其公式為:——平率為P的洪峰流量(m3/s)

——平均流量(m3/s)

——模比系數(shù),

——離均系數(shù),可查表3-6-13.6理論頻率曲線NanjingUniversityofTechnology3.6理論頻率曲線[例3-6-1] 某水文站有22年的年最大流量觀測(cè)資料,如表3-6-2所示,試?yán)L制該站年最大流量系列的經(jīng)驗(yàn)頻率曲線,計(jì)算三個(gè)統(tǒng)計(jì)參數(shù)、Cv、Cs,繪制理論頻率曲線(P-Ⅲ曲線),并推算P=0.33%、P=1%和P=2%的洪水流量。NanjingUniversityofTechnology3.6理論頻率曲線NanjingUniversityofTechnology3.6理論頻率曲線根據(jù)設(shè)計(jì)頻率P和偏差系數(shù),查表3-6-1,得離均系數(shù)值NanjingUniversityofTechnology3.6理論頻率曲線NanjingUniversityofTechnology水文統(tǒng)計(jì)的誤差主要來(lái)源于兩個(gè)方面:一個(gè)是水文資料的觀測(cè)、整編和計(jì)算過(guò)程中形成的誤差,二是利用樣本推算總體的參數(shù)值所引起的誤差,即抽樣誤差。抽樣誤差是統(tǒng)計(jì)方法本身造成的,可通過(guò)延長(zhǎng)觀測(cè)年限、增大樣本容量、增強(qiáng)樣本的代表性等措施,來(lái)逐步減小。抽樣誤差也是隨機(jī)變量,也具有一定的概率分布,一般為正態(tài)分布。3.6理論頻率曲線正態(tài)曲線的密度函數(shù)為:三、抽樣誤差NanjingUniversityofTechnology3.6理論頻率曲線置信區(qū)間和置信水平分析表明:抽樣誤差出現(xiàn)在±σ范圍內(nèi)的頻率為68.3%;抽樣誤差出現(xiàn)在±3σ范圍內(nèi)的頻率為99.7%;抽樣誤差出現(xiàn)在±E范圍內(nèi)的頻率為50%;抽樣誤差出現(xiàn)在±4E范圍內(nèi)的頻率為99.3%;置信水平是指總體參數(shù)值落在樣本統(tǒng)計(jì)值某一區(qū)內(nèi)的概率。置信區(qū)間又稱估計(jì)區(qū)間,是用來(lái)估計(jì)參數(shù)的取值范圍的。NanjingUniversityofTechnology3.6理論頻率曲線抽樣誤差可以用均方差σ表示,也可以用相對(duì)均方差表示皮爾遜Ⅲ型曲線的抽樣誤差對(duì)于維泊爾公式,經(jīng)驗(yàn)頻率P的相對(duì)均方差為均值的相對(duì)均方差NanjingUniversityofTechnology3.6理論頻率曲線變差系數(shù)的相對(duì)均方差偏差系數(shù)的相對(duì)均方差眾值的相對(duì)均方差B值可由圖3-6-5查得NanjingUniversityofTechnology3.6理論頻率曲線[例3-6-2] 根據(jù)例題3-6-1資料,計(jì)算

的抽樣誤差,以及第一項(xiàng)的經(jīng)驗(yàn)頻率P1的抽樣誤差。已知NanjingUniversityofTechnology3.6理論頻率曲線由圖3-6-5查得B=2.9且已知NanjingUniversityofTechnology3.6理論頻率曲線NanjingUniversityofTechnology3.6理論頻率曲線NanjingUniversityofTechnology3.6理論頻率曲線四、耿貝爾頻率分布曲線該曲線對(duì)于海洋潮汐最高、最低設(shè)計(jì)潮水位的頻率分析更為合理。函數(shù)形式為指數(shù)型分布頻率分布函數(shù)為:給定頻率的隨機(jī)變量xP為:其中:——給定頻率P(%)相應(yīng)的隨即變量,如潮位、流量等——隨機(jī)變量系列的均值,如平均最高(低)潮水位等NanjingUniversityofTechnology3.6理論頻率曲線——隨機(jī)變量系數(shù)的均方差,近似按系列總體的均方差計(jì)算——與頻率P和系列容量n有關(guān)的參數(shù),由表3-6-5查取NanjingUniversityofTechnology3.6理論頻率曲線[例3-6-3] 己知某海灣22年的年最高潮水位觀測(cè)資料如表3-6-6所示,要求推算重現(xiàn)期為100年和50年的最高潮位。NanjingUniversityofTechnology3.6理論頻率曲線(1)將資料按遞減次序排列,按維泊爾公式

計(jì)算各項(xiàng)資料的經(jīng)驗(yàn)頻率.如表3-6-6所示。(2)年最高潮位的均值為(3)均方差NanjingUniversityofTechnology3.6理論頻率曲線(4)按表3-6-5查出n=22年,T=IOO年,即P=I%,n=22年,T=50年,即P=2%,(5)不同頻率的高潮位NanjingUniversityofTechnology3.7相關(guān)分析水文現(xiàn)象中許多變量不是孤立的,相互之間存在聯(lián)系,則分析研究?jī)蓚€(gè)或兩個(gè)以上隨機(jī)變量之間的關(guān)系,稱作相關(guān)分析。相關(guān)分析的意義與應(yīng)用

應(yīng)用:相關(guān)分析可以用來(lái)延長(zhǎng)和插補(bǔ)短系列,從而提高系列的代表性,增加樣本估計(jì)總體的計(jì)算精度,如建立上、下游水位的相關(guān)關(guān)系,由上游水位預(yù)報(bào)下游水位。

前提:在相關(guān)分析時(shí),首先要分析隨機(jī)變量之間是否在成因上確有聯(lián)系,對(duì)毫無(wú)關(guān)聯(lián)的現(xiàn)象是不能用相關(guān)分析的。NanjingUniversityofTechnology3.7相關(guān)分析水文計(jì)算中的相關(guān)分析的主要任務(wù):(1)確定兩個(gè)變量間相關(guān)關(guān)系的數(shù)學(xué)表達(dá)式,以相關(guān)方程或回歸方程表示,用以由已知變量推求未知變量;(2)判斷兩個(gè)變量間相關(guān)關(guān)系的密切程度,用一稱為相關(guān)系數(shù)的參數(shù)來(lái)表示。NanjingUniversityofTechnology3.7相關(guān)分析水文計(jì)算中,一般處理兩個(gè)變量間的相關(guān)關(guān)系,稱簡(jiǎn)單相關(guān),有時(shí)也要處理三個(gè)或三個(gè)以上變量關(guān)系,稱為復(fù)相關(guān)。簡(jiǎn)單相關(guān)可分為直線相關(guān)和曲線相關(guān)。曲線相關(guān)直線相關(guān)NanjingUniversityofTechnology3.7相關(guān)分析

如果兩個(gè)變量x,y,其中變量x的每一個(gè)值,變量y都有一個(gè)或多個(gè)確定值與之對(duì)應(yīng),而且x,y成函數(shù)關(guān)系,即x,y的關(guān)系點(diǎn)完全落在直線或曲線上,則稱這二個(gè)變量是完全相關(guān)的。完全相關(guān)yx完全相關(guān)(函數(shù)關(guān)系〕直線關(guān)系曲線關(guān)系隨機(jī)變量之間的關(guān)系有以下三種情況:NanjingUniversityofTechnology3.7相關(guān)分析零相關(guān)YXb.零相關(guān)(沒有關(guān)系)如果兩個(gè)變量x,y之間互不影響互不相關(guān),則稱這二個(gè)變量沒有關(guān)系或零相關(guān)。即x,y的關(guān)系點(diǎn)毫無(wú)規(guī)律,十分分散。NanjingUniversityofTechnology3.7相關(guān)分析yx如果兩個(gè)變量x,y之間關(guān)系介于以上二者之間,x,y的關(guān)系點(diǎn)雖有點(diǎn)分散,但有明顯的趨勢(shì),數(shù)學(xué)上可以用一定的表達(dá)式進(jìn)行擬合。則稱這二個(gè)變量關(guān)系為統(tǒng)計(jì)相關(guān)或相關(guān)關(guān)系。統(tǒng)計(jì)相關(guān)c.統(tǒng)計(jì)相關(guān)(相關(guān)關(guān)系〕NanjingUniversityofTechnology3.7相關(guān)分析一、直線相關(guān)的回歸方程

圖解法:根據(jù)實(shí)測(cè)值,將對(duì)應(yīng)點(diǎn)繪于方格紙上,如果點(diǎn)群分布平均趨勢(shì)為一直線,則可以直線來(lái)近似代表這種相關(guān)關(guān)系。通過(guò)點(diǎn)群中心目估繪出一條直線,然后在圖上量出直線的斜率a和截距b,則直線方程:

y=a+bx即為所求的相關(guān)方程。該方法簡(jiǎn)便實(shí)用,而且一般情況下精度可以保證。NanjingUniversityofTechnology3.7相關(guān)分析

相關(guān)分析法:若相關(guān)點(diǎn)分布較散,目估定線有一定任意性,為保證一定精確性,最好采用解析法來(lái)確定相關(guān)線的方程。設(shè)該直線方程形式為:

y=a+bx式中,x:自變量

y

:倚變量

a,b

:分別為一常數(shù),待定。則相關(guān)點(diǎn)與直線在縱軸方向必然存在離差。NanjingUniversityofTechnology配合曲線與觀測(cè)點(diǎn)在縱軸方向的離差為:xiy3.7相關(guān)分析NanjingUniversityofTechnology3.7相關(guān)分析要求配合曲線與所有的觀測(cè)點(diǎn)能“最佳”擬合,即滿足所有的觀測(cè)點(diǎn)的離差

y

的平方和為最小,即:分別對(duì)a,b

求一階偏導(dǎo)數(shù),并令其為零:NanjingUniversityofTechnology3.7相關(guān)分析求解上列兩聯(lián)立方程式,可得NanjingUniversityofTechnology3.7相關(guān)分析此式即為y倚x的回歸方程(直線方程)同理,可得

x倚

y的回歸方程(直線方程)將a,b代入y=a+bx中得:NanjingUniversityofTechnology3.7相關(guān)分析二、相關(guān)系數(shù)R回歸方程只是一種計(jì)算工具,它反映了兩個(gè)變量之間的平均關(guān)系,并不能說(shuō)明兩個(gè)變量之間的關(guān)系是否密切。在數(shù)理統(tǒng)計(jì)法中,一般采用相關(guān)系數(shù)來(lái)描述和判別兩變量之間的相關(guān)程度。NanjingUniversityofTechnology3.7相關(guān)分析式中

:x,y

系列的變差系數(shù)(按不偏估計(jì)公式計(jì)算):

R:相關(guān)系數(shù);

Kxi

,Kyi:分別為xi,yi系列的模比系數(shù):NanjingUniversityofTechnology3.7相關(guān)分析相關(guān)系數(shù)的性質(zhì):①若R2=1,表示相關(guān)點(diǎn)(xi,yi)均落在回歸線上,兩變量間具有直線函數(shù)關(guān)系;②若R2=0,說(shuō)明y的變化與x毫無(wú)直線關(guān)系,稱為零相關(guān);③若0<R2<1,R2愈接近于1,點(diǎn)據(jù)越靠近回歸直線,關(guān)系越密切。R為正時(shí),表示正相關(guān);R為負(fù)時(shí),表示負(fù)相關(guān)。NanjingUniversityofTechnology3.7相關(guān)分析相關(guān)系數(shù)R可以用作相關(guān)系數(shù)的描述和判別:R=±1時(shí)為完全相關(guān),表明兩變量之間存在直線函數(shù)關(guān)系R=0時(shí)為零相關(guān),表明兩變量之間不存在直線相關(guān);R=-1~1時(shí)為統(tǒng)計(jì)相關(guān),表明兩變量之間存在直線相關(guān),而且R的絕對(duì)值愈接近1,相關(guān)程度愈密切。

注:當(dāng)相關(guān)系數(shù)R很小或接近于0時(shí),只能說(shuō)明兩變量之間的直線相關(guān)程度很差或直線相關(guān)不存在,但可能存在某種曲線相關(guān)。NanjingUniversityofTechnology3.7相關(guān)分析三、回歸方程和回歸系數(shù)的其他形式和兩系列隨機(jī)變量的均方差為和NanjingUniversityofTechnology3.7相關(guān)分析回歸線的斜率b,又稱回歸系數(shù)y依x的回歸方程為:NanjingUniversityofTechnology3.7相關(guān)分析四、相關(guān)分析的誤差

由于x、y并非確定性關(guān)系,對(duì)于x=x0,無(wú)法知道其相應(yīng)的真正值y0,通過(guò)回歸方程求到:僅僅是真正值y0的一個(gè)估計(jì)值。故其與真正值y0存在偏差。根據(jù)統(tǒng)計(jì)學(xué)的研究,由于隨機(jī)因素的影響,y0在估計(jì)值上下波動(dòng)呈正態(tài)分布,其誤差大小可用均方誤表示。NanjingUniversityofTechnology3.7相關(guān)分析NanjingUniversityofTechnology3.7相關(guān)分析

如用Sy表示y倚x回歸線的均方誤,yi為觀測(cè)值,為回歸線上的對(duì)應(yīng)值,n為系列項(xiàng)數(shù),則

式中,Sy

:y倚x回歸線的均方誤;

yi

:觀測(cè)點(diǎn)的縱坐標(biāo)值;

y:由回歸方程求到的縱坐標(biāo)值;

n:觀測(cè)項(xiàng)的數(shù)目

同樣,x倚y回歸線的均方誤Sx為NanjingUniversityofTechnology3.7相關(guān)分析利用樣本推算時(shí),其均方誤為如前所述,可以用均方誤進(jìn)行誤差分析,即對(duì)于任一固定的x=x0值,若以作為y的估值,其誤差不超過(guò)Sy的可能性為68.3%;其誤差不超過(guò)3Sy的可能性為99.7%。NanjingUniversityofTechnology3.7相關(guān)分析五、容許相關(guān)系數(shù)的最小值相關(guān)系數(shù)是根據(jù)有限的實(shí)測(cè)資料(樣本)計(jì)算出來(lái)的,故相關(guān)系數(shù)也不免帶有抽樣誤差

故水文上為了推斷二個(gè)變量的相關(guān)性,必須對(duì)樣本相關(guān)系數(shù)作統(tǒng)計(jì)檢驗(yàn)。假設(shè)檢驗(yàn):先假設(shè)總體具有某種統(tǒng)計(jì)特性(如具有某種參數(shù),或遵從某種分布等),然后再檢驗(yàn)這個(gè)假設(shè)是否可信,這種方法稱為假設(shè)檢驗(yàn)。

NanjingUniversityofTechnology3.7相關(guān)分析原假設(shè)H0:R總體=0(不相關(guān));備選假設(shè)H1:R總體≠0(相關(guān))。先假設(shè)R總體=0,即總體不相關(guān)。但總體不相關(guān)的兩個(gè)變量,樣本相關(guān)系數(shù)的大小可以在0~1之間變化,不同的R樣本,其出現(xiàn)的概率也不同,即樣本的相關(guān)系數(shù)是一隨機(jī)變量,它也具有一定的概率分布。小概率原理:如果在指定的隨機(jī)試驗(yàn)中,某事件出現(xiàn)的概率非常微小,那么就可以認(rèn)為,在一次試驗(yàn)中此事件是不可能發(fā)生的。NanjingUniversityofTechnology3.7相關(guān)分析具體的檢驗(yàn)步驟:

假設(shè)兩變量X,Y在總體上不相關(guān);

從不相關(guān)的兩變量總體中抽出大量的樣本(如n個(gè)),進(jìn)行相關(guān)分析,并分別計(jì)算各樣本的相關(guān)系數(shù)R1,R2,…Rn,由于假設(shè)總體不相關(guān),可以判斷R1,R2,…Rn

為較小值的可能性大,為較大值的可能性小.

選定一個(gè)衡量事件發(fā)生可能性(概率)很小的指標(biāo)(水文統(tǒng)計(jì)學(xué)中稱顯著性水平

或稱信度水平

),對(duì)于容量為n的樣本,則有一相應(yīng)的臨界值

R

(

R

為較大值),樣本相關(guān)系數(shù)R(根據(jù)原先假定R

應(yīng)為很小的值)

超過(guò)±R

的可能性(概率)應(yīng)為較小值

(水文上一般選

=0.05或0.01作為小概率),即:NanjingUniversityofTechnology3.7相關(guān)分析由于

值很小,故R

R

為一小概率事件.

取某一個(gè)具體的樣本所計(jì)算的R與

R

作比較,以判斷總體是否相關(guān):

若R≥

R

,說(shuō)明樣本相關(guān)系數(shù)絕對(duì)值較大,且超過(guò)了臨界值

R

,說(shuō)明“小概率事件”發(fā)生了,則原先的假定是不能接受的,總體很大可能性是相關(guān)的。NanjingUniversityofTechnology3.7相關(guān)分析

若R≤

R

,說(shuō)明樣本相關(guān)系數(shù)絕對(duì)值較小,未超過(guò)臨界值

R

,則原先的假定可以成立,即總體很大可能性是不相關(guān)的。實(shí)用上,可查n~R

~

表求R

(表3-7-1,p66)n-2(n為樣本容量)

0.10.050.020.01R

80.54940.6319

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論