田間試驗與統(tǒng)計方法第四章理論分布和抽樣分布ppt課件_第1頁
田間試驗與統(tǒng)計方法第四章理論分布和抽樣分布ppt課件_第2頁
田間試驗與統(tǒng)計方法第四章理論分布和抽樣分布ppt課件_第3頁
田間試驗與統(tǒng)計方法第四章理論分布和抽樣分布ppt課件_第4頁
田間試驗與統(tǒng)計方法第四章理論分布和抽樣分布ppt課件_第5頁
已閱讀5頁,還剩82頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第四章 實際分布與抽樣分布第一節(jié) 事件與概率第二節(jié) 概率分布第三節(jié) 二項式分布第四節(jié) 正態(tài)分布第五節(jié) 抽樣分布. 一、事 件一必然景象與隨機景象 必然景象inevitable phenomena或確定性景象definite phenomena: 結果可預言,確定的,必然的,可反復 例,規(guī)范大氣壓下,水加熱到100C必然沸騰隨機景象random phenomena 或不確定性景象indefinite phenomena: 結果事前不可預言,呈偶爾性、不確定性 例,種子發(fā)芽,拋硬幣.隨機景象或不確定性景象,有如下特點:(1)在一定的條件實現(xiàn)時,有多種能夠的結果發(fā)生,事前人們不能預言將出現(xiàn)哪種結果;

2、對一次或少數(shù)幾次察看或實驗而言,其結果呈現(xiàn)偶爾性、不確定性;(2) 但在一樣條件下進展大量反復實驗時,其實驗結果卻呈現(xiàn)出某種固有的特定的規(guī)律性頻率的穩(wěn)定性,通常稱之為隨機景象的統(tǒng)計規(guī)律性。.二隨機實驗與隨機事件 1、隨機實驗 通常我們把根據某一研討目的 , 在一定條件下對自然景象所進展的察看或實驗統(tǒng)稱為實驗trial。 而一個實驗假設滿足下述三個特性 , 那么 稱 其 為 一個 隨機實驗random trial,簡稱實驗:. 1實驗可以在一樣條件下多次反復進展; 2每次實驗的能夠結果不止一個 ,并且事先知道會有哪些能夠的結果; 3每次 實驗總是恰好出現(xiàn)這些能夠結果中的一個 ,但在一次實驗之前卻

3、不能一定這次實驗會出現(xiàn)哪一個結果。 例如小麥發(fā)芽實驗,拋硬幣。 . 2、隨機事件 隨機實驗的每一種能夠結果,在一定條件下可 能 發(fā) 生 ,也 可 能 不 發(fā)生,稱為隨機事件random event,簡稱 事 件(event,通常用A、B、C等來表示。 1根身手件 我 們 把 不 能 再 分的事件稱為根身手件elementary event , 也 稱 為 樣本點sample point。 . 例如,在編號為1、2、3、20 的數(shù)字中隨機抽取1個,有20種不同的能夠結果: “ 取 得 一 個 編 號 是 1 、 “ 獲得一個編號是2、“獲得一個編號是10,這10個事件都是不能夠再分的事件,它們都

4、是根身手件。 由假設干個根身手件組合而成的事件稱為 復合事件 compound event。 如 “獲得一個編號是 2的倍數(shù)是一個復合事件,它由 “ 獲得一個編號是2 、 “ 是4、“是6、“是8“是20 10個根身手件組合而成。 .2必然事件 我們把在一定條件下必然會發(fā)生的事件稱為必然事件certain event,用表示。其概率為1 例如,規(guī)范大氣壓下,水加熱到100C必然沸騰,就是一個必然事件。.3不能夠事件 我們把在一定條件下不能夠發(fā)生的事件稱為不能夠事件impossible event,用表示。其概率為0 例,沒有生活才干的種子播種后會出苗,就是一個不能夠事件。必然事件與不能夠事件實

5、踐上是確定性景象,即它們不是隨機事件, 但 是 為了方便起見,我們把它們看作為兩個特殊的隨機事件。.積事件AB和事件A+BABAB互斥事件 對立事件 ABA+B, “或A發(fā)生,或B發(fā)生。AB, “A和B同時發(fā)生或相繼發(fā)生AB=V,事件A和B互斥或互不相容A+B=U,AB=V,事件B為事件A的對立事件,并記B為事件間的關系.二 、 概 率 研討隨機實驗,僅知道能夠發(fā)生哪些隨機事件是不夠的,還需了解各種隨機事件發(fā)生的能夠性大小,以提示這些事件的內在的統(tǒng)計規(guī)律性,從而指點實際。 這就要求有一個可以刻劃事件發(fā)生能夠性大小的數(shù)量目的,這目的應該是事件本身所固有的,且不隨人的客觀意志而改動,人們稱之為概率

6、probability。 事件A的概率記為PA。 .一概率的統(tǒng)計定義思索:投擲一枚硬幣,出現(xiàn)正面的概率是多大?0表示反面,1表示正面反復做它,那么一切出現(xiàn)正面的結果平均值是多少?英國數(shù)學家皮爾遜做24000次拋硬幣實驗 正面向上12021次 頻率 =隨著實驗次數(shù)的增多,正面朝上的頻率越來越接近0.5. 二、概率. 例,表 在一樣條件下盲蝽象在某棉田危害程度的調查結果調查株數(shù)(n)52550100200500100015002000受害株數(shù)(a) 21215 33 72177 351 525 704棉株受害頻率(a/n)0.400.480.300.330.360.3540.3510.3500.3

7、52調查株數(shù)n較多時的穩(wěn)定頻率才干較好地代表棉株受害的能夠性.統(tǒng)計學上用n較大時穩(wěn)定的p近似代表概率。經過大量實驗而估計的概率稱為實驗概率或統(tǒng)計概率,以 表示。此處P代表概率,P(A)代表事件A的概率,P(A)變化的范圍為01,即0P(A)1。.二 概率的古典定義概率的統(tǒng)計定義是在大量的實驗中以頻率的穩(wěn)定性為根底上提出來的。不需求做實驗,根據隨機事件本身的特性就可以確定事件出現(xiàn)的概率,稱為古典概率。古典概型必需滿足以下條件:隨機實驗的全部能夠結果根身手件數(shù)是有限的;各根身手件間是互不相容且發(fā)生是等能夠的。定義: PAm / n m為事件A中所包含的根身手件數(shù) n為根身手件總數(shù)。 .例,在1、2

8、、3、20這20個數(shù)字中隨機抽取1個,求以下事件的概率1A“抽得1個數(shù)字小于52B=“抽得1個數(shù)字是2的倍數(shù). 小概率事件-隨機事件的概率表示隨機事件在實驗中出現(xiàn)的能夠性大小。隨機事件的概率很小如,小于0.05或0.01或0.001小概率原理-統(tǒng)計學上,把小概率事件在一次實驗中看成是實踐不能夠發(fā)生的事件,稱為小概率事件實踐不能夠性原理,簡稱小概率原理。這里的0.05或0.01稱為小概率規(guī)范,農業(yè)實驗研討中通常運用這兩個小概率規(guī)范。小概率事件實踐不能夠性原理是統(tǒng)計學上進展假設檢驗顯著性檢驗的根本根據。三 小概率事件實踐不能夠性原理.概率是事件在實驗結果中出現(xiàn)能夠性大小的定量計量。它是度量隨機事件

9、發(fā)生的能夠性的統(tǒng)計學目的。是事件固有的屬性,有以下明顯的性質:隨機事件A的概率:0PA1必然事件W的概率為1,即PW=1不能夠事件V的概率為0,即PV=0概率接近于0如P0.05的事件稱為小概率事件。四 概率的性質.第二節(jié) 概率分布 probability distribution)一、隨機變量二、概率分布.一、隨機變量(random variable) 隨機變量是指隨機變數(shù)所取的某一個實數(shù)值。表示隨機景象結果的變量,也就是在隨機實驗中被測定的量,所獲得的值稱為察看值。 例1:拋硬幣實驗,兩種結果: 用數(shù)“1表示“幣值面向上, “0表示“國徽面向上 把 0,1作為變量y的取值 可以簡單地把拋硬

10、幣實驗用取值為0,1的變量來表示: P(y=1)=0.5,P(y=0)=0.5 .例2:用“1表示“能發(fā)芽種子,其概率為p;用“0表示“不能發(fā)芽種子,其概率為q。顯然 p+q=1,那么 P(y=1)=p,P(y=0)=q=1p。.例3:用變量y表示水稻產量,假設y大于500kg的概率為0.25,大于300kg且等于小于500kg的概率為0.65,等于小于300kg的概率為0.1。 那么用變量y的取值范圍來表示的實驗結果為 P(y300)=0.10, P(300y500)=0.65, P(y500)=0.25。.隨機變量離散型延續(xù)型與我們前面所講的延續(xù)型數(shù)據和離散型數(shù)據的意義一樣.一 離散型隨機

11、變量 -當實驗只需幾個確定的結果,并可一一列出,變量y的取值可用實數(shù)表示,且y取某一值時,其概率是確定的,這種類型的變量稱為離散型隨機變量。 將這種變量的一切能夠取值及其對應概率一一列出所構成的分布稱為離散型隨機變量的概率分布: 概率變量yiy1y2y3ynP1P2P3Pn也可用函數(shù)f(y)表述,稱為概率函數(shù)。. 前面例1、例2中的y就是離散型隨機變量,將其能夠取值與對應概率一一列出,即為:變量y01概率0.50.5變量y01概率qp常用概率分布表或概率分布圖表示.圖 離散型隨機變量概率分布圖 X x1 x2 x3 xn Pi p1 p2 p3 pn 表 離散型隨機變量的概率分布表.離散型變量

12、概率的分布函數(shù):離散型變量概率的向上累積。其公式為 ,即隨機變量小于等于某一能夠值x0的概率。.離散型概率分布的例子例:從100件產品其中合格品95件,廢品5件中任取10件, 求每次抽到廢品數(shù)的概率分布。 xp(x)0 123450.5837523670.3393909110.0702188090.0063835280.0002510380.000003347xF(x)0 123450.5837523670.9231432780.9933620770.9997456050.9999966531.000000000概率分布表累積概率分布表.二延續(xù)型隨機變量(continuous random v

13、ariate) - 對于隨機變量,假設存在非負可積函數(shù)f(y)(y),對恣意a和b (ab)都有P(ayb)= , 那么 稱y為延續(xù)型隨機變量(continuous random variate), f(y)稱為y的概率密度函數(shù)(probability density function)或分布密度(distribution density)。 上述例3中的y就是一個延續(xù)型隨機變量。.概率密度的圖形f (x),稱為分布曲線。 概率是曲線下面積!f(x)Xab概率密度曲線f (x)與x軸所圍成的面積為1分布函數(shù)或稱為累積分布函數(shù)是隨機變量X獲得小于x0的值的概率.概率密度函數(shù)圖和概率分布函數(shù)圖概率

14、密度函數(shù)圖 概率分布函數(shù)圖 或 或概率分布曲線 累積分布函數(shù)圖yp(x) yF(x) x1x2x2x1P(x1xx2)=F(x2)F(x1).延續(xù)型隨機變量概率分布的性質:分布密度函數(shù)總是大于或等于0,即f (x)0;當隨機變量x取某一特定值時,其概率等于0;即 (c為恣意實數(shù)) 因此,對于延續(xù)型隨機變量,僅研討其在某一個區(qū)間內取值的概率,而不去討論取某一個值的概率。.第三節(jié) 二項式分布一、二項總體及二項式分布二、二項式分布的概率計算方法三、二項式分布的外形和參數(shù)四、多項式分布.一、二項總體及二項式分布二項總體(binary population),就是非此即彼的兩項構成的總體 例:小麥種子發(fā)

15、芽和不發(fā)芽, 大豆子葉色為黃色和青色, 調查棉田危害分為受害株和不受害株等等。通常將二項總體中的“此事件以變量“1表示,具概率p;將“彼事件以變量“0表示,具概率q。因此二項總體又稱為0、1總體,其概率那么顯然有:p+q=1.假設從二項總體進展n次反復抽樣,設出現(xiàn)“此的次數(shù)為y,那么y的取值能夠為0、1、2、n,共有n+1種能夠取值,這n+1種取值各有其概率,因此由變量y及其概率就構成了一個分布,這個分布叫做二項式概率分布,簡稱二項分布( binomial distribution )。B(n,p 二項總體的抽樣實驗具有反復性和獨立性 反復性是指每次實驗條件不變,即在每次實驗中“此事件出現(xiàn)的概

16、率皆為p 獨立性是指任何一次實驗中“此事件的出現(xiàn)與其他各次實驗中出現(xiàn)何種結果無關.二、二項式分布的概率計算方法數(shù)學上的組合公式為:.二項式中包含兩項,這兩項的概率為p、q,并且p+q=1,可推知變量y的概率函數(shù)為:累積函數(shù)F(y):變量小于等于y的一切能夠取值的概率之和實際次數(shù):對于恣意y,實際次數(shù)=nP(y) 這一分布律也稱貝努里( Bernoulli )分布,并有 .的泰勒展開式為: 可以看到,上式右邊的每一項即為二項分布中變量y 取0、1、2、n時的概率,又p+q=1,從而 (p+q)n=1 .例4.1 棉田盲危害的統(tǒng)計概率乃從調查2000株后獲得近似值p=0.35。現(xiàn)受害株事件為A,其

17、概率為p=0.35,未受害株事件為對立事件,其概率q=(10.35)=0.65。. 如調查5株為一個抽樣單位,即n=5,那么受害株數(shù)y=0,1,2,3,4和5的概率可以計算出來, 假設每次抽5個單株,抽n=400次,那么實際上我們可以得到y(tǒng)=2的次數(shù)應為: 實際次數(shù)=400P(2)=4000.3364=134.56(次)和其累計函數(shù).表4.2 調查單位為5株的概率分布表(p=0.35,q=0.65)受害株數(shù)概率函數(shù)P(y)P(y)F(y)nP(y)P(0)0.11600.116046.40P(1)0.31240.4284124.96P(2)0.33640.7648134.56P(3)0.181

18、10.945972.44P(4)0.04880.994719.52P(5)0.00531.00002.12. 受害株數(shù)(y) 受害株數(shù)(y)圖4.1 棉株受危害的概率分布圖(p=0.35,n=5) 圖4.2 棉株受危害的累積概率函數(shù)圖 (p=0.35,n=5).三、二項式分布的外形和參數(shù)如p=q,二項式分布呈對稱外形,如pq,那么表現(xiàn)偏斜外形 受害株數(shù)( y) 圖4.3 棉株受盲椿害的概率函數(shù)f(y)圖(p=0.5,n=5株) 受害株數(shù)(y) 圖4.1 棉株受盲蝽象為害的概率分布圖(p=0.35,n=5) .二項式分布的參數(shù)平均數(shù)、方差和規(guī)范差如下式上述棉田受害率調查結果,n=5,p=0.35

19、,可求得總體參數(shù)為: =50.35=1.75株, 株。.四、多項式分布所謂多項總體,是指將變數(shù)資料分為3類或多類的總體。 例如在給某一人群運用一種新藥,能夠有的療效好,有的沒有療效,而另有療效為副作用的,就是三項分布。 多項總體的隨機變量的概率分布即為多項式分布(multinomial distribution)。.五、泊松分布二項分布的一種極限分布 ( Poisson distribution )二項分布中往往會遇到一個概率p或q是很小的值,例如小于0.1,另一方面n又相當大,這樣的二項分布必將為另一種分布所接近,或者為一種極限分布。這一種分布稱泊松概率分布,簡稱泊松分布。令np=m,那么泊

20、松分布如下式:y=0,1,2, .泊松分布的平均數(shù) 、方差 和規(guī)范差 如下式: m的大小決議其分布外形。當m值小時分布呈很偏斜外形,m增大后那么逐漸對稱。圖4.4 不同m值的泊松分布.第四節(jié) 正態(tài)分布一、二項分布的極限正態(tài)分布二、正態(tài)分布曲線的特性三、計算正態(tài)分布曲線區(qū)間面積或概率的方法.研討正態(tài)分布的意義:客觀世界的許多景象的數(shù)據是服從正態(tài)分布規(guī)律的。在適當條件下,正態(tài)分布可以用來作二項分布及其它延續(xù)性變數(shù)或延續(xù)性變數(shù)分布的近似分布。雖然某些總體不作正態(tài)分布,但從總體中隨機抽出的樣本平均數(shù)及其它一些統(tǒng)計數(shù)的分布,在樣本容量適當大時依然趨于正態(tài)分布。正態(tài)分布.一、二項分布的極限正態(tài)分布 以上述

21、二項分布棉株受害率為例,假定受害概率p=1/2,那么,p=q=1/2?,F(xiàn)假定每個抽樣單位包括20株,這樣將有21個組,其受害株的概率函數(shù)為 于是概率分布計算如下:. 現(xiàn)將這概率分布繪于圖4.5。從圖4.5看出它是對稱的,分布的平均數(shù) 和方差 為: =npq=20(1/2)(1/2)=5(株)2 。=np=20(1/2)=10(株), .圖4.5 棉株受害率(0.5+0.5)20分布圖如p=q,不論n值大或小,二項分布的多邊形圖必構成對稱;如pq,而n很大時,這多邊形仍趨對稱。 .可以推導出正態(tài)分布的概率密度函數(shù)為: (49) 其中,y是所研討的變數(shù); 是概率密度函數(shù); 和 為總體參數(shù), 表示所

22、研討總體平均數(shù), 表示所研討總體規(guī)范差.參數(shù) 和 有如下的數(shù)學表述 (410) 令 可將(49)式規(guī)范化為: (411) 上式稱為規(guī)范化正態(tài)分布方程,它是參數(shù) 時的正態(tài)分布(圖4.7)。記作N(0,1)。 .正態(tài)分布的曲線圖 -3 -2 -1 0 1 2 3圖4.6 正態(tài)分布曲線圖(平均數(shù)為 ,規(guī)范差為 )圖4.7 規(guī)范正態(tài)分布曲線圖(平均數(shù) 為0,規(guī)范差 為1).二、正態(tài)分布曲線的特點:曲線以平均數(shù)為對稱軸,左右對稱;算術平均數(shù)、中數(shù)、眾數(shù)三位合一;正態(tài)分布曲線是以平均數(shù)和規(guī)范差的不同而表現(xiàn)為一系列曲線;正態(tài)分布資料的次數(shù)分布表現(xiàn)為多數(shù)次數(shù)集中在算是平均數(shù)附近,距之俞遠,次數(shù)俞少;正態(tài)分布曲

23、線在分開平均數(shù)一個規(guī)范差處有拐點,且曲線是以x軸為漸進線;正態(tài)分布曲線與x軸間的面積為1,任何兩個x定值間的面積或概率由平均數(shù)和規(guī)范差確定。正態(tài)分布.圖4.8 規(guī)范差一樣( 1)而平均數(shù)不同( =0、 =1、 =2)的三個正態(tài)分布曲線 圖4.9 平均數(shù)一樣( 0)而規(guī)范差不同( =1、 =1.5、 =2)的三個正態(tài)分布曲線 . 例如,上章水稻140行產量資料的樣本分布表現(xiàn)出接近正態(tài)分布ks數(shù)值(g)區(qū)間(g)區(qū)間內包括的次數(shù)次數(shù)%1s157.9 36.4121.5194.5 99 70.712s157.9 72.8 85.1230.7134 95.713s157.9109.2 48.7267.

24、1140100.00表4.5 140行水稻產量在 1s, 2s, 3s范圍內所包括的次數(shù)表.三、計算正態(tài)分布曲線區(qū)間面積或概率的方法概率可用曲線下區(qū)間的面積來表示,或者說,用其定積分的值表示(413)同樣可以計算曲線下從到y(tǒng)的面積,其公式如下:(414) 這里FN(y)稱為正態(tài)分布的累積函數(shù),具有平均數(shù) 和規(guī)范差 。 .A=P(ayb)fN(y)圖4.10正態(tài)分布密度函數(shù)的積分闡明圖面積A=P(ayb). 現(xiàn)如給予變數(shù)任何一定值,例如a,那么,可以計算ya的概率為FN(a),即(415) 假設a與b(a30就可以運用這一定理。 平均數(shù)的規(guī)范化分布是將上述平均數(shù) 轉換為u變數(shù)。(423) . 例

25、4.9 在江蘇沛縣調查336個m2小地老虎蟲危害情況的結果, =4.73頭, =2.63,試問樣本容量n=30時,由于隨機抽樣得到樣本平均數(shù) 等于或小于4.37的概率為多少? 查附表2,P(u0.75)=0.2266,即概率為22.66% (屬一尾概率)。.(二) 兩個獨立樣本平均數(shù)差數(shù)的分布 假定有兩個正態(tài)總體各具有平均數(shù)和規(guī)范差為 , 和 , ,從第一個總體隨機抽取n1個察看值,同時獨立地從第二個總體隨時機抽取n2個察看值。這樣計算出樣本平均數(shù)和規(guī)范差 ,s1和 ,s2。 從統(tǒng)計實際可以推導出其樣本平均數(shù)的差數(shù)( )的抽樣分布,具有以下特性: (1) 假設兩個總體各作正態(tài)分布,那么其樣本平均數(shù)差數(shù)( )準確地遵照正態(tài)分布律,無論樣本容量大或小,都有N( , )。 . (2) 兩個樣本平均數(shù)差數(shù)分布的平均數(shù)必等于兩個總體平均數(shù)的差數(shù),即 (3) 兩個獨立的樣本平均數(shù)差數(shù)分布的方差等于兩個總體的樣本平均數(shù)的方差總和,即 其差數(shù)規(guī)范差為: (424)這個分布也可規(guī)范化,獲得u值。(425).小結:假設兩個樣本抽自于同一正態(tài)總體,那么其平均數(shù)差數(shù)的抽樣分布不論容量大小亦作正態(tài)分布具:假設兩個樣本抽自于同一總體,但并非正態(tài)總體,那么其平均數(shù)差數(shù)的抽樣分布按中心極限定理在n1和n2相當大時(大于30)才逐漸接近于正態(tài)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論