理論分布和抽樣分布課件_第1頁
理論分布和抽樣分布課件_第2頁
理論分布和抽樣分布課件_第3頁
理論分布和抽樣分布課件_第4頁
理論分布和抽樣分布課件_第5頁
已閱讀5頁,還剩106頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第三章 理論分布和抽樣分布 第一節(jié):概率及其計算 概率論:研究隨機現(xiàn)象規(guī)律性的科學(xué)。 統(tǒng)計學(xué):基于實際觀測結(jié)果,利用概率論得出的規(guī)律,解釋偶然性中所寄寓的必然性。第1頁,共111頁。兩者都是研究隨機現(xiàn)象,概率論是統(tǒng)計學(xué)的基礎(chǔ),統(tǒng)計學(xué)是概率論得出規(guī)律在各領(lǐng)域中的實際應(yīng)用。第2頁,共111頁。一、事件與概率 事件是指某一事物的每一個現(xiàn)象,或某項試驗的每一結(jié)果。(試驗中所發(fā)生的現(xiàn)象)。分類: 、必然事件:在一定條件組下,必然要發(fā)生的事件。 例:在標(biāo)準(zhǔn)大氣壓下,水加熱到100這一組條件實現(xiàn), 則水沸騰是必然事件。 第3頁,共111頁。、不可能事件:在一定條件組下,一定不能發(fā)生的事件。 例:在以上條件實

2、現(xiàn),水結(jié)冰這一事件,就是不可能事件。、隨機事件:在一定條件組實現(xiàn)下,可能發(fā)生也可能不發(fā)生的事件。例:一粒種子播種后發(fā)芽與否。紅花豌豆與白花豌豆雜交,2是紅花。第4頁,共111頁。概率的統(tǒng)計定義: 假定在相似條件下,重復(fù)進行同一類試驗,事件發(fā)生的次數(shù)a 與總試驗次數(shù)n的比數(shù)稱為頻率a/n,在試驗總次數(shù)n逐漸增大時, 事件的頻率愈來愈穩(wěn)定地接近定值p,于是定義事件的概率為p,并記為 P(A)=p第5頁,共111頁。一個總體的概率值在理論上是存在的,但在一般情況下,無法得到這個數(shù)值,只有通過樣本的頻率來推斷總體概率。因此便以n在充分大時事件的頻率作為該事件概率p的近似值,即 (A)=p(a/n)第6

3、頁,共111頁。概率的表示: 小數(shù)分?jǐn)?shù)0p(A)1 P(A)=1 時為必然事件 P(A)=0 時為不可能事件第7頁,共111頁。二、事件間的關(guān)系基本事件:就是不可能再分的事件。復(fù)合事件:由若干個基本事件組合而成的事件。 第8頁,共111頁。以“事件”一詞代表隨機事件,并以字母A, B, C. 等表示,以U表示必然事件,以V代表不可能事件。 1.事件A與事件B至少有一件發(fā)生而構(gòu)成的新事件稱為事件A與事件B的和事件。記作:A+B讀作“或A發(fā)生,或B發(fā)生” 第9頁,共111頁。 和事件可以推廣到個事件:A+B+C+.+N表示N個事件至少有一個發(fā)生。 第10頁,共111頁。 2.兩個事件A與B同時發(fā)生

4、而構(gòu)成的新事件稱為事件A與事件B的積事件。記作: A.B,讀作“AB同時發(fā)生”第11頁,共111頁。積事件可以推廣到多個事件的情形:A.B.C.N表示N個事件同時發(fā)生。第12頁,共111頁。 3.兩個事件A與B如果不能同時發(fā)生,即A.B=V,那么稱A和B是互斥事件。例:任一玉米株高2.5m以上(A) 任一玉米株高2.0-2.5m(B) A.B:任一玉米株高既高于2.5m又在2.0-2.5m之間。拋硬幣:A:正面朝上B:反面朝上第13頁,共111頁。 4.如果事件A與事件必發(fā)生其一,但又不可能同時發(fā)生,即:A+B=u,A.B=V, 那么B是A的對立事件,可用表示。 第14頁,共111頁。 5.如

5、果事件A1、A2.An兩兩互斥,且每次試驗必發(fā)生其一,則稱A1、A2.An為完全事件系。例:袋中有紅、黃、黑、白四種顏色的球,每次取一個,“取到紅球”、“取到黃球”、“取到黑球”、“取到白球”構(gòu)成完全事件系。第15頁,共111頁。 、如果事件的發(fā)生與否不影響事件的發(fā)生,則稱其相互獨立。例:A:第一粒種子發(fā)芽B:第二粒種子發(fā)芽第16頁,共111頁。三、計算概率的法則法則一: 對立事件的概率:若事件A的概率為P( A),那么其對立事件的概率為 P()=1-P(A) 例:小麥播種后發(fā)芽的概率為0.9,那么,不發(fā)芽的概率為(1-0.9)=0.1第17頁,共111頁。法則二: 互斥事件概率的加法: 若事

6、件A與事件B是互斥的,概率各為P(A)和P(B),那么“A+B ”事件的概率為 P(A+B)=P(A)+P(B)第18頁,共111頁。法則三:獨立事件概率的乘法: 若確定事件A的概率時不受到事件B的影響,反之亦然,那么,這兩個事件是互相獨立,稱獨立事件。對于這類事件,同時出現(xiàn)這一新事件的概率必為每個事件概率的積。 P(A.B)=p(A).P(B)第19頁,共111頁。法則四:完全事件系的概率 若A1,A2.An是完全事件系,則這n個事件的概率之和為1,即P(A1+A2+A3+.+An)=P(A1)+P(A2)+.+P(An)=1如果n個事件出現(xiàn)的概率是相等的,那么 P(Ai)=1/n第20頁,

7、共111頁。第二節(jié)總體分布一、二項分布(binomial distribution)(一)二項分布的概率函數(shù)二項總體:有非此即彼事件組成的總體。二項分布:以容量n從二項總體中抽樣,共有n+1種可能的結(jié)果,每種結(jié)果都有一個固定的概率,這種變量取值及其概率構(gòu)成的分布稱為二項分布.第21頁,共111頁。種子發(fā)芽試驗:一粒種子:發(fā)芽概率p、不發(fā)芽概率q概率相加得(p+q)兩粒種子: 甲乙均發(fā)芽:概率為p2 甲發(fā)乙不發(fā):概率為p(1-p)pq 乙發(fā)甲不發(fā):qp 甲乙均不發(fā):q2概率相加得p2+pq+qp+q2=(p+q)2第22頁,共111頁。依此類推,獨立地對n粒種子進行實驗,一種結(jié)果出現(xiàn)x次的概率是

8、:稱為二項分布律或二項概率函數(shù),是(p+q)n展開后含有p(x)的一項這一分布律也稱為貝努里分布第23頁,共111頁。其中,x=0,1,2,n, 為某事件出現(xiàn)次數(shù)。n為樣本含量,即事件發(fā)生總數(shù).第24頁,共111頁。二項分布是說明結(jié)果只有兩種情況的n次獨立實驗中發(fā)生某種結(jié)果為x次的概率分布。 第25頁,共111頁。因為(p+q),所以第26頁,共111頁。二項分布的累積函數(shù): 二項分布中某結(jié)果最多發(fā)生k次的概率為發(fā)生0次、1次、.、直至k次的概率之和:第27頁,共111頁。(二)二項分布的應(yīng)用條件:(1) 每次實驗只有兩類對立的結(jié)果;(2) n次事件相互獨立;(3) 每次實驗?zāi)愁惤Y(jié)果的發(fā)生的概

9、率是一個常數(shù)。第28頁,共111頁。(三)二項分布的參數(shù)二項分布總體的平均數(shù)和標(biāo)準(zhǔn)差為:第29頁,共111頁。二項分布常表示為:B(n,p)即:二項分布是由n和p兩個參數(shù)據(jù)定的。 第30頁,共111頁。(四)二項分布的形狀二項分布的形狀有如下特征:(1)二項分布圖形的形狀取決于P 和n 的大小;(2) 當(dāng)P=0.5時,無論n的大小,均為對稱分布;(3)當(dāng)p0.5 ,n較小時為偏態(tài)分布,n較大時逼近正態(tài)分布。 第31頁,共111頁。一般來說,當(dāng)n大于,而p或q又不過?。ɡ绮唤咏冢?,且np及nq不小于時,可將其看作正態(tài)分布,可用正態(tài)公式求其概率。第32頁,共111頁。(五)二項分布的應(yīng)用實例

10、、一批種子的發(fā)芽率為0.8,現(xiàn)每穴播粒,問每穴出三棵苗的概率?平均每穴出苗幾棵?本例中,每穴出苗數(shù)為隨機變量X,它服從B(5,0.8),故:第33頁,共111頁。若計算每穴出苗數(shù)低于4棵的概率,則計算累積概率:P(X3)=P(X=0)+P(X=1)+P(X=2)+P(X=3)平均每穴出苗數(shù):=np=50.8=4第34頁,共111頁。、兩個純合親本雜交(RRrr),F1自交,F(xiàn)2的基因型分離比。F2中,R基因出現(xiàn)的概率p=0.5,r基因出現(xiàn)的概率q=0.5第35頁,共111頁。一對因子:第36頁,共111頁。兩對因子:YYRRyyrrF2中顯:顯:顯:顯:顯第37頁,共111頁。3、兩對基因分離

11、:bbRRBBrrF1 BbRrF2 9B-R-:3B-rr:3bbR-:1bbrr問:樣本容量多大時,才能以99的概率至少得到一個bbrr個體?第38頁,共111頁。解:bbrr的概率q=1/16,非bbrr出現(xiàn)概率p=15/16。得到bbrr的概率99%,則非bbrr為,所以: pn=(15/16)n=0.01n(lg15-lg16)=lg0.01n=71.4因此:要以的可能獲得一個bbrr個體,樣本容量只少為。第39頁,共111頁。二、Poisson分布1. Poisson分布的概念:二項分布n很大而P很小時的特殊形式。其概率函數(shù) x=0,1,2.n,其中e為自然對數(shù)的底,為總體均數(shù),x

12、為事件發(fā)生的次數(shù)。第40頁,共111頁。主要描述大量實驗中隨機稀疏現(xiàn)象,如:單位面積內(nèi)的昆蟲數(shù)、病斑數(shù)、植物種類、細(xì)胞計數(shù)、田間雜草分布等。第41頁,共111頁。2. Poisson分布的應(yīng)用條件:(1) 兩類結(jié)果要相互對立;(2) n次試驗相互獨立;(3) n應(yīng)很大, P應(yīng)很小。第42頁,共111頁。3. Poisson分布的參數(shù)方差與平均數(shù)相等,只有一個參數(shù)。 第43頁,共111頁。4. Poisson分布的性質(zhì):(1) 均數(shù)與方差相等;(2) 均數(shù)較小時呈偏態(tài),20時近似正態(tài);(3) n很大, p很小,np=為常數(shù)時二項分布趨近于Poisson分布;(4) n個獨立的Poisson分布相

13、加仍符合Poisson分布第44頁,共111頁。5、形狀由決定:很小時分布很偏,增大后逐漸對稱,趨近于正態(tài)分布 第45頁,共111頁。三、正態(tài)分布(normal distribution)(一)正態(tài)分布的密度函數(shù)和分布函數(shù)是連續(xù)性變數(shù)的一種理論分布。許多生物學(xué)產(chǎn)生的數(shù)據(jù)都服從正態(tài)分布。正態(tài)分布是生物統(tǒng)計學(xué)的重要基礎(chǔ) 第46頁,共111頁。對于平均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)分布,其概率密度函數(shù)為:-x 第47頁,共111頁。其中:平均數(shù),是曲線最高值的橫坐標(biāo),曲線以其為對稱;標(biāo)準(zhǔn)差,表示曲線展開程度,越大,曲線展開度越大,數(shù)據(jù)越分散;越小,曲線展開度越小,數(shù)據(jù)越集中;有了和,曲線形狀就可以確定下來。第

14、48頁,共111頁。,標(biāo)準(zhǔn)差為的正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布(standard normal distribution)。以N(,2)表示平均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)分布;以N(,)表示標(biāo)準(zhǔn)正態(tài)分布。第49頁,共111頁。第50頁,共111頁。累積分布函數(shù):第51頁,共111頁。(二)正態(tài)分布曲線的特性、以為原點左右對稱;、x=處f(x)具有最大值,且算術(shù)平均數(shù)、中數(shù)、眾數(shù)合于這一點;、是一個曲線簇,由和確定:確定在x軸上的位置,確定其變異度;第52頁,共111頁。以平均數(shù)和標(biāo)準(zhǔn)差不同的正態(tài)分布系列曲線第53頁,共111頁。、在x=1有拐點;、x取值范圍是,,但多數(shù)集中在附近,離其越遠(yuǎn),次數(shù)越少;且在

15、 x- 相等處具有相等次數(shù)。、曲線的總面積等于。曲線下任何定值之間的面積等于這兩個定值間面積占總面積的成數(shù),或者說變量落入這個區(qū)間內(nèi)的概率。第54頁,共111頁。幾個常用區(qū)間與其相應(yīng)的面積或概率區(qū)間面積或概率 0.68272 0.95453 0.99731.960 0.95002.576 0.9900第55頁,共111頁。第56頁,共111頁。區(qū)間面積或概率10.682720.954530.99731.9600.95002.5760.9900正態(tài)分布第57頁,共111頁。(三)標(biāo)準(zhǔn)正態(tài)分布將x離其平均數(shù)的差數(shù)以為單位進行轉(zhuǎn)換,于是: u為正態(tài)離差??蓪⒁话惴匠剔D(zhuǎn)為標(biāo)準(zhǔn)正態(tài)分布方程。第58頁,共

16、111頁。概率密度函數(shù):-u 第59頁,共111頁。(四)正態(tài)分布區(qū)間概率的計算方法隨機變量落在某區(qū)間(a,b)內(nèi)的概率,可以從標(biāo)準(zhǔn)正態(tài)分布累積分布函數(shù)表中查出。對于一般的正態(tài)分布,先將其化為標(biāo)準(zhǔn)正態(tài)分布再查表 .第60頁,共111頁。例:u=-0.82, (0.82)0.2061 u=1.15 (u)=0.8749例:隨機變量U服從N (0,1),求其落在0,1.21間的概率:P(0U1.21)= (1.21)(0)=0.88690.5000=0.3869落在-1.96和1.96之間的概率:P(|U|u)=1-2(-u)=1-2(-1.96) 1-0.0500=0.9500第61頁,共111

17、頁。正態(tài)分布第62頁,共111頁。例:變量X服從N (156.2,4.822),求:(1)X164; (3)152X162的概率第63頁,共111頁。(1) (161-156.2)/4.82=1 P(X164)=1-P(X164)= P(X-164)=(-u)=(-1.62)=0.0526 第64頁,共111頁。(3) u1=(152-156.2)/4.82= -0.87 u2=(162-156.2)/4.82=1.2P(152P162)= (u2)-(u1) =(1.2)-(-0.87)=0.8849-0.1921=0.6928第65頁,共111頁。(五)正態(tài)分布的單側(cè)分位數(shù)/臨界值上面介紹

18、了正態(tài)分布區(qū)間概率的計算方法。即對于給定的u,通過正態(tài)分布累積函數(shù)表查Uu)= 時的u值。u稱為的上側(cè)分位數(shù)。對于左側(cè)尾區(qū),滿足:P(Uu/2)= 時的u/2稱為的雙側(cè)分位數(shù)。第67頁,共111頁。第68頁,共111頁。對于單尾表(上側(cè)分位):對于雙尾表: 第69頁,共111頁。第三節(jié) 抽樣分布(sampling distribution) 可從兩個方向研究總體與樣本的關(guān)系:一是總體到樣本,即由已知的總體研究樣本的分布規(guī)律;二是從樣本到總體的方向,即由樣本推斷未知的總體。抽樣分布是研究第一個方向的問題,是統(tǒng)計推斷的基礎(chǔ)。第70頁,共111頁。第71頁,共111頁。從一個總體進行隨機抽樣:從無限

19、總體中可抽取無限多個隨機樣本。從容量為N的有限總體:樣本容量為n,有Nn個所有可能樣本。每個樣本可得一平均數(shù): ,構(gòu)成一新的總體,平均數(shù)為新總體的變量。每一平均數(shù)會有差異,所以平均數(shù)新總體也有其分布,稱為平均數(shù)的抽樣分布。 第72頁,共111頁。(一)從一個正態(tài)總體抽出的隨機樣本的平均數(shù)分布、總體標(biāo)準(zhǔn)差已知時的平均數(shù)分布u分布從一個正態(tài)總體抽出的隨機樣本,無論樣本容量大小,其樣本平均數(shù)的抽樣分布必呈正態(tài)分布第73頁,共111頁。若總體不是正態(tài)分布,但具有一定量的和2,只要樣本容量n足夠大(一般n30),從總體抽出的樣本平均數(shù)也近似地服從正態(tài)分布N(,2/n ),稱為中心極限定理。 第74頁,共

20、111頁。(1)該抽樣分布的平均數(shù)與母總體的平均數(shù)相等(2)該抽樣分布的方差與母總體方差間存在如下關(guān)系: 即:第75頁,共111頁。第76頁,共111頁。標(biāo)準(zhǔn)化:其中,n為樣本容量, 是樣本平均數(shù)分布的標(biāo)準(zhǔn)差,稱為標(biāo)準(zhǔn)誤(差),可以度量抽樣分布的變異 第77頁,共111頁。例:從N3(2,4,6),以n=1,2,4,8復(fù)置抽樣第78頁,共111頁。n=1n=2n=4n=8 ffff2122122.0122.00122.258182.54102.5036902.751123083263.010303.002667983.2550416383.516563.5078427443.751 01638

21、1041443124.019764.001 10744284.251 01643184.516724.5078435284.75504239452105.010505.0026613305.251125885.54225.50361985.758466166166.0166.00166總和31293681324656126244均數(shù)12/3= (4)36/9= (4)324/ 81 =(4)26244 / 6561= (4)方差8/34/32/31/3第79頁,共111頁。、總體標(biāo)準(zhǔn)差未知(或雖然總體標(biāo)準(zhǔn)差已知,但總體不呈正態(tài),且n較小)時的平均數(shù)分布t分布總體2未知,可以用樣本標(biāo)準(zhǔn)差代替總體

22、標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)化變量 不服從正態(tài)分布,而是服從自由度為n-1的t分布 第80頁,共111頁。其中 , 為標(biāo)準(zhǔn)誤。第81頁,共111頁。t分布也是一組對稱密度函數(shù)曲線分布,它只有一個參數(shù)自由度確定其分布。與正態(tài)曲線相比,t分布曲線稍微扁平,峰頂略低,尾部稍高。理論上,隨著自由度的增大,t 分布趨于正態(tài)分布:30時接近正態(tài)曲線,時,與正態(tài)曲線合一。第82頁,共111頁。第83頁,共111頁。正態(tài)分布t分布40。正態(tài)分布t分布4000.10.20.30.4123-3-2-1正態(tài)分布曲線與t分布曲線的比較第84頁,共111頁。概率密度函數(shù):t分布的平均數(shù)和標(biāo)準(zhǔn)差:第85頁,共111頁。t 分布的累積函數(shù)

23、:第86頁,共111頁。t分布的概率累積函數(shù)也分為一尾表和兩尾表,一尾表是t到的面積,兩尾表是-t到-的面積和t到的面積之和。單尾表表頭上的各概率()是t大于表中所列t值時的概率。例如從表中查出df=9, =0.05的t單側(cè)分位數(shù)t0.05=1.8331,表示t1.8331 時,曲線下面積(或概率)為0.05第87頁,共111頁。由于曲線的對稱性,對于單側(cè)分位數(shù)可以表示為:P(tt)=P(t-t)= 第88頁,共111頁。兩尾時,每一尾的面積只有給出概率的1/2 。例如df=9, =0.05的t雙側(cè)分位數(shù),就要查/2=0.025時的單側(cè)分位數(shù):t0.025,9=2.2622,由于對稱性,另一側(cè)

24、-t0.025,9=-2.2622即:t2.2622和t2.2622(相當(dāng)于|t|2.2622)兩尾面積之和為0.05。第89頁,共111頁。(二)樣本總和數(shù)的抽樣分布樣本總和數(shù)(以x表示)的抽樣分布參數(shù)與母總體間存在如下關(guān)系:()抽樣分布的平均數(shù)是母總體平均數(shù)的n倍xn(2) 抽樣分布的方差是母總體方差的n倍x2n2第90頁,共111頁。(三)從兩個正態(tài)總體抽出的隨機樣本的平均數(shù)差數(shù)的分布總體N(,12),以n1抽樣: ,s1;總體2N(,22),以n2抽樣: , s2;第91頁,共111頁。、標(biāo)準(zhǔn)差1、已知: 兩者抽樣相互獨立,則兩個獨立隨機抽取的樣本平均數(shù)間差數(shù)( )的抽樣分布參數(shù)與兩個母總體間存在如下關(guān)系:第92頁,共111頁。第93頁,共111頁。標(biāo)準(zhǔn)化: 第94頁,共111頁。、標(biāo)準(zhǔn)差1、未知:若1、未知,但兩個總體相互獨立而且都是正態(tài)分布,同時1= =,則差數(shù)分布服從df1+df2的t分布,其中df1=n1-1,df2=n2-1;第95頁,共111頁。第96頁,共111頁。3 近似t分布: 當(dāng)兩個總體標(biāo)準(zhǔn)差1和2未知,且12,符合近似t檢驗因為12,差數(shù)標(biāo)準(zhǔn)誤需用兩個樣本的S1、S2均方分別估計1、2第97頁,共111頁。具有自由度第98頁,共111頁。二、二項總體的抽樣分布(一)樣本平均數(shù)(成數(shù))的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論