版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
生物統(tǒng)計學(xué)
實(shí)驗(yàn)統(tǒng)計方法2024/5/111提問4何為算術(shù)平均數(shù)?計算方法?離均差、方差、標(biāo)準(zhǔn)差的定義和計算方法。如何理解自由度?2024/5/112本章導(dǎo)語本章將討論總體的分布及其特征。間斷性變數(shù)總體的理論分布,包括二項(xiàng)分布和泊松分布。連續(xù)性變數(shù)總體的理論分布,即正態(tài)分布。介紹從這兩類理論分布中抽出的樣本統(tǒng)計數(shù)的分布,即抽樣分布。2024/5/113第四章理論分布和抽樣分布2024/5/114本章主要內(nèi)容第一節(jié)事件、概率和隨機(jī)變量第二節(jié)二項(xiàng)式分布第三節(jié)正態(tài)分布第四節(jié)抽樣分布2024/5/115本章主要內(nèi)容第一節(jié)事件、概率和隨機(jī)變量第二節(jié)二項(xiàng)式分布第三節(jié)正態(tài)分布第四節(jié)抽樣分布
2024/5/116第一節(jié)事件、概率和隨機(jī)變量一、事件和事件發(fā)生的概率二、事件間的關(guān)系三、計算事件概率的法則四、隨機(jī)變量2024/5/117一、事件和事件發(fā)生的概率事件:在自然界中一種事物,常存在幾種可能出現(xiàn)的情況,每一種可能出現(xiàn)的情況稱為事件。隨機(jī)事件(randomevent):某特定事件只是可能發(fā)生的幾種事件中的一種,這種事件稱為隨機(jī)事件。概率(probability):每一個事件出現(xiàn)的可能性稱為該事件的概率。2024/5/118必然事件:對于一類事件來說,在同一組條件的實(shí)現(xiàn)之下必然要發(fā)生的,稱為必然事件;其概率為1。不可能事件:對于一類事件來說,在同一組條件的實(shí)現(xiàn)之下必然不發(fā)生的,稱為不可能事件,其概率為0。
2024/5/119表4.1在相同條件下盲蝽象在某棉田危害程度的調(diào)查結(jié)果調(diào)查株數(shù)(n)52550100200500100015002000受害株數(shù)(a)
212153372177351525704棉株受害頻率(a/n)0.400.480.300.330.360.3540.3510.3500.3522024/5/1110統(tǒng)計學(xué)上用n較大時穩(wěn)定的p近似代表概率。通過大量實(shí)驗(yàn)而估計的概率稱為實(shí)驗(yàn)概率或統(tǒng)計概率。以P代表概率,P(A)代表事件A的概率,P(A)變化的范圍為0~1,即0≤P(A)≤1。
6、小概率原理:若事件A發(fā)生的概率較小,如小于0.05或0.01,則認(rèn)為事件A在一次試驗(yàn)中不太可能發(fā)生,這稱為小概率事件實(shí)際不可能性原理,簡稱小概率原理。這里的0.05或0.01稱為小概率標(biāo)準(zhǔn),農(nóng)業(yè)試驗(yàn)研究中通常使用這兩個小概率標(biāo)準(zhǔn)。2024/5/1111二、事件間的關(guān)系(一)和事件(二)積事件(三)互斥事件(四)對立事件(五)完全事件系(六)事件的獨(dú)立性2024/5/1112(一)和事件事件A和B至少有一個發(fā)生而構(gòu)成的新事件稱為事件A和B的和事件,記為A+B,讀作“或A發(fā)生,或B發(fā)生”?!纠纭坑幸慌N子,包含有能發(fā)芽的和不能發(fā)芽的。若A為“取到能發(fā)芽種子”,B為“取到不能發(fā)芽種子”,則A+B為“或者取到能發(fā)芽種子或者取到不能發(fā)芽種子”。2024/5/1113事件間的和事件可以推廣到多個事件:事件A1、A2、…、An至少有一發(fā)生而構(gòu)成的新事件稱為事件A1、A2、…、An的和事件,記為A1+A2+…+An=2024/5/1114(二)積事件事件A和B同時發(fā)生所構(gòu)成的新事件稱為事件A和B的積事件,記作AB,讀作“A和B同時發(fā)生或相繼發(fā)生”。事件間的積事件也可以推廣到多個事件:事件A1、A2、…、An同時發(fā)生所構(gòu)成的新事件稱為這n個事件的積事件:記作A1A2…An=2024/5/1115(三)互斥事件事件A和B不可能同時發(fā)生,即AB為不可能事件,記作A·B=V,稱事件A和B互斥或互不相容?!纠纭坑幸淮N子,按種皮分黃色和白色。若記A為“取到黃色”,B為“取到白色”,顯然A和B不可能同時發(fā)生,即一粒種子不可能既為黃色又為白色,說明事件A和B互斥。2024/5/1116(四)對立事件事件A和B不可能同時發(fā)生,但必發(fā)生其一,即A+B為必然事件(記為A+B=U),AB為不可能事件(記為A·B=V),則稱事件B為事件A的對立事件,并記B為
。【例如】上面例子中A為“取到黃色”,B為“取到白色”,A與B不可能同時發(fā)生,但是,任意抽取一粒種子,其皮色不是黃色就是白色,即A和B必發(fā)生其一,因此,A和B互為對立事件。2024/5/1117積事件AB和事件A+BABAB互斥事件
對立事件AB2024/5/1118(五)完全事件系若事件A1、A2、…、An兩兩互斥,且每次試驗(yàn)結(jié)果必發(fā)生其一,則稱A1、A2、…、An為完全事件系。
【例如】僅有三類花色:黃色、白色和紅色,則取一朵花,“取到黃色”、“取到白色”和“取到紅色”就構(gòu)成完全事件系。2024/5/1119(六)事件的獨(dú)立性若事件A發(fā)生與否不影響事件B發(fā)生的可能性,則稱事件A和事件B相互獨(dú)立?!纠纭渴录嗀為“花的顏色為黃色”,事件B為“產(chǎn)量高”,顯然如果花的顏色與產(chǎn)量無關(guān),則事件A與事件B相互獨(dú)立。2024/5/1120三、計算事件概率的法則(一)互斥事件的加法(二)獨(dú)立事件的乘法(三)對立事件的概率(四)完全事件系的概率(五)非獨(dú)立事件的乘法2024/5/1121(一)互斥事件的加法
假定兩互斥事件A和B的概率分別為P(A)和P(B)。則事件A與B的和事件的概率等于事件A的概率與事件B的概率之和,即P(A+B)=P(A)+P(B)。2024/5/1122加法定理對于多個兩兩互斥的事件也成立:假定A1、A2、…、An
n個事件彼此間均是兩兩互斥的事件,其概率依次為P(A1),P(A2),…,P(An),則A1,A2到An和事件的概率P(A1+A2+…+An)等于P(A1),P(A2),…,P(An)之和,即P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)。2024/5/1123【例如】一捆花中紅、黃、白花的概率分別為0.2、0.3、0.5,那么我們隨機(jī)抽取一朵非白色花的概率為0.5(=0.2+0.3),這只是由加法定理得到的兩個事件概率之和。2024/5/1124(二)獨(dú)立事件的乘法假定P(A)和P(B)是兩個獨(dú)立事件A與B各自出現(xiàn)的概率,則事件A與B同時出現(xiàn)的概率等于兩獨(dú)立事件出現(xiàn)概率P(A)與P(B)的乘積,即P(AB)=P(A)P(B)。乘法定理對于n個相互獨(dú)立的事件也成立。假定P(A1),P(A2),…,P(An)是n個相互獨(dú)立事件各自出現(xiàn)的概率,則該n個事件同時出現(xiàn)的概率P(A1A2…An)等于各自出現(xiàn)概率之乘積,即P(A1A2…An)=P(A1)P(A2)…P(An)。2024/5/1125現(xiàn)有4粒種子,其中3粒為黃色、1粒為白色,采用復(fù)置抽樣。試求下列兩事件的概率:(A)第一次抽到黃色、第二次抽到白色;(B)兩次都抽到黃色。復(fù)置抽樣:即每一次抽出觀察結(jié)果后又放回再進(jìn)行下一次抽樣,所以第一次和第二次的抽樣結(jié)果間是相互獨(dú)立的。2024/5/1126采用概率的古典定義,可以求出抽到黃色種子的概率為0.75,抽到白色種子的概率為0.25。因此,有:P(A)=P(第一次抽到黃色種子)P(第二次抽到白色種子)
=0.25×0.75=0.1875,P(B)=P(第一次黃色種子)P(第二次黃色種子)
=0.75×0.75=0.5625。2024/5/1127(三)對立事件的概率若事件A的概率為P(A),那么其對立事件的概率為:2024/5/1128
(四)完全事件系的概率完全事件系的概率為1。例如“從10個數(shù)字中隨機(jī)抽得任何一個數(shù)字都可以”這樣一個事件是完全事件系,其概率為1。
2024/5/1129(五)非獨(dú)立事件的乘法
如果事件A和B是非獨(dú)立的,那么事件A與B同時發(fā)生的概率為事件A的概率P(A)乘以事件A發(fā)生的情況下事件B發(fā)生的概率P(B|A),即:P(AB)=P(A)P(B|A)2024/5/1130四、隨機(jī)變量隨機(jī)變量是指隨機(jī)變數(shù)所取的某一個實(shí)數(shù)值。【例1】拋硬幣試驗(yàn),硬幣落地后只有兩種可能結(jié)果:幣值面向上和國徽面向上,用數(shù)“1”表示“幣值面向上”,用數(shù)“0”表示“國徽面向上”。把0,1作為變量y的取值。在討論試驗(yàn)結(jié)果時,就可以簡單地把拋硬幣試驗(yàn)用取值為0,1的變量來表示。
P(y=1)=0.5,P(y=0)=0.52024/5/1131
【例2】:用“1”表示“能發(fā)芽種子”,其概率為p;用“0”表示“不能發(fā)芽種子”,其概率為q。顯然
p+q=1,則
P(y=1)=p,P(y=0)=q=1-p。2024/5/1132離散型隨機(jī)變量
:當(dāng)試驗(yàn)只有幾個確定的結(jié)果,并可一一列出,變量y的取值可用實(shí)數(shù)表示,且y取某一值時,其概率是確定的。將這種變量的所有可能取值及其對應(yīng)概率一一列出所形成的分布稱為離散型隨機(jī)變量的概率分布:概率變量yiy1y2y3…ynP1P2P3…Pn也可用函數(shù)f(y)表述,稱為概率函數(shù)。2024/5/1133例1、例2中的y就是離散型隨機(jī)變量,將其可能取值與對應(yīng)概率一一列出,即為:變量y01概率0.50.5變量y01概率qp2024/5/1134
【例3】用變量y表示水稻產(chǎn)量,若y大于500kg的概率為0.25,大于300kg且等于小于500kg的概率為0.65,等于小于300kg的概率為0.1。則用變量y的取值范圍來表示的試驗(yàn)結(jié)果為
P(y≤300)
=
0.10,P(300<y≤500)
=
0.65,P(y>500)
=
0.25。2024/5/1135連續(xù)型隨機(jī)變量(continuousrandomvariate)非負(fù)可積函數(shù)f(y)(-∞<y<+∞),對任意a和b(a<b)都有P(a≤y<b)=,則稱y為連續(xù)型隨機(jī)變量。2024/5/1136本章主要內(nèi)容第一節(jié)事件、概率和隨機(jī)變量第二節(jié)二項(xiàng)式分布第三節(jié)正態(tài)分布第四節(jié)抽樣分布
2024/5/1137第二節(jié)二項(xiàng)式分布一、二項(xiàng)總體及二項(xiàng)式分布二、二項(xiàng)式分布的概率計算方法三、二項(xiàng)式分布的形狀和參數(shù)四、多項(xiàng)式分布2024/5/1138一、二項(xiàng)總體及二項(xiàng)式分布
二項(xiàng)總體(binarypopulation):“非此即彼”。
【例如】小麥種子發(fā)芽和不發(fā)芽,大豆子葉色為黃色和青色,調(diào)查棉田盲蝽象危害分為受害株和不受害株等等。二項(xiàng)總體又稱為“0、1”總體,其概率則顯然有:p+q=1或q=1-p2024/5/1139
如果從二項(xiàng)總體進(jìn)行n次重復(fù)抽樣,設(shè)出現(xiàn)“此”的次數(shù)為y,那么y的取值可能為0、1、2、…、n,共有n+1種可能取值,這n+1種取值各有其概率。
二項(xiàng)總體的抽樣試驗(yàn)具有重復(fù)性和獨(dú)立性。重復(fù)性是指每次試驗(yàn)條件不變,即在每次試驗(yàn)中“此”事件出現(xiàn)的概率皆為p.獨(dú)立性是指任何一次試驗(yàn)中“此”事件的出現(xiàn)與其余各次試驗(yàn)中出現(xiàn)何種結(jié)果無關(guān).2024/5/1140二、二項(xiàng)式分布的概率計算方法二項(xiàng)式中包含兩項(xiàng),這兩項(xiàng)的概率為p、q,并且p+q=1,可推知變量y的概率函數(shù)為:2024/5/1141的泰勒展開式為:可以看到,上式右邊的每一項(xiàng)即為二項(xiàng)分布中變量y
取0、1、2、…、n時的概率,又p+q=1,從而(p+q)n=1
2024/5/1142累積函數(shù)F(y):變量小于等于y的所有可能取值的概率之和。理論次數(shù):對于任意y,理論次數(shù)=nP(y)。
這一分布律也稱貝努里(Bernoulli)分布,并有
2024/5/1143
【例4.1】棉田盲蝽象為害的統(tǒng)計概率乃從調(diào)查2000株后獲得近似值p=0.35?,F(xiàn)受害株事件為A,其概率為p=0.35,未受害株事件為對立事件,其概率q=(1-0.35)=0.65。這一試驗(yàn)是可以重復(fù)的。假定做了n次試驗(yàn),即抽出n株為一個抽樣單位,那么,試問出現(xiàn)有y株是受害的,其概率應(yīng)有多少?
假定以n=1,即抽出一株為一個抽樣單位,這里已知P(A)=0.35和P()=0.65,總體的理論次數(shù)分布則以n乘上述概率分布,即np和n(1-p),所以有2000×0.35=700株受害和2000×0.65=1300株未受害。2024/5/1144如調(diào)查5株為一個抽樣單位,即n=5,則受害株數(shù)y=0,1,2,3,4和5的概率可以計算出來,如表4.2。棉株受害數(shù)乃一隨機(jī)變數(shù)(y),可以計算變量y相應(yīng)的概率函數(shù)
如果每次抽5個單株,抽n=400次,則理論上我們能夠得到y(tǒng)=2的次數(shù)應(yīng)為:理論次數(shù)=400×P(2)=400×0.3364=134.56(次)累計函數(shù)2024/5/1145表4.2調(diào)查單位為5株的概率分布表(p=0.35,q=0.65)受害株數(shù)概率函數(shù)P(y)P(y)F(y)nP(y)P(0)0.11600.116046.40P(1)0.31240.4284124.96P(2)0.33640.7648134.56P(3)0.18110.945972.44P(4)0.04880.994719.52P(5)0.00531.00002.122024/5/1146
受害株數(shù)(y)受害株數(shù)(y)圖4.1棉株受盲蝽象為害的概率分布圖(p=0.35,n=5)圖4.2棉株受盲蝽象為害的累積概率函數(shù)F(y)圖(p=0.35,n=5)2024/5/1147
【例4.2】某種昆蟲在某地區(qū)的死亡率為40%,即p=0.4,現(xiàn)對這種害蟲用一種新藥進(jìn)行治療試驗(yàn),每次抽樣10頭作為一組治療。試問如新藥無療效,則在10頭中死3頭、2頭、1頭,以及全部愈好的概率為多少?按上述二項(xiàng)分布概率函數(shù)式計算
7頭愈好,3頭死去概率:8頭愈好,2頭死去概率:9頭愈好,1頭死去概率:10頭全部愈好的概率:2024/5/1148若問10頭中不超過2頭死去的概率為多少?則應(yīng)該應(yīng)用累積函數(shù),即:2024/5/1149三、二項(xiàng)式分布的形狀和參數(shù)
p=1/2時,圖4.3為棉株受害概率的概率分布圖。如p=q,二項(xiàng)式分布呈對稱形狀,如p≠q,則表現(xiàn)偏斜形狀。
受害株數(shù)(y)
圖4.3棉株受盲椿害的概率函數(shù)f(y)圖(p=0.5,n=5株)2024/5/1150二項(xiàng)式分布的參數(shù)
仍以上述棉株受害為例,抽取5株中受害株數(shù)的多少(y)作為統(tǒng)計指標(biāo)的話,從總體中可以抽取的所有樣本均有一個y,這樣所有的y構(gòu)成了一個新總體,該總體也屬于二項(xiàng)式總體,其平均數(shù)、方差和標(biāo)準(zhǔn)差如下式從而,上述棉田受害率調(diào)查結(jié)果,n=5,p=0.35,可求得總體參數(shù)為:=5×0.35=1.75株,
株。2024/5/1151四、多項(xiàng)式分布
多項(xiàng)總體,是指將變數(shù)資料分為3類或多類的總體。例如在給某一人群使用一種新藥,可能有的療效好,有的沒有療效,而另有療效為副作用的,就是三項(xiàng)分布。多項(xiàng)總體的隨機(jī)變量的概率分布即為多項(xiàng)式分布(multinomialdistribution)。2024/5/1152設(shè)總體中共包含有k項(xiàng)事件,它們的概率分別為p1、p2、p3、…、pk,顯然p1+p2+p3+…+pk=1。若從這種總體隨機(jī)抽取n個個體,那么可能得到這k項(xiàng)的個數(shù)分別為y1、y2、y3、…、yk,顯然y1+y2+y3+…+yk=n。那么得到這樣一個事件的概率為:
多項(xiàng)分布的概率計算2024/5/1153那么得到這樣一個事件的概率為:2024/5/1154
【例4.3】某藥對病人有效的概率為1/2,對病人無效的概率為1/3,有副作用的概率為1/6,若隨機(jī)抽取2個使用該藥的病人,那么我們的結(jié)果可能包括這樣6種事件:2個病人有副作用;一個無效、一個有副作用;兩個無效;一個有效、一個有副作用;一個有效、一個無效;兩個均有效。這幾種事件的概率分別為多少呢?可以使用上述的概率分布公式來計算,如表4.3。2024/5/1155表4.3多項(xiàng)式分布的概率計算變量(y1、y2、y3)概率及其計算P(y1、y2、y3)(0,0,2)(0,1,1)(0,2,0)(1,0,1)(1,1,0)(2,0,0)2024/5/1156五、泊松分布—二項(xiàng)分布的一種極限分布二項(xiàng)分布中往往會遇到一個概率p或q是很小的值,例如小于0.1,另一方面n又相當(dāng)大,這樣的二項(xiàng)分布必將為另一種分布所接近,或者為一種極限分布。
這一種分布稱泊松概率分布,簡稱泊松分布(Poissondistribution)。2024/5/1157如np=m,則泊松分布如下式:y=0,1,2,…,∞
e=2.71828…為自然對數(shù)的底數(shù)。凡在觀察次數(shù)n相當(dāng)大時,某一事件出現(xiàn)的平均次數(shù)m(m是一個定值)很小,那么,這一事件出現(xiàn)的次數(shù)將符合泊松分布。2024/5/1158泊松分布的平均數(shù)、方差和標(biāo)準(zhǔn)差如下式:這一分布包括一個參數(shù)m,由m的大小決定其分布形狀如圖4.4。當(dāng)m值小時分布呈很偏斜形狀,m增大后則逐漸對稱。
圖4.4不同m值的泊松分布2024/5/1159本章主要內(nèi)容第一節(jié)事件、概率和隨機(jī)變量第二節(jié)二項(xiàng)式分布第三節(jié)正態(tài)分布第四節(jié)抽樣分布
2024/5/1160提問5何為二項(xiàng)總體?二項(xiàng)式分布概率的計算方法?二項(xiàng)總體參數(shù)的計算方法?2024/5/1161第三節(jié)正態(tài)分布一、二項(xiàng)分布的極限——正態(tài)分布二、正態(tài)分布曲線的特性三、計算正態(tài)分布曲線區(qū)間面積或概率的方法2024/5/1162一、二項(xiàng)分布的極限——正態(tài)分布正態(tài)分布或稱高斯(Gauss)分布,是連續(xù)性隨機(jī)變量的一種最重要的理論分布。2024/5/1163以上述二項(xiàng)分布棉株受害率為例,假定受害概率p=1/2,那么,p=q=1/2。現(xiàn)假定每個抽樣單位包括20株,這樣將有21個組,其受害株的概率函數(shù)為于是概率分布計算如下:2024/5/1164現(xiàn)將這概率分布繪于圖4.5。從圖4.5看出它是對稱的,分布的平均數(shù)和方差為:=npq=20(1/2)(1/2)=5(株)2。=np=20(1/2)=10(株),
2024/5/1165
受害株數(shù)(y)
圖4.3棉株受盲椿害的概率函數(shù)f(y)圖(p=0.5,n=5株)2024/5/1166圖4.5棉株受害率(0.5+0.5)20分布圖(實(shí)線表示二項(xiàng)式概率分布,虛線表示接近的正態(tài)分布曲線)如p=q,不論n值大或小,二項(xiàng)分布的多邊形圖必形成對稱;如p≠q,而n很大時,這多邊形仍趨對稱。2024/5/1167正態(tài)分布概率密度函數(shù):其中,y是所研究的變數(shù);
是概率密度函數(shù);
和
為總體參數(shù),表示所研究總體平均數(shù),表示所研究總體標(biāo)準(zhǔn)差,不同正態(tài)分布可以有不同的和
,但某一定總體的
和
是常數(shù)。
2024/5/1168參數(shù)和有如下的數(shù)學(xué)表述令
可將公式標(biāo)準(zhǔn)化為:
上式稱為標(biāo)準(zhǔn)化正態(tài)分布方程,它是參數(shù)時的正態(tài)分布(圖4.7)。記作N(0,1)。
2024/5/1169
1.正態(tài)分布曲線是以y=為對稱軸,向左右兩側(cè)作對稱分布,所以它是一個對稱曲線。從所豎立的縱軸fN(y=)是最大值,所以正態(tài)分布曲線的算術(shù)平均數(shù)、中數(shù)和眾數(shù)是相等的,三者均合一位于點(diǎn)上。
2.正態(tài)分布曲線以參數(shù)
和
的不同而表現(xiàn)為一系列曲線,所以它是一個曲線簇而不僅是一個曲線。決定它在橫軸上的位置,決定它的變異度,二、正態(tài)分布曲線的特性2024/5/1170圖4.8
標(biāo)準(zhǔn)差相同(1)而平均數(shù)不同(=0、=1、=2)的三個正態(tài)分布曲線圖4.9平均數(shù)相同(0)而標(biāo)準(zhǔn)差不同(=1、=1.5、=2)的三個正態(tài)分布曲線2024/5/1171
3.正態(tài)分布資料的次數(shù)分布表現(xiàn)為多數(shù)次數(shù)集中于算術(shù)平均數(shù)附近,離平均數(shù)越遠(yuǎn),其相應(yīng)的次數(shù)越少;且在左右相等||范圍內(nèi)具有相等次數(shù);在||≥3以上其次數(shù)極少。
4.正態(tài)曲線在||=1處有“拐點(diǎn)”。曲線兩尾向左右伸展,永不接觸橫軸,所以當(dāng)y→±∞,分布曲線以y軸為漸近線,因之曲線全距從-∞到+∞。2024/5/1172
5.正態(tài)曲線與橫軸之間的總面積等于1,因此在曲線下橫軸的任何定值,例如從y=y1到y(tǒng)=y2之間的面積,等于介于這兩個定值間面積占總面積的成數(shù),或者說等于y落于這個區(qū)間內(nèi)的概率。
2024/5/1173正態(tài)曲線的任何兩個y定值ya與yb之間的面積或概率乃完全以曲線的和而確定的。詳細(xì)數(shù)值見附表2(p357),下面為幾對常見的區(qū)間與其相對應(yīng)的面積或概率的數(shù)字:區(qū)間±1面積或概率=0.6827±2=0.9545±3=0.9973
±1.960=0.9500±2.576=0.99002024/5/1174三、計算正態(tài)分布曲線區(qū)間面積或概率的方法在正態(tài)分布曲線下,y的定值從y=a到y(tǒng)=b間的概率可用曲線下區(qū)間的面積來表示,或者說,用其定積分的值表示,如圖4.10所示的面積。2024/5/1175圖4.10正態(tài)分布密度函數(shù)的積分說明圖面積A=P(a<y<b)2024/5/1176同樣可以計算曲線下從-∞到y(tǒng)的面積,其公式如下:這里FN(y)稱為正態(tài)分布的累積函數(shù),具有平均數(shù)和標(biāo)準(zhǔn)差。
2024/5/1177現(xiàn)如給予變數(shù)任何一定值,例如a,那么,可以計算y≤a的概率為FN(a),即如果a與b(a<b)是y的兩個定值,則其區(qū)間概率可從下式計算:當(dāng)y=-∞,,當(dāng)y=+∞,2024/5/1178圖4.11正態(tài)分布的累積函數(shù)FN(y)
長度A=P(a<y≤b)2024/5/1179所有正態(tài)分布都可以轉(zhuǎn)換為標(biāo)準(zhǔn)化正態(tài)分布方程式計算一個正態(tài)分布的概率只須將y轉(zhuǎn)換成u,然后查附表2(p357)表計算概率。2024/5/1180【例4.4】假定y是一隨機(jī)變數(shù)具有正態(tài)分布,平均數(shù)
=30,標(biāo)準(zhǔn)差
=5,試計算小于26,小于40的概率,介乎26和40區(qū)間的概率以及大于40的概率。1、首先計算:2、先將y轉(zhuǎn)換為u值:
2024/5/11813、查附表2(p357),當(dāng)u=-0.8時,F(xiàn)N(26)=0.2119,說明這一分布從-∞到26范圍內(nèi)的變量數(shù)占全部變量數(shù)的21.19%,或者說,y≤26概率為0.2119.4、y大于40:=
(40-30)/5
=+2.0查附表2,當(dāng)u
=+2.0,F(xiàn)N(40)=0.9773,這指出從-∞到40范圍內(nèi)的變量數(shù)占全部變量數(shù)的97.73%,或者說,y≤40概率為0.9773。2024/5/11825、所以:P(26<y≤40)=FN(40)-FN(26)=0.9773-0.2119=0.7654
6、計算:P(y>40)=1-P(y≤40)=1-0.9773=0.02272024/5/1183圖4.12概率計算圖示2024/5/1184本章主要內(nèi)容第一節(jié)事件、概率和隨機(jī)變量第二節(jié)二項(xiàng)式分布第三節(jié)正態(tài)分布第四節(jié)抽樣分布
2024/5/1185統(tǒng)計學(xué)的一個主要任務(wù)是研究總體和樣本之間的關(guān)系。
兩個方向從總體到樣本的方向,即本節(jié)所要討論的抽樣分布。從樣本到總體的方向,即統(tǒng)計推斷問題。抽樣分布(samplingdistribution)是統(tǒng)計推斷的基礎(chǔ)。2024/5/1186第四節(jié)抽樣分布一、統(tǒng)計數(shù)的抽樣及其分布參數(shù)二、正態(tài)總體的抽樣分布三、二項(xiàng)總體的抽樣分布2024/5/1187一、統(tǒng)計數(shù)的抽樣及其分布參數(shù)從總體中隨機(jī)抽樣得到樣本,獲得樣本觀察值后可以計算一些統(tǒng)計數(shù),統(tǒng)計數(shù)分布稱為抽樣分布。抽樣
復(fù)置抽樣,指將抽得的個體放回總體后再繼續(xù)抽樣。不復(fù)置抽樣,指將抽得的個體不放回總體而繼續(xù)進(jìn)行抽樣。2024/5/1188(一)樣本平均數(shù)的抽樣及其分布參數(shù)總體隨機(jī)樣本123
無窮個樣本……圖4.14總體和樣本的關(guān)系2024/5/1189
1、如果從容量為N的有限總體抽樣,若每次抽取容量為n的樣本,那么一共可以得到樣本數(shù)(所有可能的樣本個數(shù))。
2、抽樣所得到的每一個樣本可以計算一個平均數(shù),全部可能的樣本都被抽取后可以得到許多平均數(shù),如下等。2024/5/1190
3、如果將抽樣所得到的所有可能的樣本平均數(shù)集合起來便構(gòu)成一個新的總體,平均數(shù)就成為這個新總體的變量。
4、隨機(jī)樣本的任何一種統(tǒng)計數(shù)都可以是一個變量,如:平均數(shù)、總和數(shù)、方差等變量的分布都稱為統(tǒng)計數(shù)的抽樣分布。2024/5/1191新總體與母總體在特征參數(shù)上存在函數(shù)關(guān)系該抽樣分布的平均數(shù)與母總體的平均數(shù)相等。該抽樣分布的方差與母總體方差間存在如下關(guān)系。
其中n為樣本容量。抽樣分布的標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤,它可以度量抽樣分布的變異。2024/5/1192注意所有樣本平均數(shù)的平均數(shù)所有樣本平均數(shù)間的方差母總體的平均數(shù)母總體的方差2024/5/1193【例4.7】設(shè)有一總體N=3(例2,4,6)。以樣本容量n=1、n=2、n=4及n=8,從總體中進(jìn)行復(fù)置抽樣,抽出全部樣本于表4.6。以樣本容量n進(jìn)行獨(dú)立抽樣,抽取的所有可能樣本數(shù)當(dāng)n=2時,抽取的所有可能樣本數(shù):=Nn=32=92024/5/1194總體N=3,樣本容量n=2時所有樣本的總和數(shù)、平均數(shù)和方差表第一個觀察值第二個觀察值樣本平均數(shù)f22222124243226264342423444444646526262464645666661總和平均數(shù)方差3644/392024/5/11951、可算得n=2時樣本平均數(shù)分布的平均數(shù)為:樣本平均數(shù)分布的方差為:2024/5/1196n=1n=2n=4n=8yffff24611123456123212.02.53.03.54.04.55.05.56.0141016191610412.002.252.502.753.003.253.503.754.004.254.504.755.005.255.505.756.001836112266504784101611071016784504266112368139816561平均數(shù)4444方差8/34/32/31/3表4.6各種不同樣本容量的樣本平均數(shù)()的抽樣分布
2、由表中第一列當(dāng)N=3,n=1的總體平均數(shù)
和方差
為:==2024/5/11983、同樣,可算得n=4時:2024/5/11994、當(dāng)n=8時:2024/5/11100樣本與母總體的關(guān)系2024/5/11101n=1n=2圖4.15各種不同樣本容量的
分布方柱形圖2024/5/11102圖4.15各種不同樣本容量的
分布方柱形圖n=4n=82024/5/11103
(二)樣本總和數(shù)的抽樣及其分布參數(shù)樣本總和數(shù)(用代表)的抽樣分布參數(shù)與母總體間存在如下關(guān)系:該抽樣分布的方差
與母總體方差間存在如下關(guān)系:該抽樣分布的平均數(shù)
與母總體的平均數(shù)間的關(guān)系為:2024/5/11104
(三)兩個獨(dú)立隨機(jī)樣本平均數(shù)差數(shù)的抽樣及其分布參數(shù)一個樣本容量:為n1的樣本;另一個樣本容量:為n2的樣本。平均數(shù)間差數(shù):2024/5/11105該抽樣分布的平均數(shù)與母總體的平均數(shù)之差相等。該抽樣分布的方差與母總體方差間的關(guān)系為:2024/5/11106
【例4.8】假定第一個總體包括3個觀察值,2、4和6
(N1=3,n1=2),所有樣本數(shù)為Nn=32=9個,總體平均數(shù)和方差=4,=8/3。第二個總體包括2個觀察值,3和6
(N2=2),抽出的樣本容量為3(n2=3),所以所有樣本數(shù)為23=8個,總體平均數(shù)和方差=4.5,=2.25?,F(xiàn)將上述兩個總體的次數(shù)分布列于表4.7,并計算出其分布的參數(shù)。2024/5/11107表4.7從兩個總體抽出的樣本平均數(shù)的次數(shù)分布表ff213132434353526161總和9總和8
2024/5/11108表4.8樣本平均數(shù)差數(shù)的次數(shù)分布表2,2,2,23,3,3,34,4,4,45,5,5,56,6,6,6總和3,4,5,63,4,5,63,4,5,63,4,5,63,4,5,6-1,-2,-3,-40,-1,-2,-3,1,0,-1,-22,1,0,-13,2,1,0f1,3,3,12,6,6,23,9,9,32,6,6,21,3,3,172表4.9樣本平均數(shù)差數(shù)分布的平均數(shù)和方差計算表ff()()()2()2-4-3-2-10123151218181251-4-1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年個人房屋裝修合同樣本
- 2025合同模板會員入會合同細(xì)則范本
- 教育機(jī)構(gòu)中如何通過巖棉防火系統(tǒng)提升安全性
- 機(jī)械采購類供貨方案、售后方案(技術(shù)方案)
- 二零二四年圖書館圖書采購合同:高校圖書館外借服務(wù)協(xié)議3篇
- 合同授權(quán)委托管理制度
- 2025年湘教版選擇性必修1物理下冊月考試卷含答案
- 二零二五年度生態(tài)農(nóng)業(yè)綜合開發(fā)項(xiàng)目合同范本3篇
- 2025年人教新課標(biāo)高一地理上冊月考試卷
- 2025年冀教新版九年級語文下冊月考試卷
- 五年級上冊寒假作業(yè)答案(人教版)
- 2025年山東浪潮集團(tuán)限公司招聘25人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2024年財政部會計法律法規(guī)答題活動題目及答案一
- 2025年江西省港口集團(tuán)招聘筆試參考題庫含答案解析
- (2024年)中國傳統(tǒng)文化介紹課件
- 液化氣安全檢查及整改方案
- 《冠心病》課件(完整版)
- 2024年云網(wǎng)安全應(yīng)知應(yīng)會考試題庫
- 公園保潔服務(wù)投標(biāo)方案
- 光伏電站項(xiàng)目合作開發(fā)合同協(xié)議書三方版
- 2024年秋季新滬教版九年級上冊化學(xué)課件 第2章 空氣與水資源第1節(jié) 空氣的組成
評論
0/150
提交評論