農(nóng)大生物統(tǒng)計cai課件_第1頁
農(nóng)大生物統(tǒng)計cai課件_第2頁
農(nóng)大生物統(tǒng)計cai課件_第3頁
農(nóng)大生物統(tǒng)計cai課件_第4頁
農(nóng)大生物統(tǒng)計cai課件_第5頁
已閱讀5頁,還剩18頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

、法,本章在介紹概率論中最基本的兩個概念——、概率的基礎(chǔ)上,重點介紹生物科學(xué)t分布。、 一、事(一)必然現(xiàn)象與隨機現(xiàn)象 在自然界與實踐和科學(xué)驗中,們會觀到各種各樣的象把它們納起來大上分為大一類是可其結(jié)果的在保持條件不變的情況下,復(fù)進(jìn)行試驗其結(jié)果總是定,必然發(fā)生(或必不發(fā)生。例,在標(biāo)準(zhǔn)大壓下水加到100℃然沸步件下必然可能到月球這現(xiàn)象稱為必然(evae eoe或定性(efe eoe一類是事前不可其結(jié)的即在保條件不的情況重復(fù)進(jìn)行試驗結(jié)果未相同例如擲一質(zhì)地均對稱的幣其果可能出正面也能出現(xiàn)孵化6枚種蛋,可“孵出0只雛也“孵出1只雛也可孵化出6只雛事前不可能斷言其孵化結(jié)果。這類在個別試驗中其結(jié)果呈現(xiàn)偶然性、不確定性現(xiàn)象,稱為隨機現(xiàn)象phenomena人們通過長期的觀察和實踐并深入研究之后,發(fā)現(xiàn)隨機現(xiàn)象或不確定性現(xiàn)象,有如下特點:在定的條實現(xiàn)時有多種能的結(jié)發(fā),事前人不能將出現(xiàn)種結(jié)果;但隨著娠母牛數(shù)的增加產(chǎn)公犢母的比例逐接近11的比規(guī)律。(二)隨機試驗與隨機1、隨機試 通常我們把根據(jù)某一研究目的,在一定條件下對自然現(xiàn)象所進(jìn)行(trial驗(randomtrial,簡稱試驗:2隨機隨機試驗的每一種可能結(jié)果,在一定條件下可能發(fā)生,也可能不發(fā)生,稱為隨機(randomevent,簡稱(event,通常用A、B、C等來表示?;疚覀儼巡荒茉俜值姆Q為基本(elementaryevent,也稱為樣point1210event由“取得一個編號是2“是“是6“是8“是10”5個基本組合而成。必然我們把在一定條件下必然會發(fā)生的稱為必然 event,114天左右產(chǎn)仔,就是一個必然。不可能我們把在一定條件下不可能發(fā)生的稱為不可能event必然與不可能實際上是確定性現(xiàn)象即它們不是隨機但是為了方便起見二、 (一)概率的統(tǒng)計定義研究隨機試驗,僅知道可能發(fā)生哪些隨機是不夠的,(probabilityP(A在相同條件下進(jìn)行n次重復(fù)試驗,如果隨機A發(fā)生的次數(shù)為m,那么m/n稱為隨機A的頻率(frequency;當(dāng)試驗重復(fù)數(shù)n逐漸增大時,隨機A的頻率越來越穩(wěn)定地接近某一數(shù)值p,那么就把p稱為隨機A的概率。這樣定義的概率稱為統(tǒng)計概probabilityprobability例如為了確定拋擲一枚硬幣發(fā)生正面朝上這個的概率歷史上有人作過成千上萬次4—14—1頻率蒲近0.5,我們就把0.5作為這個的概率。機A的頻率作為該隨機概率的近似值。 (n充分大 model設(shè)樣本空間由n個等可能的基本所構(gòu)成,其中A包含有m個基本, 同理,B所包含的基本數(shù)mB=5,即抽得編號為2,4,6,8,10中的任何一個,B便發(fā)生,故P(B)=mB/n=5/10=0.5?!纠?.2】在N頭奶牛中,有M頭曾有史,從這群奶牛中任意抽出n頭奶牛

N=30,M=8,n=10,m=2N史這一記為A,因為從N頭奶牛中任意抽出n頭奶牛的基本總數(shù)為CnNA所包含的基本數(shù)為Cm

,因此所求A的概率 N

CmCP(A)= NCnnNN=30,M=8,n=10,m=2C2CP(A)= 308=C即在30頭奶牛中有8頭曾有史從這群奶牛隨機抽出10頭奶牛其中有2頭曾有流6.95%。(三)概率的性 1、對于任何A,有3、不可能的概率為0,即P(ф)=0三、小概率實際不可能性原隨機的概率表示了隨機在一次試驗中出現(xiàn)的可能性大小若隨機的概率很第二 概率分(probabtydstrbution)為了深入研究隨機試驗我們先引入隨量(randomvarabe)的概念。一、隨【例4.3】對100頭病畜用某種藥物進(jìn)行治療,其可能結(jié)果是“0頭治愈”、“1頭【例4.4】【例4.5】測定某品種豬初生重,表示測定結(jié)果的變量x(a,b),如0.5―1.5kg,x如果表示試驗結(jié)果的變量x,其可能取值至多為可列個,且以各種確定的概率取這些不同的值,則稱x為離散型隨量(dscreterandomvarabe);如果表示試驗結(jié)果的變量xx在其取值范圍內(nèi)的任一區(qū)間中取值時,其概率是確定的,則稱x為連續(xù)型隨量(contnuousrandomvarabe)。引入隨量的概念后,對隨機試驗的概率分布的研究就轉(zhuǎn)為對隨量概率分布的二、離散型 量的概率分要了解離散型隨量x的統(tǒng)計規(guī)律就必須知道它的一切可能值xi及取每種可能值的概率pi。如果離散型隨量x的一切可能取值xi(i=1,2,…),及其對應(yīng)的概率pi,記 (4—則(4—3式為離散型隨量x的概率分布或分布常用分布列(distribution來表示離散型隨量 x2 p2 顯然離散型隨量的概率分布具有pi≥0和Σpi=1這兩個基本性質(zhì)三、連續(xù)型隨量的概率分連續(xù)型隨量(如體長、體重、蛋重)的概率分布不能用分布列來表示,因為其可能取的值是不可數(shù)的。我們改用隨量x在某個區(qū)間內(nèi)取值的概率P(a≤x<b)來表示。下由表2—7作126頭基礎(chǔ)母羊體重資料的頻率分布直方圖,見圖4—1,圖中縱座標(biāo)取頻率與組距的比值??梢栽O(shè)想,如果樣本取得越來越大(n→+∞),組分得越來越細(xì)(i→0),點的聯(lián)線──頻率分布折線將逐漸趨向于一條曲線,換句話說,當(dāng)n→+∞、i→0時,頻率分布折線的極限是一條穩(wěn)定的函數(shù)曲線。對于樣本是取自連續(xù)型隨量的情況,這條函數(shù)曲線將是光滑的。這條曲線排除了抽樣和測量的誤差,完全反映了基礎(chǔ)母羊體重的變動規(guī)律。概率分布密度函數(shù)為fx),則x取值于區(qū)間[a,b)的概率為圖中陰影部分的面積,即bP(a≤x<b)=

f

(4-(4—4)式為連續(xù)型隨量x在區(qū)間[a,b)上取值概率的表達(dá)式??梢?,連續(xù)型隨量的圖4-1表2-7資料的分布曲線1、分布密度函數(shù)總是大于或等于0,即2、當(dāng)隨量x取某一特定值時,其概率等于0;cP(xc)cf(x)dx

(c3、在一次試驗中隨量x之取值必在-∞<x<+∞范圍內(nèi),為一必然。所(4—5)式表示分布密度曲線下、橫軸上的全部面積為1第三 正態(tài)分

(4-正態(tài)分布是一種很重要的連續(xù)型隨量的概率分布。生物現(xiàn)象中有許多變量是服從量等。許多統(tǒng)計分析方法都是以正態(tài)分布為基礎(chǔ)的。此外,還有不少隨量的概率分布(一)正態(tài)分布的定義若連續(xù)型隨量x的概率分布密度函數(shù)f(x)

(x

(4-其中μ為平均數(shù),σ2為方差則稱隨量x服從正態(tài)分布(normaldistribution),記為N(μ,σ2F(x)

(x 22

(4- 分布密度曲線如圖4—24—2(二)正態(tài)分布的特征由(4—6)式和圖4—2可以看出正態(tài)分布具有以下幾個重要1、正態(tài)分布密度曲線是單峰、對稱的懸鐘形曲線,對稱軸為2、f(x)在x=μ處達(dá)到極大,極大值f() 3、f(x)是非負(fù)函數(shù),以x4、曲線在x=μ±σ處各有一個拐點,即曲線在(-∞,μ-σ)和(μ+σ,+∞)區(qū)間上是5μ和標(biāo)準(zhǔn)差σμ4—3所示。當(dāng)σ恒定時,μ愈大,則曲線沿x軸愈向右移動;反之,μ愈小,曲線沿x軸愈向左移動。σ4—4μσx的取值愈分散,愈小,x的取值愈集中在μ附近,曲線愈“瘦”。6、分布密度曲線與橫軸所夾的面積為1P(x)

(x

dx圖4—3σ相同而μ不同的三個正態(tài)分 圖4—4μ相同而σ不同的三個正態(tài)由上述正態(tài)分布的特征可知,正態(tài)分布是依賴于參數(shù)μ和σ2(或σ)的一簇分布,正態(tài)曲線之位置及形態(tài)隨μ和σ2的不同而不同。這就給研究具體的正態(tài)總體帶來,需將一般的(μ,σ2)轉(zhuǎn)換為μ=0,σ2=1的正態(tài)分布。我們稱μ=0,σ2=1的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistrbuton)。標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)及分布函數(shù)分別記作ψu)和Φu),由(4-6)及(4-7)式得:(u)

u

(4-(u)

u

1ue

(4-隨量u服從標(biāo)準(zhǔn)正態(tài)分布,記作u~N(0,1),分布密度曲線如圖4—5所示圖4— 標(biāo)準(zhǔn)正態(tài)分布密度曲對于任何一個服從正態(tài)分布N(μ,σ2)的隨量x,都可以通過標(biāo)準(zhǔn)化變換u=(x- (4-將其變換為服從標(biāo)準(zhǔn)正態(tài)分布的隨量u。u稱為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離(standardnormaldeviate)在意一個區(qū)間內(nèi)取值的概率。這就給解決不同μ、σ2的正態(tài)分布概率計算問題帶來很大設(shè)u服從標(biāo)準(zhǔn)正態(tài)分布,則u在[u1,u2

u

)12 (4-12而Φ(u1)與Φ(u2)可由附表1附表1只對于-4.99≤u<4.99給出了Φ(u)的數(shù)值。表中,u值列在第一列和第一行,第一列列出u的整數(shù)部分及小數(shù)點后第一位,第一行為u的小數(shù)點后第二位數(shù)值。例如,u=1.75,1.7放在第一列,0.05放在第一行。在附表1中,1.7所在行與0.05所在列相交處的數(shù)值為0.95994Φ(1.75)=0.95994Φ(uΦ(u)=0.284,反過來查u1中找到與0.284最接近的值0.28430.5,對應(yīng)列的第一行數(shù)值0.07,即相應(yīng)的u值為u=-0.57,亦即Φ(-0.57)=0.284。如果要求更精確的u值,可用線性插值法計算。 和. 由(4-11)式及正態(tài)分布的對稱性可推出下列關(guān)系式,再借助附表1,便能很方便地P(0≤u<u1)=Φ(u1)-P(u≥u1)=Φ(-P(|u|≥u1)=2Φ(-(4-P(|u|<u1)=1-2Φ(-P(u1≤u<u2)=Φ(u2)-】P(|u|≥2.56)=?(4)P(0.34≤u<1.53)(2)P利用(4-12)式,查附表1P(u<-P(u≥2.58)=Φ(-P(|u|≥2.56)=2Φ(-P(0.34≤u<1.53)=Φ(1.53)-Φ(0.34)=0.93669-P(-2.58≤u<2.58)=0.99圖4—6uP(|u|≥1)=2Φ(-1)=1-P(-1≤u<1)=1-0.6826=0.3174P(|u|≥2)=2Φ(-2)=1-P(-2≤u<2)=1-0.9545=0.0455P(|u|≥2.58)=1-(二)一般正態(tài)分布的概率計算面積為1,這實際上表明了“隨量x取值在-∞與+∞之間”是一個必然,其概率為1。若隨量x服從正態(tài)分布N(μ,σ2),則x的取值落在任意區(qū)間[x1,x2)的概率,記作x1 x1

(x P(xxx) 1

22

(4-圖4—71對(4-13)式作變換u=(x-μ)/σ,得dx=σdu1

ux2)

x2

(x)222

du

(x1)/

1e

1 u21

1

du=(u2)

x1

x2正態(tài)分布的隨量u在[(x1-μ)/σ,(x2-μ)/σ)內(nèi)取值的概率。因此,計算一般正態(tài)【例4.7】設(shè)x服從μ=30.26,σ2=5.102的正態(tài)分布,試求P(21.64≤x<32.98ux30.26u

=P(-1.69≤u<0.53)=Φ(0.53)-Φ(-=0.7019-關(guān)于一般正態(tài)分布,以下幾個概率(即隨量x落在μ加減不同倍數(shù)σ區(qū)間的概率)P(μ-2σ≤x<μ+2σ)=0.9545P(μ-3σ≤x<μ+3σ)P(μ-1.96σ≤x<μ+1.96σ)P(μ-x=52.26(kg),標(biāo)準(zhǔn)差S=5.10(kg),算表4—2126x±kSx 數(shù) 區(qū)

次 頻率x x x x x 由表4—2可見,實際頻率與理論概率相當(dāng)接近,說明126頭基礎(chǔ)母羊體重資料的頻率分布接近正態(tài)分布,從而可推斷基礎(chǔ)母羊體重這一隨量很可能是服從正態(tài)分布的。生物統(tǒng)計中,不僅注意隨量x落在平均數(shù)加減不同倍數(shù)標(biāo)準(zhǔn)差區(qū)間(μ-kσ,μ+kσ)之內(nèi)的概率而且也很關(guān)心x落在此區(qū)間之外的概率。我們把隨量x落在平均數(shù)μ加減不同倍數(shù)標(biāo)準(zhǔn)差σα以求得隨量x小于μ-kσ或大于μ+kσ的概率,稱為單側(cè)概率(一尾概率),記作α/2x落在(μ-1.96σ,μ+1.96σ)之外的雙側(cè)概率為0.05,而單側(cè)概率為0.025P(x<μ-1.96σ)=雙側(cè)概率或單側(cè)概率如圖4—8所示。x落在(μ-2.58σ,μ+2.58σP(x<μ-2.58σ)=圖4—8附表2給出了滿足P(|u|>u)=α的雙側(cè)分位u的數(shù)值。因此,只要已知雙側(cè)概率α的值,由附表2就可直接查出對應(yīng)的雙側(cè)分位數(shù)u,查法與附表1相同。例如,已P(uu)+P(uu)=0.10的Pu≤uu﹚=0.86的因為附表2中的α1

ue

1 (1)P(u<-u)+P(u≥u)=1-P(-u≤u<u由附表2u0

(2)P(-u≤u<u)=0.86,α=1-P(-u≤u<u)=1-由附表2u0.14對于x~N(μ,σ2),只要將其轉(zhuǎn)換為u~N(0,11【例4.8已知豬血紅蛋白含量x服從正態(tài)分布N(12.86,1.332),若P(xl1P(xl2)=0.03,求l1l2由題意可知,α/2=0.03,α=0.06又因為P(xl)P(x12.86l112.86)P(u

) P(x≥l)=P(x12.86l212.86)P(uu)

P(x<l1=+P(x≥l2)=P(u<-u=+P(u≥u=1Pu≤Pu)=0.06=α由附表2u006=1.880794,所以(l1-12.86)/1.33=-1.880794,(l2-即l1≈10.36,l2≈15.36第四 二項分一、試驗及其概將某隨機試驗重復(fù)進(jìn)行n次,若各次試驗結(jié)果互不影響,即每次試驗結(jié)果出現(xiàn)的概率對于n次獨立的試驗,如果每次試驗結(jié)果出現(xiàn)且只出現(xiàn)對立A與A之一在每次A驗中出現(xiàn)A的概率是常數(shù)p(0<p<1),因而出現(xiàn)對 的概率是1-p=q,則稱這一串重A的獨立試驗為n重試驗,簡稱試驗(Bernoullitrials)頭病畜治療后的治愈數(shù)、n尾魚苗的成活數(shù)等,可用試驗來概括。在n重試驗中,A可能發(fā)生0,1,2,…,n次,現(xiàn)在我們來求A恰好發(fā)4先取n=4,k=2來討論。在4次試驗中,A發(fā)生2次的方式有以下C2種4

A1A2A3

A1A2A3其中Ak(k=1,2,3,4)表示A在第k次試驗發(fā)生;Ak(k=1,2,3,4)表示A在第k次試驗=P(A)·P(A)·P(A)·P(A)=p2q 又由于以上各種方式中,任何二種方式都是互不相容的,按概率的加法法則,在4P(2)=P(AAAA)+P(AAA

)+…+P(AAAA)=C

p2q 1 3

123

123 一般,在n重試驗中,A恰好發(fā)生k(0≤k≤n)次的概率P(k)=Ck

pk

(4-n若把(4-14)(q

nC pC pnk相比較就可以發(fā)現(xiàn),在n 試驗中,A發(fā)生k次的概率恰好等于(q中的第k+1項,所以也把(4-14)式稱作二項概率設(shè)隨量x所有可能取的值為零和正整數(shù):0,1,2,…,n,且

P(k)=Ck

pk

其中p>0,q>0,p+q=1,則稱隨量x服從參數(shù)為n和p的二項分布(binomialdistribution),記為x~B(n,p)。顯然,二項分布是一種離散型隨量的概率分布。參數(shù)n稱為離散參數(shù),只能取正1、P(x=k)Pn(k)

2、二項分布的概率之和等于1CC p n

(q

p)nkmn3P(xmPn(kmCkpkqnkn

(4-kn4P(xmPn

m)Ckpkqnk

(4-nknn5P(m1xm2pn(m1km2Ckpkn

(4-二項分布由n和p

k1、當(dāng)p值較小且n不大時,分布是偏倚的。但隨著n的增大,分布逐漸趨于對稱,如圖4—9所示;2、當(dāng)p值趨于0.5時,分布趨于對稱,如圖4—103、對于固定的n及p,當(dāng)k增加時,Pn(k)【例4.9】純種白豬與純種黑豬雜交,根據(jù)遺傳理論,子二代中白豬與黑豬根據(jù)題意,n=10p=3/4=0.75q=1/4=0.25。設(shè)10頭仔豬中白色的為xx為服從二項分布B(10,0.75)的隨量。于是窩產(chǎn)10頭仔豬中有7頭是白色的概率為:10P(x7)C710【例4.10】設(shè)在家畜中某種疾病的概率為20%,現(xiàn)有兩種,用A注射假設(shè)A完全無效,那么注射后的家畜的概率仍為20%,則15頭家畜中染病15p(x0)C00.2000.801515同理,如果B完全無效,則15頭家畜中最多有1頭的概率p(x C00.200.815 15由計算可知,注射A無效的概率為0.0352,比B無效的概率0.1671小得多。因此,可以認(rèn)為A是有效的,但不能認(rèn)為B也是有效的?!纠?.11】仔豬黃痢病在常規(guī)治療下率為20%,求5頭病豬治療后頭數(shù)各設(shè)5頭病豬中頭數(shù)為x,則x服從二項分布B(5,0.2),其所有可能取值為5,按(4-601012345從上面各例可看出二項分布的應(yīng)用條件有三:(1)各觀察單位只具有互相對立的一種結(jié)果,如陽性或,生存或等,屬于二項分類資料(2)已知發(fā)生某一結(jié)果(如)的概率為p,其對立結(jié)果的概率則為1-P=q,實際中要求p是從大量觀察中獲得的比(3n影響到其它觀察單位的觀察結(jié)果。當(dāng)試驗結(jié)果以A發(fā)生次數(shù)k表示 (4-【例4.12】求【例4.11】平均豬數(shù)及數(shù)的標(biāo)準(zhǔn)差。以p=0.2,n=5代入(4-18)和(4-19)式得50.250.2

(4-標(biāo)準(zhǔn)

=0.894當(dāng)試驗結(jié)果以A發(fā)生的頻率k/n表示p(pq)/(pq)/

(4-(4-??)??)SpSp

(4-第五 分分布是一種可以用來描述和分析隨機地發(fā)生在單位空間或時間里的稀有的概率分布。要觀察到這類,樣本含量n必須很大在生物、醫(yī)學(xué)研究中,服從分布的隨量是常見的如一定畜群中某種患病率很低的非傳染性疾病患病數(shù)或數(shù),些野生動物或昆蟲數(shù),醫(yī)院門診單位時間內(nèi)就診患者數(shù)等,都是服從分布的。一、分布的意若隨量x(x=k)只取零和正整數(shù)值0,1,2,…,且其概率分布kP(xk)

(4-其中λ>0;e=2.7182…是自然對數(shù)的底數(shù),則稱x服從參數(shù)為λ的分布(Poisson's和方差相等,都等于常數(shù)λ,即μ=σ2=λ。利用這一特征,可以初步判斷一個離散型隨【例4.13】某種豬場閉鎖育種群仔豬畸形數(shù),共記錄200窩,畸形仔豬數(shù)的分布情況如表4-3所示。試判斷畸形仔豬數(shù)是否服從分布。表4-3每窩畸形數(shù)0133 數(shù)21根據(jù)分布的平均數(shù)與方差相等這一特征,若畸形仔豬數(shù)服從分布,則由觀察x和方差S2計算結(jié)果如下:xs2

fk2(fk)2/nn1

(12002621215222321421022)/200

x=0.51,S2=0.52,這兩個數(shù)是相當(dāng)接近的,因此可以認(rèn)為畸形仔豬數(shù)服從分布。λ是分布所依賴的唯一參數(shù)。λ值愈小分布愈偏倚,隨著λ的增大,分布趨于對稱(如圖4-11所示)當(dāng)λ=20時分布接近于正態(tài)分布當(dāng)λ=50時可以認(rèn)為分布呈正態(tài)分布所以在實際工作中當(dāng)λ≥20時就可以用正態(tài)分布來近似地處理分布的問題。圖4—11不同λ的分二、分布的概率計由(4-23)式可知,分布的概率計算,依賴于參數(shù)λ的確定,只要參數(shù)λ確定了,把k=0,1,2,…代入(4-23)式即可求得各項的概率。但是在大多數(shù)服從分布的實例中,分布參數(shù)λλ的估計值,將其代替(4-23)式中的λ,計算出k=0,1,2,…時的各項概率。如【例4.13】中已判斷畸形仔豬數(shù)服從分布,并已算出樣本平均數(shù)x=0.51。將0.51代替(4-23)中的λ得:P(xk)

因為e-051=1.6653,4P(x4)1p(xk)10.99994k把上面各項概率乘以總觀察窩數(shù)(N=200)即得各項按分布的理論窩數(shù)。分布表4—4畸形仔豬數(shù)的分k0123窩21頻概將實際計算得的頻率與根據(jù)λ=0.51的泊松分布計算的概率相比較,發(fā)現(xiàn)畸形仔豬的頻率分布與λ=0.51的分布是吻合得很好的。這進(jìn)一步說明了畸形仔豬數(shù)是服從分布的?!纠?.14】為監(jiān)測飲用水的污染情況,現(xiàn)檢驗?zāi)成鐓^(qū)每毫升飲用水中細(xì)菌數(shù),共1ml水中細(xì)菌 合次數(shù) x=0.500,方差S2=0.496。兩者很接近,故可認(rèn)為每毫升水中細(xì)菌數(shù)服從分布。以x=0.500代替(4-23)式中的λ,得P(xk)e計算結(jié)果如表4—5表4—1ml水中細(xì)菌 12合實際次 6頻 概 理論次 應(yīng)當(dāng)注意,二項分布的應(yīng)用條件也是分布的應(yīng)用條件。比如二項分布要求n次試驗是相互獨立的這也是分布的要求然而一些具有傳染性的罕見疾病的發(fā)病數(shù)因為首例發(fā)生之后可成為傳染源會影響到后續(xù)病例的發(fā)生所以不符合分布的應(yīng)用條細(xì)菌在牛奶中成集落存在時,亦不呈分布。前面討論的三個重要的概率分布中,前一個屬連續(xù)型 離散型隨量的概率分布。三者間的關(guān)系如下對于二項分布,在n→∞,p→0,且np=λ(較小常數(shù))情況下,二項分布趨于布。在這種場合,分布中的參數(shù)λ用二項分布的np代之;在n→∞,p→0.5時,二項分布趨于正態(tài)分布。在這種場合,正態(tài)分布中的μ、σ2用二項分布的np、npq代之。在實際計算中當(dāng)p<0.1且n很大時二項分布可由分布近似當(dāng)p>0.1且n很大時二項分布可由正態(tài)分布近似。對于分布當(dāng)λ→∞時分布以正態(tài)分布為極限在實際計算中當(dāng)λ≥20(也第六 樣本平均數(shù)的抽樣分(samplingdistribution)是從樣本到總體,這就是統(tǒng)計推斷(statisticalinference)問題。統(tǒng)計推斷是以總體分布和我們知道,由總體中隨機地抽取若干組成樣本,即使每次抽取的樣本含量相等,其統(tǒng)計量(如xS)也將隨樣本的不同而有所不同因而樣本統(tǒng)計量也是隨量,也有以討論。由總體隨機抽樣(randomsampling)的方法可分為有返置抽樣和不返置抽樣兩種。前μ,方差為σ2x,將此總體稱為原總nx可抽出很多甚至無窮多個含量為n與原總體平均數(shù)μ相比往往表現(xiàn)出不同程度的差異。這種差異是由隨機抽樣造成的,稱為抽樣誤差(amplngerror)。顯然,樣本平均數(shù)也是一個隨量,其概率分布叫做樣x和標(biāo)準(zhǔn)差分別記為x和x。x是樣本平均數(shù)抽樣總體的標(biāo)準(zhǔn)差,簡稱標(biāo)準(zhǔn)誤(standarderror),它表示平均數(shù)抽樣誤差的大小。統(tǒng)計學(xué)上已證明x總體的兩個參數(shù)與x總體的兩個參數(shù)有如下關(guān)系:nxx=μ,nx

(4—設(shè)有一個=4的有限總體,變數(shù)為2、3、3、4。根據(jù)μ=Σx/和σ2=Σ(x-μ)2/求得該總體的μ、σ2、σ為:μ=3,σ2=1/2,

1212從有限總體作返置隨機抽樣,所有可能的樣本數(shù)為Nn個,其中n為樣本含量。以上述總體而論,如果從中抽取n=2的樣本,共可得42=16個樣本;如果樣本含量n為4,則一共可抽得44=256個樣本。分別求這些樣本的平均數(shù)x,其次數(shù)分布如表4—6所示。根據(jù)表4—6,在n=2xfx/Nn48.0/163x2x

f(xxN

fx2(fx)2/NN

148482x1/2n=4/16=1/4=(1/2)/2=2x1/2nx

12 表4—6N=4,n=2和n=4xNn=42

Nn=44

fx

fx 同理,可得n=41812418124

232/2561/8(1/2)/42/xxx

x=μ,x

nnnn若將表4—6中兩個樣本平均數(shù)的抽樣總體作次數(shù)分布圖,則如圖4-12使樣本含量很小(n=2,n=4),樣本平均數(shù)的分布卻趨向于正態(tài)分布形式。隨著樣本含量n的增大,樣本平均數(shù)的分布愈來愈從不連續(xù)趨向于連續(xù)的正態(tài)分布。比較圖4—12兩個分布,在n由2增到4時,這種趨勢表現(xiàn)得相當(dāng)明顯。當(dāng)n>30時,xxx 若隨量x服從正態(tài)分布N(μ,σ2),x,x

xn是由xnx=Σx/nx=μ,xn態(tài)分布N(μ,σ2/n

x n若隨量x服從平均數(shù)是μ,方差是σ2的分布(不是正態(tài)分布);x,x,…, n是由此總體得來的隨機樣本,則統(tǒng)計量x=Σx/n的概率分布,當(dāng)n相當(dāng)大時近正態(tài)分N(μ,σ2/n4-12x上述兩個結(jié)果保證了樣本平均數(shù)的抽樣分布服從或者近正態(tài)分布中心極限定理告訴我們:不論xx服從何種分布,一般只要n>30,就可認(rèn)為x的分布是正態(tài)的。若x的分布不很偏倚,在n>20時,x的分布就近似于正態(tài)分布了。這就是為什么正態(tài)分布較之其它分布應(yīng)用更為廣泛的原因。二、標(biāo)準(zhǔn)誤

x

xnx的精確性低。反之,xx間的差異程度小,樣本平均數(shù)的精確性高。x的大小與原總體的標(biāo)準(zhǔn)差σ成正比,與樣本含量n的平方根成反比。從某特定總體抽樣,因為σ是一常數(shù),所以只有增大樣本含量才能降低樣本平均數(shù)x的抽樣誤差。nnn在實際工作中,總體標(biāo)準(zhǔn)差σ往往是未知的,因而無法求得x。此時,可用樣本標(biāo)準(zhǔn)差S估計σ。于是,以S 估計x。記S 為Sx,稱作樣本標(biāo)準(zhǔn)誤或均數(shù)標(biāo)準(zhǔn)誤。nn(xx)x(xx)x2(x)2/nn(n1)SnSx Sn

(4-應(yīng)當(dāng)注意,樣本標(biāo)準(zhǔn)差與樣本標(biāo)準(zhǔn)誤是既有聯(lián)系又有區(qū)別的兩個統(tǒng)計量,(4—25)已表明了二者的聯(lián)系。二者的區(qū)別在于:樣本標(biāo)準(zhǔn)差Sx1x2,…,xnx對該樣本代表性的強弱。樣本標(biāo)準(zhǔn)誤是x1x2xkx抽樣誤差的估計值,其大小說明了樣本間變異x精確性的高低。對于大樣本資料,常將樣本標(biāo)準(zhǔn)差Sxx±S,用以說明所性狀或指標(biāo)的優(yōu)良性與穩(wěn)定性。對于小樣本資料,常將樣本標(biāo)準(zhǔn)誤Sx與樣本平均數(shù)x配合使用,記為x±Sx,用以表示所性狀或指標(biāo)的優(yōu)良性與抽樣誤差的大小。第七 x~N(μ,σ2x~N(μσ2/n)。將隨x標(biāo)準(zhǔn)化得:ux)/x,則u~N(0,1)。當(dāng)總體標(biāo)準(zhǔn)差σ標(biāo)準(zhǔn)差S代替σ所得到的統(tǒng)計量(x)/Sx記為tSx時,由于采用S來代替σ,使得t變量不再服從標(biāo)準(zhǔn)正態(tài)分布,而是服從t分布(t-distribution)。它的概率分布密度函數(shù)如f(t)

1)/

(122

df

(4-(df/(df/df/(df/(dfμt=0

t

(4-圖4-圖4- 不同自由度的t分布密度曲t分布密度曲線如圖4-131、t分布受自由度的制約,每一個自由度都有一條

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論