基礎統(tǒng)計復習資料_第1頁
基礎統(tǒng)計復習資料_第2頁
基礎統(tǒng)計復習資料_第3頁
基礎統(tǒng)計復習資料_第4頁
基礎統(tǒng)計復習資料_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

基礎統(tǒng)計復習資料概論統(tǒng)計學中慣用基本概念總體X有X1,X2,X3,…,XN個單元隨機抽取n個組成樣本單元:x1,x2,x3,…,xn則:N——總體容量n——樣本容量統(tǒng)計資料整理一、數(shù)據(jù)分組、整理寫出最大值Xmax、最小值Xmin求出極差d=Xmax-Xmin分組,算出組距、組中值據(jù)樣本單元數(shù),求出分組數(shù)經(jīng)驗值為:樣本單元數(shù)40-5050-100100-200200-500>500分組數(shù)6-87-109-1212-1717-20上限:每一組數(shù)據(jù)中最大變量值下限:每一組數(shù)據(jù)中最小變量值組距=極差÷分組數(shù)=上限-下限組中值=(上限+下限)÷2計算頻數(shù)和頻率頻數(shù)=各組分配統(tǒng)計單元數(shù)頻率=各組單元數(shù)占總體單元數(shù)比重=頻數(shù)÷各單元數(shù)之和(n)作頻率分布圖例題例:設以不重復抽樣方式從1600塊面積為0.4公頃林地所組成總體中等概地抽取50塊林地組成樣本,樣本各單元蓄積量值為:1.5010.34.34.1711.18.5011.8.58.811.812.5312.32.78.73.5.17.4105.411.31.6010.75.4.77.64.97.611.24.2.5.32.9605.73.16.77.79.62.94.216.65.84.66.4試進行數(shù)據(jù)整理解:1.Xmax=16.6Xmin=02.求出d=16.6-0=16.63.分組,計算組距、組中值分為10組,組距=16.6÷10=1.66≈1.74.計算頻數(shù)(fi)、頻率分組組中值劃正(上限排外)頻數(shù)fi頻率0–1.70.85正正一110.221.7–3.42.55正50.13.4–5.14.25正┬70.145.1–6.85.95正┬70.146.8–8.57.65正50.18.5–10.29.35正50.110.2–11.911.05正┬70.1411.9–13.612.75┬20.0413.6–15.314.450015.3–17.016.15一10.02共計5014.作頻率分布圖靜態(tài)分析指標一、平均指標計算算術平均數(shù)X=(x1+x2+x3+…+xn)÷n=(∑xi)÷n加權平均數(shù)X=(x1f1+x2f2+x3f3+…+xnfn)÷n=(∑xifi)÷(∑fi)眾數(shù)=總體中出現(xiàn)次數(shù)最多或最普遍標志值中位數(shù)Me當n為偶數(shù)時:中位數(shù)=(Xn/2+Xn/2+1)÷2當n為奇數(shù)時:中位數(shù)=X(n+1)/2二、標志變異指標計算極差d=Xmax-Xmin總體方差σ2=[∑(Xi-X)2]÷n=(∑Xi2)÷n-X2樣本方差S2=[∑(Xi-X)2]÷(n-1)總體標準差σ=√σ2樣本標準差S=√S2離散系數(shù)(變異系數(shù))V=σ÷X三、例題測量10株苗木高度(單位:cm),得以下數(shù)據(jù):52.7,50,55.4,61.2,55.4,49.5,50,55.4,55.4,61.2求這10株苗木算術平均數(shù)、眾數(shù)、中位數(shù)、極差、方差、標準差和變異系數(shù)。解:把數(shù)據(jù)整理為:數(shù)據(jù)52.75055.461.249.5出現(xiàn)次數(shù)(頻數(shù))12421則:算術平均數(shù)=(52.7×1+50×2+55.4×4+61.2×2+49.5×1)÷10=54.62(cm)眾數(shù)=55.4中位數(shù)=(X5+X6)÷2=(55.4+49.5)÷2=52.45極差=61.2-49.5=11.7方差=16.1616標準差=4.0201變異系數(shù)=4.0201÷54.62=0.0736設有以下在胸徑標志樣本分組資料,試計算其平均胸徑、胸徑方差、標準差、極差、中位數(shù)、變異系數(shù)。胸徑分組0-11-22-33-44-55-66-77-88-99-10∑株數(shù)311118231613852100組中值0.51.52.53.54.55.56.57.58.59.5解:平均胸徑=(0.5×3+1.5×1+2.5×11+3.5×18+4.5×23+5.5×16+6.5×13+7.5×8+8.5×5+9.5×2)÷100=4.91方差=3.7219標準差=1.9292極差=9中位數(shù)=4.5變異系數(shù)=0.3929抽樣推斷抽樣推斷包含了隨機抽樣、統(tǒng)計估量和假設檢驗三方面內(nèi)容。一、關于概率論知識事件隨機事件:在相同條件下每次試驗可能出現(xiàn),可能不出現(xiàn)事件。必定事件:每次試驗中必定出現(xiàn)事件。不可能事件:每次試驗中不可能出現(xiàn)事件。概率在大量重復試驗中,事件A發(fā)生頻率穩(wěn)定地在固定常數(shù)p附近擺動,則稱p為事件A概率,表示為P(A)=p。不可能事件概率為0,必定事件概率為1。隨機變量數(shù)學期望與方差隨機變量數(shù)學期望E(X)=隨機變量以概率為權數(shù)加權平均數(shù)=X隨機變量方差D(X)=σ2正態(tài)分布(常態(tài)分布)隨機變量X在其平均值附近概率分配較多,而遠離平均值概率分配極少最常見分布規(guī)律。記為:X~N(μ,σ2),其概率密度分布為:f(X)=EXP[-(X-X)2÷(2σ2)]÷(σ√2π)E(X)=μ,D(X)=σ2標準正態(tài)分布當E(X)=0,D(X)=1時正態(tài)分布,記為:N(0,1)二、慣用統(tǒng)計量無偏估量、漸近無偏估量無偏估量:樣本某統(tǒng)計量數(shù)學期望等于其估量總體參數(shù),則這個估量統(tǒng)計量就叫做該總體參數(shù)無偏估量。樣本平均數(shù)是總體平均數(shù)無偏估量,即E(x)=X。樣本方差是總體方差漸近無偏估量,即E(S2)=σ2。三、估量值誤差限和可靠性若統(tǒng)計量X為未知參數(shù)x估量,則:絕對誤差Δ=|X-x|相對誤差Δ'=Δ÷X估量精度A=1-Δ'可靠性1-α,其中α為危險率四、求點估量(定值估量)與區(qū)間估量步驟點估量:求出平均數(shù)X、標準差S計算絕對誤差Δ下結論:以1-α可靠性求出平均值為X,絕對誤差為Δ區(qū)間估量:求出平均數(shù)X、標準差S計算絕對誤差Δ,置信區(qū)間[X-Δ,X+Δ]下結論:以1-α可靠性求出估量值為X,絕對誤差為Δ,置信區(qū)間為[X-Δ,X+Δ]五、總體平均數(shù)μ抽樣估量條件:正態(tài):總體均服從(或近似服從)正態(tài)分布獨立:總體是相互獨立等方差:各總體方差相等方法:重復抽樣不重復抽樣大樣本(n≥50或σ2已知)求平均數(shù)X、標準差S計算絕對誤差Δ,置信區(qū)間Δ=uα×S÷√(n-1)3.結論:以1-α可靠性求出估量值為X,絕對誤差為Δ,置信區(qū)間為[X-Δ,X+Δ]1.求平均數(shù)X、標準差S2.計算絕對誤差Δ,置信區(qū)間Δ=uα×S×√[(N–n)/N]÷√(n-1)3.結論:以1-α可靠性求出估量值為X,絕對誤差為Δ,置信區(qū)間為[X-Δ,X+Δ]小樣本(n<50或σ未知1.求平均數(shù)X、標準差S2.計算絕對誤差Δ,置信區(qū)間Δ=tα×S÷√(n-1)3.結論:以1-α可靠性求出估量值為X,絕對誤差為Δ,置信區(qū)間為[X-Δ,X+Δ]注:S2=樣本方差=(n-1)×σ2÷n(重復抽樣情況下)=[N×(n-1)]×σ2÷[n×(N-1)](不重復抽樣情況下)σ2=總體方差uα=查附表2:標準正態(tài)概率雙側臨界值表。如α=0.05時,u0.5=1.96;α=0.1時,u0.01=1.64tα=查附表3:t分布臨界值表。如α=0.05,n=5時,t0.05(5-1)=t0.05(4)=2.776例1:用重復抽樣方法測得30株馬尾松人工林胸徑數(shù)據(jù)以下:13.611.210.28.59137.18.214.511.78.75.110.511.510.911.110.212.67.210.59.49.78.712.210.21210.810.39.512.5試以0.95置信度求林分平均胸徑所在范圍解:1.求平均數(shù)X、標準差SX=10.35S=2.012.查附表3得t0.05(30-1)=t0.05(29)=2.0453.計算絕對誤差Δ,置信區(qū)間Δ=tα×S÷√(n-1)=2.045×2.01÷√29=0.76X-Δ=9.59X+Δ=11.124.下結論:以0.95可靠性求出估量值為10.35,絕對誤差為0.76,置信區(qū)間為[9.59,11.12]六、總體頻率抽樣估量重復抽樣不重復抽樣大樣本(n≥50)求頻率pp=樣本具備某特點單元數(shù)÷樣本總單元數(shù)=m÷n查附表2得uα求絕對誤差限Δ、置信區(qū)間Δ=uα×√[p×(1-p)÷n]4.下結論:以1-α可靠性求出總體頻率估量值為p,絕對誤差為Δ,置信區(qū)間為[p-Δ,p+Δ]1.求頻率pp=具備某特點單元數(shù)÷總單元數(shù)=m÷n2.查附表2得uα3.求絕對誤差限Δ、置信區(qū)間Δ=uα×√[p×(1-p)×(N-n)÷n÷(N-1)]4.下結論:以1-α可靠性求出總體頻率估量值為p,絕對誤差為Δ,置信區(qū)間為[p-Δ,p+Δ]例:為估量某針闊混交林中針葉林地面積所占百分比,用重復抽樣方式抽取了100個點進行觀察。觀察結果有68個點為針葉林。試以0.95可靠性估量該混交林中針葉林面積所占百分比置信區(qū)間解:1.求頻率pp=68÷100=0.681-p=0.322.查附表2得u0.05=1.963.求絕對誤差限Δ、置信區(qū)間Δ=u0.05×√[0.68×0.32÷100]=0.09p-Δ=0.59,p+Δ=0.774.下結論:以0.95可靠性求出總體頻率估量值為0.68,絕對誤差為0.09,置信區(qū)間為[0.59,0.77]第八章顯著性檢驗(統(tǒng)計假設檢驗)總體平均數(shù)μ顯著性檢驗重復抽樣不重復抽樣大樣本(n≥50或σ2已知)假設:H0:μ=μ0,即總體平均值無顯著差異H1:μ≠μ0,即總體平均值有顯著差異計算統(tǒng)計量U=(X-μ)×√n÷σ=(X-μ)×√(n-1)÷S3.查附表2得uα下結論:若|U|>uα則拒絕H0,即總體平均值有顯著差異若|U|<uα則接收H0,即總體平均值無顯著差異1.假設:H0:μ=μ0,即總體平均值無顯著差異H1:μ≠μ0,總體平均值有顯著差異2.計算統(tǒng)計量U=(X-μ)×√[N(n-1)]÷σ÷√(N-n)=(X-μ)×√[N(n-1)]÷S÷√(N-n)查附表2得uα下結論:若|U|>uα則拒絕H0,即總體平均值有顯著差異若|U|<uα則接收H0,即總體平均值無顯著差異小樣本(n<50假設:H0:μ=μ0,即總體平均值無顯著差異H1:μ≠μ0,即總體平均值有顯著差異計算統(tǒng)計量T=(X-μ)×√(n-1)÷S查附表3得tα(n-1)下結論:若|T|>tα(n-1)則拒絕H0,即總體平均值有顯著差異若|T|<tα(n-1)則接收H0,即總體平均值無顯著差異注:X=計算出來樣本平均數(shù)μ=題目給出總體平均數(shù)σ=題目給出總體標準差S=計算出來樣本標準差總體成數(shù)(頻率)顯著性檢驗大樣本:n≥50或σ2已知1.假設:H0:p=p0,即總體頻率無顯著差異H1:總體頻率有顯著差異2.計算統(tǒng)計量U=(p-p0)×√n÷√[p0(1-p0)]=(m-n×p0)÷√[n×p0(1-p0)]其中:m=具備某特點樣本個數(shù)n=樣本總容量p0=題目給出總體成數(shù)(頻率)p=m÷n查附表2得uα下結論:若|U|>uα則總體頻率有顯著差異若|U|<uα則總體頻率無顯著差異兩總體平均數(shù)顯著性檢驗1.假設:H0:μ1=μ2,即兩總體平均數(shù)無顯著差異H1:兩總體平均數(shù)有顯著差異2.計算統(tǒng)計量大樣本:U=(X1-X2)÷σ÷√(1/n1+1/n2)=(X1-X2)×√(n1+n2-2)÷√[(n1S12+n2S22)×(1/n1+1/n2)]小樣本:T=(X1-X2)×√(n1+n2-2)÷√[(n1S12+n2S22)×(1/n1+1/n2)]其中:X1、X2分別為兩個樣本平均數(shù)n1、n2分別是兩個樣本容量S1、S2分別是兩個樣本標準差3.查附表2或3得uα或tα(n1+n2-2)4.下結論:大樣本:若|U|>uα則兩總體平均數(shù)有顯著差異若|U|<uα則兩總體平均數(shù)無顯著差異小樣本:若|T|>tα(n1+n2-2)則兩總體平均值有顯著差異若|T|<tα(n1+n2-2)則兩總體平均值無顯著差異兩總體頻率(成數(shù))顯著性檢驗1.假設:H0:p1=p2,即兩總體頻率無顯著差異H1:兩總體頻率有顯著差異2.計算統(tǒng)計量U=(p1-p2)÷√[P(1-P)(1/n1+1/n2)]其中:p1、p2分別為兩樣本頻率n1、n2分別為兩樣本容量m1、m2分別為兩樣本具備某種特征個數(shù)p1=m1÷n1p2=m2÷n2P=(m1+m2)÷(n1+n2)3.查附表2得uα4.下結論:若|U|>uα則兩總體頻率有顯著差異若|U|<uα則兩總體頻率無顯著差異兩個總體方差顯著性檢驗1.假設:H0:兩個總體方差無顯著差異H1:兩個總體方差有顯著差異2.計算統(tǒng)計量F=n1×S12×(n2-1)÷n2÷S22÷(n1-1)其中:n1、n2分別是抽自兩個正態(tài)總體樣本容量S12、S22分別是兩個樣本方差,且S12>S223.查附表5(F分布臨界值表)得Fα(n1-1,n2-1)4.下結論:若F>Fα(n1-1,n2-1)則兩個總體方差有顯著差異若F<Fα(n1-1,n2-1)則兩個總體方差無顯著差異例題:例1:已知某煉鐵廠鐵水含量在正常情況下有正態(tài)分布N(4.55,0.1082)?,F(xiàn)在測了五爐鐵水,其含碳量分別為:4.28,4.4,4.42,4.35,4.37。問:若標準差不改變,總體平均值有沒有改變?(α=0.05)解:1.假設:H0:總體平均值無顯著差異H1:總體平均值有顯著差異2.計算統(tǒng)計量X=4.364μ=4.55σ2=0.1082U=(4.364-4.55)×√5÷0.108=-3.85103.查附表2得u0.05=1.964.下結論:因為|U|>1.96,所以總體平均值有顯著差異。例2:某廠生產(chǎn)樂器用合金弦線,其抗拉強度服從均值為10560(千克/厘米2)正態(tài)分布?,F(xiàn)從一批產(chǎn)品中抽取10根,測得其抗拉強度為:10512,10623,10668,10554,10776,10707,10557,10581,10666,10670。問:這批產(chǎn)品抗拉強度有沒有顯著改變?(α=0.05)解:1.假設:H0:總體平均值無顯著差異H1:總體平均值有顯著差異2.計算統(tǒng)計量X=10631.4千克/厘米2μ=10560千克/厘米2S=76.8404千克/厘米2T=(10631.4-10560)×√(10-1)÷76.8404=2.78763.查附表3得t0..05(10-1)=2.2624.下結論:因為|T|>2.262,所以總體平均值有顯著差異,即這批產(chǎn)品抗拉強度有顯著改變。例3:林場與4個管理區(qū)訂協(xié)議,造林成活率達成85%時認為達成要求,然后把4個管理區(qū)造林,用重復抽樣方式分別各調(diào)查200株,其中第一管理區(qū)成活180株;第二管理區(qū)成活185株;第三管理區(qū)成活168株;第四管理區(qū)成活170株。這4個管理區(qū)造林成活率是否達標?(α=0.05)解:1.假設:H0:總體頻率無顯著差異2.計算統(tǒng)計量p1=180÷200=0.9p2=185÷200=0.925p3=168÷200=0.84p4=170÷200=0.85U1=(0.9-0.85)×√200÷√(0.85×0.15)=1.9803U2=(0.925-0.85)×√200÷√(0.85×0.15)=2.9704U3=(0.84-0.85)×√200÷√(0.85×0.15)=-0.3961U4=(0.85-0.85)×√200÷√(0.85×0.15)=03.查附表2得u0.05=1.964.下結論:因為|U1|>1.96,|U2|>1.96,|U3|<1.96,|U4|<1.96,所以,只有第一、二管理區(qū)造林成活率達成要求。例4:兩臺機床加工同一個圓筒,抽樣測量產(chǎn)品內(nèi)徑,結果以下:第一臺機床:n1=100,X1=33.75,S1=0.1第二臺機床:n2=100,X2=34.15,S2=0.15試檢驗兩臺機床所加工圓筒內(nèi)徑均值有沒有顯著差異(α=0.05)解:1.假設:H0:兩臺機床所加工圓筒內(nèi)徑無顯著差異2.計算統(tǒng)計量U=(33.75-34.15)×√(100+100-2)÷√[(100×0.12+100×0.152)×(1/100+1/100)]=-22.07683.查附表2得u0.05=1.964.下結論:因為|U|>1.96,所以兩臺機床所加工圓筒內(nèi)徑有顯著差異。例5:為了估量兩個工廠所生產(chǎn)產(chǎn)品質(zhì)量,取出樣品n1=200和n2=300件產(chǎn)品,在這兩個樣品中,分別出現(xiàn)m1=20和m2=15件廢品。在顯著水平0.05下,檢驗關于兩個工廠生產(chǎn)廢品率相等零假設:H0:p1=p2,備擇假設H1:p1≠p2解:1.假設:H0:p1=p2H1:p1≠p22.計算統(tǒng)計量p1=20÷200=0.1p2=15÷300=0.05P=(20+15)÷(200+300)=0.071-P=0.93U=(0.1-0.05)÷√[0.07×0.93×(1/200+1/300)]=2.14673.查附表2得u0.05=1.964.下結論:因為|U|>1.96,所以兩個工廠生產(chǎn)廢品率有顯著差異。例6:依照抽自正態(tài)總體X1和X2容量n1=9和n2=6兩個獨立樣本,求得樣本方差S12=14.4和S22=20.5,在顯著水平0.1下,檢驗關于總體方差相等零假設H0:σ12=σ22解:1.假設:H0:σ12=σ22H1:σ12≠σ222.計算統(tǒng)計量∵S12<S22∴F=6×20.5×8÷9÷14.4÷5=1.51853.查附表5得F0.05(5,8)=3.694.下結論:因為|F|>3.69,所以,在顯著水平0.1下,兩總體方差相等。第九章相關與回歸一、一元線性回歸方程建立x=自變量y=因變量X=(∑xi)÷nY=(∑yi)÷nLxx=(∑xi2)-(∑xi)2÷n=n×Sx2Lyy=(∑yi2)-(∑yi)2÷n=n×Sy2Lxy=∑xiyi-(∑xi)×(∑yi)÷n一元線性回歸方程為:y=a+bx其中:b=Lxy÷Lxxa=Y-bX二、樣本相關系數(shù)樣本相關系數(shù)r=Lxy÷√(L

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論