




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
樣本與抽樣分布§6.1數(shù)理統(tǒng)計的基本概念一.數(shù)理統(tǒng)計研究的對象例:有一批燈泡,要從使用壽命這個數(shù)量指標來看其質(zhì)量,設(shè)壽命用X表示。(1)若規(guī)定壽命低于1000小時的產(chǎn)品為次品。此問題是求P(X1000)=F(10000),求F()?(2)從平均壽命、使用時數(shù)長短差異來看其質(zhì)量,即求E()?、D()?。要解決二個問題1.試驗設(shè)計抽樣方法。2.數(shù)據(jù)處理或統(tǒng)計推斷。方法具有“從局部推斷總體”的特點。二.總體(母體)和個體1.所研究對象的全體稱為總體,把組成總體的每一個對象成員(基本單元)稱為個體。說明:對總體我們關(guān)心的是研究對象的某一項或某幾項數(shù)量指標(或?qū)傩灾笜?以及他們在整體中的分布。所以總體是個體的數(shù)量指標的全體。(2)為研究方便將總體與一個R.VX對應(yīng)(等同)??傮w中不同的數(shù)量指標的全體,即是R.V.X的全部取值。R.VX的分布即是總體的分布情況。例:一批產(chǎn)品是100個燈泡,經(jīng)測試其壽命是:1000小時1100小時1200小時20個30個50個X100011001200P20/10030/10050/100(設(shè)X表示燈泡的壽命)可知R.V.X的分布律,就是總體壽命的分布,反之亦然。常稱總體X,若R.VX~F(),有時也用F()表示一個總體。(3)我們對每一個研究對象可能要觀測兩個或多個數(shù)量指標,則可用多維隨機向量(X,Y,Z,…)去描述總體。2.總體的分類有限總體無限總體三.簡單隨機樣本.1.定義6.1:從總體中抽得的一部分個體組成的集合稱為子樣(樣本),取得的個體叫樣品,樣本中樣品的個數(shù)稱為樣本容量(也叫樣本量)。每個樣品的測試值叫觀察值。取得子樣的過程叫抽樣。樣本的雙重含義:(1)隨機性:用(X,X,……X)n維隨機向量表示。X表示第i個被抽到的個體,是隨機變量。(i=1,2,…n)(2)確定性:(,,……)表示n個實數(shù),即是每個樣品X觀測值(i=1,2,…n)。2.定義6.2:設(shè)總體為X,若X,X……X相互獨立且與X同分布,則稱(X,X…X)為來自總體X的容量為n的簡單隨機樣本(簡稱樣本)。3.已知總體的分布寫出子樣的分布(1)已知總體X~F(),則樣品X~F()i=1,2…n樣本(X,X…X)的聯(lián)合分布為:F(,…)=P(X,X…X)=P(X)=F()若總體X~f(),樣品X~f()i=1,2……n樣本(X,X……X)的聯(lián)合密度是:f(,……)=f()例:總體X~N(,寫出該總體樣本(X,X…X)的聯(lián)合密度。(2)若總體X是離散型隨機變量,一般給出分布律:P(X=k)=pk.k=1,2……要寫出概率函數(shù)f()即f()=P(X=k)==1,2…..,例:總體X~()寫出該總體樣本(X1,X2,…Xn)的聯(lián)合概率函數(shù)例:總體X~B(1,p),0p1寫出其樣本(X,X,……X)的聯(lián)合概率函數(shù)。四經(jīng)驗分布函數(shù)與直方圖1.樣本的經(jīng)驗分布函數(shù)(1)定義:設(shè)(1,2,…n)是來自總體X的一組樣本值。將它們按由小到大排序為:12…i…n對任意的實數(shù),定義函數(shù):Fn(x)=則稱F()為總體X的經(jīng)驗分布函數(shù)。格列文科定理:設(shè)總體X的分布函數(shù)、經(jīng)驗分布函數(shù)分別為F()、Fn(),則有:P=1上式表明,當,概率為1的有F均勻地趨于F()。2總體的概率密度的估計直方圖(第一版)[p143例6.3]可以用SAS下的interactivedataanalysis模塊演示。五統(tǒng)計量與樣本的數(shù)字特征1定義6.3:設(shè)X1,X2,…,Xn是來自總體X的容量為n的樣本,g(1,2,…,n)是定義在Rn或Rn子集上的普通函數(shù)。如果g中不含有任何未知量,則稱g(X1,X2,…,Xn)為統(tǒng)計量。2.常用的統(tǒng)計量(樣本的數(shù)字特征)定義6.4:設(shè)X1,X2,…,Xn是來自總體X的樣本,則稱為樣本均值為樣本方差為樣本k階原點矩為樣本k階中心矩3.重要性質(zhì)定理6.1:設(shè)總體X不論服從什么分布,只要其二階矩存在,即E(X)=μ、D(X)=б2都存在,則:(1)E()=E(X)=μ(2)D()=D(X)=(3)E(S2)=D(X)=б2重要恒等式:§6.2抽樣分布統(tǒng)計量是樣本的函數(shù),它是一個隨機變量。統(tǒng)計量的分布稱為抽樣分布。一.三個重要分布(一)分布定義6.5:設(shè)X1,X2,…Xn相互獨立,均服從N(0,1),則稱隨機變量服從自由度為n的分布,記為,即:。2.定理3.8:的概率密度為 其中定理的說明見P146頁。3.圖形.分布函數(shù)圖:dataKf;dox=0to30by0.1;y=PROBCHI(x,8);output;end;run;procgplotdata=kf;ploty*x=1;symbol1v=nonei=joinr=1c=run;密度函數(shù)圖:n=1,5,15datakf;doy=0to20by0.1;z0=(y**(-0.5)*exp(-y/2))/(2**0.5*GAMMA(0.5));z1=(y**(1.5)*exp(-y/2))/(2**2.5*GAMMA(2.5));z2=(y**(6.5)*exp(-y/2))/(2**7.5*GAMMA(7.5));output;end;run;procgplotdata=kf;plotz0*y=1z1*y=1z2*y=1/overlay;symbol1v=nonei=joinr=1c=run;求概率:自由度為n=25,P{X<34.382}的概率這樣求。data;p=PROBCHI(34.382,25);putp=;run;其它可類推。。4.性質(zhì)①若,則E()=n,D()=2n②若且它們相互獨立,則③若相互獨立,均服從(μ,σ2),則④總體X服從參數(shù)為λ的指數(shù)分布;X1,X2,…,Xn是來自該總體的樣本.則:(二).t分布定義6.6:設(shè)X~(0,1),Y~2(n)且它們相互獨立,則稱隨機變量服從自由度為n的t分布,記為t(n),即。定理3.9:的概率密度為-∝<t<+∝性質(zhì):(1)t分布的密度是偶函數(shù),圖形為:n=1,10,100時datastudent;dot=-3to3by0.01;z1=(gamma(1)*(1+t**2)**(-1))/((3.1415926)**0.5*gamma(0.5));z10=(gamma(5.5)*(1+t**2/10)**(-5.5))/((10*3.1415926)**0.5*gamma(5));z100=(gamma(50.5)*(1+t**2/100)**(-50.5))/(100*(3.1415926)**0.5*gamma(50));output;end;run;procgplotdata=student;plotz1*t=1z10*t=1z100*t=1/overlay;symbol1v=nonei=joinr=1c=run;類似(0,1)圖形,n越大峰值越高。分布函數(shù)圖:n=10.datat;dox=-5to5by0.1;y=PROBT(x,10);output;end;run;procgplotdata=t;ploty*x=1;run;(2)可證明當>45時,t分布與接近。(3)當n>2時,E(T)=0,(證略)(三)F分布定義6.7:設(shè)V~2(m),W~2(n),且它們相互獨立,則稱隨機變量服從第一自由度為m、第二自由度為n的F分布,記為F(m,n),即Fm,n~F(m,n)。定理3.10:Fm,n為服從第一自由度為m,第二自由度為n的F分布的隨機變量,則其密度函數(shù)為圖形:給定m,n可畫出一個密度圖形密度函數(shù)圖:dataf;%macroa(m,n,x);dataa;doy=0to2by0.01;F&x=(gamma((&m+&n)/2)*(&m/&n)**(&m/2)*y**(&m/2-1))/(gamma(&m/2)*gamma(&n/2)*(1+(&m*y/&n))**(&m+&n)/2);output;end;dataF;mergeaf;%menda;%a(10,25,1);%a(10,5,2);run;procgplotdata=f;plotF1*y=1F2*y=1symbol1v=nonei=joinr=1c=run;易推知:=1\*GB3①若F~F(m,n),則~F(n,m)=2\*GB3②若X~t(n),則X2~F(1,n)練習:書上P151有證明。設(shè),證明:且(注:表示服從自由為的F分布,表示F分布的分位數(shù)。如:data;Q_F=FINV(0.95,12,9);putQ_F=;Q_F=FINV(1-0.95,12,9);putQ_F=;Run;二.常用概率分布的分位數(shù)定義6.8:設(shè)X~(x),對于給定的正數(shù)(0<<1),若存在一個實數(shù)A滿足:P{x>A}=則稱A為X的上側(cè)分位數(shù),簡稱上分位數(shù);若X服從某分布,稱A為某分布的上分位數(shù)。(1)~稱滿足的數(shù)為自由度為n的分布的上分位數(shù)。查表①P248n≤45=2\*GB3②n>45時注意所以類的統(tǒng)計分析軟件不是這樣定義的,只有一個分位數(shù)(實際上是下分位數(shù)的定義)書上P147---148頁,data;q1=CINV(1-0.005,10);putq1=;q2=CINV(1-0.01,10);putq2=;q3=CINV(1-.1,10);putq3=;q4=CINV(1-.1,25);putq4=;run;q1=25.188179572q2=23.209251159q3=15.987179172q4=34.381587018自由度為n=25,P{X<34.382}的概率。data;p=PROBCHI(34.382,25);putp=;run;其它一些分布分位數(shù)求解如前幾章講過的,對于正態(tài)分布有結(jié)果:SAS的兩種計算公式:data;p1=PROBNORM(1)-PROBNORM(-1);putp1=;p2=PROBNORM(2)-PROBNORM(-2);putp2=;p3=PROBNORM(3)-PROBNORM(-3);putp3=;run;p1=0.6826894921p2=0.9544997361p3=0.9973002039data;p1=2*PROBNORM(1)-1;putp1=;p2=2*PROBNORM(2)-1;putp2=;p3=2*PROBNORM(3)-1;putp3=;run;p1=0.6826894921p2=0.9544997361p3=0.9973002039也可以驗證數(shù)據(jù),即以為中心,需要幾倍的標準差距離所構(gòu)成的區(qū)間,其區(qū)間內(nèi)的概率為上述所示。Data;q1=abs(probit((1-0.6826894921)/2));putq1=;q2=abs(probit((1-0.9544997361)/2));putq2=;q3=abs(probit((1-0.9973002039)/2));putq3=;run;q1=0.9999999999q2=2q3=2.9999999959data;q1=probit(1-(1-0.6826894921)/2);putq1=;q2=probit(1-(1-0.9544997361)/2);putq2=;q3=probit(1-(1-0.9973002039)/2);putq3=;run;q1=0.9999999999q2=2q3=2.9999999959注意:為中心,概率為90%,95%,98%,99%的區(qū)間,需要幾倍的標準差距離。Data;q1=abs(probit((1-0.9)/2));putq1=;q2=abs(probit((1-0.95)/2));putq2=;q3=abs(probit((1-0.98)/2));putq3=;q3=abs(probit((1-0.99)/2));putq3=;run;q1=1.644853627q2=1.9599639845q3=2.326347874q3=2.5758293035比如,=0.95等的結(jié)論也是常用的。幾乎都成常識了。data;q1=exp(-1.65**2/2)/sqrt(2*(3.1415926));putq1=;q2=PROBNORM(-1.65);putq2=;aa=q1/q2;putaa=;run;還有如:SASFUNCTIONS:QuantileFunctionsBETAINV(p,a,b)returnsaquantilefromthebetadistributionCINV(p,df<,nc>)returnsaquantilefromthechi-squareddistributionFINV(p,ndf,ddf<,nc>)returnsaquantilefromtheFdistributionGAMINV(p,a)returnsaquantilefromthegammadistributionPROBIT(p)returnsaquantilefromthestandardnormaldistributionTINV(p,df<,nc>)returnsaquantilefromthetdistribution可證明:n很大(2)T~t(n)稱滿足P{T>tα(n)}=的數(shù)tα(n)為t(n)上分位數(shù)。查表:①n≤45時,直接查表。②n>45時,,tα(n)=uα。注意:T~t(n)的密度是偶函數(shù)。稱滿足正數(shù)為分布的雙側(cè)分位數(shù)。易知:查表可得,且同樣標準正態(tài)分布有:。例:n=20的t分布,求其0.1的上分位數(shù),有data;q=TINV(1-0.1,5);putq=;q=TINV(1-0.1,10);putq=;q=TINV(1-0.1,20);putq=;q=TINV(1-0.1,50);putq=;q=TINV(1-0.1,100);putq=;q=TINV(1-0.1,200);putq=;qnorm=(probit(1-0.1));putqnorm=;run;q=1.4758840488q=1.3721836411q=1.325340707q=1.2987136942q=1.2900747613q=1.285798794qnorm=1.2815515655對于概率:我們看一下當n很大時,t(n)和標準正態(tài)分布的近似性
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度跨境電商物流風險承擔協(xié)議
- 二零二五年度北京小客車指標車牌租賃及交通違章處理合同
- 2025年度高速公路隧道道閘系統(tǒng)安裝與通風管理合同
- 2025年度航空航天產(chǎn)業(yè)融資服務(wù)合同
- 2025年度高速列車乘客搭乘免責協(xié)議
- 2025年度特色項目按摩師用工合同書
- 產(chǎn)品發(fā)布與推廣流程優(yōu)化指南
- 新辦公大樓落成慶典上的發(fā)言稿
- 聘用資料員勞動協(xié)議
- 業(yè)務(wù)合作備忘錄及協(xié)議事項約定
- 2018年版電工-國家職業(yè)技能標準
- 反強迫勞動反歧視反騷擾培訓(xùn)課件
- 軟件工程導(dǎo)論課件(全)
- 水工-建筑物課件
- EBS-發(fā)運管理操作實例
- 中職生心理特征和常見心理問題
- 晉中信息學(xué)院基本信息登記表
- 旋挖樁施工工藝
- 護理安全警示教育ppt
- GB/T 5392-2004林業(yè)機械油鋸技術(shù)條件
- 食品安全 PPT課件7農(nóng)獸藥化學(xué)性污染對食品安全性的影響
評論
0/150
提交評論