復(fù)旦大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)課件08參數(shù)估計(jì)基礎(chǔ):抽樣分布_第1頁
復(fù)旦大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)課件08參數(shù)估計(jì)基礎(chǔ):抽樣分布_第2頁
復(fù)旦大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)課件08參數(shù)估計(jì)基礎(chǔ):抽樣分布_第3頁
復(fù)旦大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)課件08參數(shù)估計(jì)基礎(chǔ):抽樣分布_第4頁
復(fù)旦大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)課件08參數(shù)估計(jì)基礎(chǔ):抽樣分布_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、參數(shù)估計(jì)基礎(chǔ)-抽樣分布1抽樣誤差從總體均數(shù) 為155.4cm,標(biāo)準(zhǔn)差 為5.3cm的正態(tài)分布總體中隨機(jī)抽樣。樣本大小為30n=30 .2從正態(tài)總體 抽樣得到的1000個樣本均數(shù)的頻數(shù)分布(ni=30)3Mean=155.426 Std=0.9664抽樣誤差結(jié)果:各樣本均數(shù)不一定等于總體均數(shù)樣本均數(shù)間存在差異樣本均數(shù)的分布規(guī)律:圍繞總體均數(shù)上下波動樣本均數(shù)的變異:由樣本均數(shù)的標(biāo)準(zhǔn)差描述。5抽樣誤差抽樣誤差Sampling error 由抽樣引起的樣本統(tǒng)計(jì)量與總體參數(shù)間的差異來源:個體變異抽樣表現(xiàn)樣本統(tǒng)計(jì)量與總體參數(shù)間的差異樣本統(tǒng)計(jì)量間的差異6樣本均數(shù)的規(guī)律性隨機(jī)的在概率意義下是有規(guī)律的-抽樣分布

2、通過大量重復(fù)抽樣,借助頻數(shù)表描述樣本均數(shù)的變異規(guī)律(抽樣分布)與個體觀察值變異規(guī)律有關(guān)即使只有一個樣本資料,也可由樣本資料的個體觀察值的變異規(guī)律間接得到樣本均數(shù)的變異規(guī)律抽樣分布7正態(tài)總體樣本均數(shù)的分布已知某地高三男生的平均身高為 ,標(biāo)準(zhǔn)差為 ,將其視為一個總體。從該總體中隨機(jī)抽樣樣本含量為n每次抽取10000個樣本并計(jì)算各自的樣本均數(shù)以10000個樣本均數(shù)作為一個新的樣本制作頻數(shù)圖8抽樣1樣本含量n=4 的平均數(shù) =168.19 的標(biāo)準(zhǔn)差 =2.9670 9抽樣2樣本含量 n=16 的平均數(shù) =168.158 的標(biāo)準(zhǔn)差 =1.4884 10抽樣3樣本含量 n=36 的平均數(shù) =168.149

3、3 的標(biāo)準(zhǔn)差 =0.9997 11從正態(tài)分布的總體 中隨機(jī)抽取樣本含量為n的樣本X1,X2,Xn,其樣本均數(shù) 服從正態(tài)分布,總體均數(shù)為 ;樣本均數(shù)的總體標(biāo)準(zhǔn)差若 ,則其中任意一個隨機(jī)樣本Xn的均數(shù)正態(tài)總體樣本均數(shù)的分布12樣本均數(shù)的標(biāo)準(zhǔn)差 ,稱為樣本均數(shù)的標(biāo)準(zhǔn)誤(standard error of mean ,SE),簡稱均數(shù)標(biāo)準(zhǔn)誤它反映樣本均數(shù)之間的離散程度,也反映樣本均數(shù)抽樣誤差的大小。誤差大小 ,實(shí)質(zhì)是要估計(jì) 的分布特征 正態(tài)總體樣本均數(shù)的分布13由于實(shí)際 往往未知,需要用樣本 來估計(jì) ,樣本均數(shù)標(biāo)準(zhǔn)誤的估計(jì)式為注意區(qū)別:證明:正態(tài)總體樣本均數(shù)的分布14非正態(tài)總體樣本均數(shù)的分布從總體均數(shù)

4、為1的指數(shù)分布中抽樣,樣本大小分別為4,9,100。每次抽10000個樣本制作頻數(shù)分布圖151617抽樣1樣本含量n=4 的平均數(shù) =1.0133 的標(biāo)準(zhǔn)差 =0.5031 的中位數(shù) =0. 929818抽樣2樣本含量n=9 的平均數(shù) =0.9959 的標(biāo)準(zhǔn)差 =0. 3332 的中位數(shù) =0.957419抽樣3樣本含量n=100 的平均數(shù) =0.9993 的標(biāo)準(zhǔn)差 =0.1001 的中位數(shù) =0.995820從非正態(tài)指數(shù)分布總體中隨機(jī)抽樣所得樣本均數(shù) :在樣本含量較小時(shí)呈偏態(tài)(非指數(shù)型)樣本含量較大時(shí)接近正態(tài)分布均數(shù) 始終在總體均數(shù) 附近均數(shù) 的標(biāo)準(zhǔn)差非正態(tài)總體樣本均數(shù)的分布21中心極限定理

5、及其應(yīng)用樣本均數(shù) 總體標(biāo)準(zhǔn)差是個體資料X的總體標(biāo)準(zhǔn)差的 ;即理論標(biāo)準(zhǔn)誤理論標(biāo)準(zhǔn)誤的樣本估計(jì)值為樣本均數(shù) 與 個體資料X的集中位置相同,即樣本均數(shù) 的總體均數(shù)與 個體資料X的總體均數(shù) 相同22中心極限定理及其應(yīng)用若個體資料X服從正態(tài)總體 ,則樣本均數(shù) 也服從正態(tài)分布 ;個體資料X服從偏態(tài)分布,當(dāng)樣本量n較大時(shí),樣本均數(shù) 近似服從正態(tài)分布23例3.3 已知在某地7歲正常發(fā)育男孩的身高服從正態(tài)分布N(121,52)正常發(fā)育7歲男孩身高的95%范圍為 (111.2,130.8)若在該地正常7歲男孩中隨機(jī)抽一個樣本,樣本含量為100,則樣本均數(shù)的95范圍為 =(120.2,121.98), 24 t分布

6、 , 標(biāo)準(zhǔn)正態(tài)分布與t統(tǒng)計(jì)量 實(shí)際研究中未知,用樣本的標(biāo)準(zhǔn)差S作為的一個近似值(估計(jì)值)代替,得到變換后的統(tǒng)計(jì)量并記為 25如在正態(tài)總體N(168.18,62)中隨機(jī)抽樣,樣本量分別取n =5,n =100,均抽10000個樣本,分別計(jì)算t值和U值并作相應(yīng)t的頻數(shù)圖 t分布26 t分布樣本含量n=5樣本含量n=100 t統(tǒng)計(jì)量的頻數(shù)圖 27結(jié)果小樣本時(shí),t統(tǒng)計(jì)量和U統(tǒng)計(jì)量的分布有明顯差別大樣本時(shí),t統(tǒng)計(jì)量和U統(tǒng)計(jì)量的分布非常接近。頻數(shù)圖當(dāng)樣本量較大時(shí),統(tǒng)計(jì)量t的頻數(shù)圖與標(biāo)準(zhǔn)正態(tài)分布曲線非常接近樣本含量較小時(shí),t統(tǒng)計(jì)量的峰值比標(biāo)準(zhǔn)正態(tài)分布的峰值略小,雙側(cè)尾部的值則較標(biāo)準(zhǔn)正態(tài)分布略大 t分布28英

7、國統(tǒng)計(jì)學(xué)家W. S. Gosset(1908)設(shè) 并給出了統(tǒng)計(jì)量t的分布規(guī)律,并稱統(tǒng)計(jì)量t的分布規(guī)律為t分布,自由度為v,記為t(v)分布。 每個自由度v對應(yīng)一個分布,因此t分布是一簇分布 t分布僅與總體均數(shù)有關(guān),與總體標(biāo)準(zhǔn)差無關(guān) t分布29三條t分布密度曲線 t分布v=1v=5v=30t分布的圖形特征分布特征 t分布曲線是單峰的關(guān)于t = 0對稱自由度越大,t值越小 t分布與正態(tài)分布的關(guān)系 自由度v較小時(shí),t分布與標(biāo)準(zhǔn)正態(tài)分布相差較大,并且t分布曲線的尾部面積大于標(biāo)準(zhǔn)正態(tài)分布曲線的尾部面積當(dāng)自由度 時(shí),t分布逼近于標(biāo)準(zhǔn)正態(tài)分布。31t分布的界值 給定自由度v,t分布曲線的雙側(cè)尾部面積為時(shí)對應(yīng)

8、的t值,記為并稱 為t的雙側(cè)界值 單側(cè)界值 :一側(cè)尾部面積為時(shí)對應(yīng)的t值對稱性得:單側(cè)曲線下面積=2雙側(cè)曲線下面積同樣的尾部面積,t分布的界值要大于標(biāo)準(zhǔn)正態(tài)分布的界值 32 t分布界值示意圖,表示陰影的面積 33樣本率的分布 總體率由樣本率估計(jì)例如,設(shè)樣本的個體數(shù)(即樣本含量)為n,若x為樣本的某指標(biāo)陽性個體數(shù),則可用樣本陽性率 估計(jì)研究人群的陽性率 (總體陽性率); 由于個體差異和偶然性的影響,樣本率也存在抽樣誤差-由抽樣造成樣本率與總體率(研究人群的率)的差異 樣本率是隨機(jī)的,但在概率意義下也是有規(guī)律的-樣本率的分布。34隨機(jī)抽樣試驗(yàn),分別在總體率=0.4,0.5,0.01的總體中隨機(jī)抽樣

9、,其總體率和樣本含量n每種情況分別隨機(jī)抽10000個樣本,每個樣本計(jì)算其樣本率,把同一種情況的10000個樣本率視為一個新的樣本資料作頻數(shù)圖 樣本率的分布 35抽樣136抽樣137抽樣338抽樣439結(jié)果總體率相同時(shí),樣本含量越大,樣本率的分布越趨向?qū)ΨQ。樣本含量n相同時(shí),越偏離0.5,樣本率的分布越偏態(tài)分布??傮w率0.5時(shí),任意樣本含量的樣本率都呈對稱分布。樣本率p的樣本標(biāo)準(zhǔn)差 。樣本率的分布 40中心極限定理及其推論若樣本中的個體個數(shù)(即樣本含量)為n,總體率為,樣本率為p,則樣本率的總體均數(shù)等于總體率樣本率的總體標(biāo)準(zhǔn)差(即率的標(biāo)準(zhǔn)誤) 由于總體率通常是未知的,因而用樣本率p來估計(jì),故率的標(biāo)準(zhǔn)誤的估計(jì)值常表示為 41對于大量重復(fù)隨機(jī)抽樣而言,樣本率p圍繞著總體率波動樣本含量n越大,這種波動越小。當(dāng)n的值充分大時(shí),p的分布就近似于均數(shù)為 ,標(biāo)準(zhǔn)差為 的正態(tài)分布。這里樣本含量n “充分大”指 、 且n40。當(dāng)總體率0.5時(shí),則樣本率p的分布為對稱分布 當(dāng)樣本含量n為定值時(shí),總體率越接近0.5,樣本率p近似正態(tài)分布的程度就越好 中心極限定理及其推論42STATA命令模擬各種分布模擬正態(tài)分布的樣本均

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論