復(fù)旦大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)課件08參數(shù)估計(jì)基礎(chǔ)：抽樣分布

上傳人：東*** IP屬地：云南上傳時(shí)間：2022-09-08 格式：PPT 頁數(shù)：44 大?。?98KB 積分：7.2 舉報(bào) 版權(quán)申訴

復(fù)旦大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)課件08參數(shù)估計(jì)基礎(chǔ)：抽樣分布_第2頁

復(fù)旦大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)課件08參數(shù)估計(jì)基礎(chǔ)：抽樣分布_第3頁

復(fù)旦大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)課件08參數(shù)估計(jì)基礎(chǔ)：抽樣分布_第4頁

復(fù)旦大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)課件08參數(shù)估計(jì)基礎(chǔ)：抽樣分布_第5頁

已閱讀5頁，還剩39頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、參數(shù)估計(jì)基礎(chǔ)-抽樣分布1抽樣誤差從總體均數(shù) 為155.4cm，標(biāo)準(zhǔn)差為5.3cm的正態(tài)分布總體中隨機(jī)抽樣。樣本大小為30n=30 .2從正態(tài)總體抽樣得到的1000個樣本均數(shù)的頻數(shù)分布(ni=30)3Mean=155.426 Std=0.9664抽樣誤差結(jié)果：各樣本均數(shù)不一定等于總體均數(shù)樣本均數(shù)間存在差異樣本均數(shù)的分布規(guī)律：圍繞總體均數(shù)上下波動樣本均數(shù)的變異：由樣本均數(shù)的標(biāo)準(zhǔn)差描述。5抽樣誤差抽樣誤差Sampling error 由抽樣引起的樣本統(tǒng)計(jì)量與總體參數(shù)間的差異來源:個體變異抽樣表現(xiàn)樣本統(tǒng)計(jì)量與總體參數(shù)間的差異樣本統(tǒng)計(jì)量間的差異6樣本均數(shù)的規(guī)律性隨機(jī)的在概率意義下是有規(guī)律的-抽樣分布

2、通過大量重復(fù)抽樣,借助頻數(shù)表描述樣本均數(shù)的變異規(guī)律(抽樣分布)與個體觀察值變異規(guī)律有關(guān)即使只有一個樣本資料,也可由樣本資料的個體觀察值的變異規(guī)律間接得到樣本均數(shù)的變異規(guī)律抽樣分布7正態(tài)總體樣本均數(shù)的分布已知某地高三男生的平均身高為 ,標(biāo)準(zhǔn)差為 ,將其視為一個總體。從該總體中隨機(jī)抽樣樣本含量為n每次抽取10000個樣本并計(jì)算各自的樣本均數(shù)以10000個樣本均數(shù)作為一個新的樣本制作頻數(shù)圖8抽樣1樣本含量n=4 的平均數(shù) =168.19 的標(biāo)準(zhǔn)差 =2.9670 9抽樣2樣本含量 n=16 的平均數(shù) =168.158 的標(biāo)準(zhǔn)差 =1.4884 10抽樣3樣本含量 n=36 的平均數(shù) =168.149

3、3 的標(biāo)準(zhǔn)差 =0.9997 11從正態(tài)分布的總體中隨機(jī)抽取樣本含量為n的樣本X1，X2，Xn，其樣本均數(shù) 服從正態(tài)分布，總體均數(shù)為；樣本均數(shù)的總體標(biāo)準(zhǔn)差若，則其中任意一個隨機(jī)樣本Xn的均數(shù)正態(tài)總體樣本均數(shù)的分布12樣本均數(shù)的標(biāo)準(zhǔn)差，稱為樣本均數(shù)的標(biāo)準(zhǔn)誤(standard error of mean ,SE)，簡稱均數(shù)標(biāo)準(zhǔn)誤它反映樣本均數(shù)之間的離散程度，也反映樣本均數(shù)抽樣誤差的大小。誤差大小，實(shí)質(zhì)是要估計(jì) 的分布特征正態(tài)總體樣本均數(shù)的分布13由于實(shí)際往往未知，需要用樣本來估計(jì) ，樣本均數(shù)標(biāo)準(zhǔn)誤的估計(jì)式為注意區(qū)別：證明：正態(tài)總體樣本均數(shù)的分布14非正態(tài)總體樣本均數(shù)的分布從總體均數(shù)

4、為1的指數(shù)分布中抽樣，樣本大小分別為4，9，100。每次抽10000個樣本制作頻數(shù)分布圖151617抽樣1樣本含量n=4 的平均數(shù) =1.0133 的標(biāo)準(zhǔn)差 =0.5031 的中位數(shù) =0. 929818抽樣2樣本含量n=9 的平均數(shù) =0.9959 的標(biāo)準(zhǔn)差 =0. 3332 的中位數(shù) =0.957419抽樣3樣本含量n=100 的平均數(shù) =0.9993 的標(biāo)準(zhǔn)差 =0.1001 的中位數(shù) =0.995820從非正態(tài)指數(shù)分布總體中隨機(jī)抽樣所得樣本均數(shù) ：在樣本含量較小時(shí)呈偏態(tài)（非指數(shù)型）樣本含量較大時(shí)接近正態(tài)分布均數(shù) 始終在總體均數(shù) 附近均數(shù) 的標(biāo)準(zhǔn)差非正態(tài)總體樣本均數(shù)的分布21中心極限定理

5、及其應(yīng)用樣本均數(shù) 總體標(biāo)準(zhǔn)差是個體資料X的總體標(biāo)準(zhǔn)差的；即理論標(biāo)準(zhǔn)誤理論標(biāo)準(zhǔn)誤的樣本估計(jì)值為樣本均數(shù) 與個體資料X的集中位置相同，即樣本均數(shù) 的總體均數(shù)與個體資料X的總體均數(shù) 相同22中心極限定理及其應(yīng)用若個體資料X服從正態(tài)總體，則樣本均數(shù) 也服從正態(tài)分布；個體資料X服從偏態(tài)分布，當(dāng)樣本量n較大時(shí)，樣本均數(shù) 近似服從正態(tài)分布23例3.3 已知在某地7歲正常發(fā)育男孩的身高服從正態(tài)分布N(121,52)正常發(fā)育7歲男孩身高的95%范圍為 (111.2，130.8)若在該地正常7歲男孩中隨機(jī)抽一個樣本，樣本含量為100，則樣本均數(shù)的95范圍為 =(120.2，121.98)， 24 t分布

6、 , 標(biāo)準(zhǔn)正態(tài)分布與t統(tǒng)計(jì)量實(shí)際研究中未知，用樣本的標(biāo)準(zhǔn)差S作為的一個近似值(估計(jì)值)代替，得到變換后的統(tǒng)計(jì)量并記為 25如在正態(tài)總體N(168.18,62)中隨機(jī)抽樣，樣本量分別取n =5，n =100，均抽10000個樣本，分別計(jì)算t值和U值并作相應(yīng)t的頻數(shù)圖 t分布26 t分布樣本含量n=5樣本含量n=100 t統(tǒng)計(jì)量的頻數(shù)圖 27結(jié)果小樣本時(shí)，t統(tǒng)計(jì)量和U統(tǒng)計(jì)量的分布有明顯差別大樣本時(shí)，t統(tǒng)計(jì)量和U統(tǒng)計(jì)量的分布非常接近。頻數(shù)圖當(dāng)樣本量較大時(shí)，統(tǒng)計(jì)量t的頻數(shù)圖與標(biāo)準(zhǔn)正態(tài)分布曲線非常接近樣本含量較小時(shí)，t統(tǒng)計(jì)量的峰值比標(biāo)準(zhǔn)正態(tài)分布的峰值略小，雙側(cè)尾部的值則較標(biāo)準(zhǔn)正態(tài)分布略大 t分布28英

7、國統(tǒng)計(jì)學(xué)家W. S. Gosset(1908)設(shè) 并給出了統(tǒng)計(jì)量t的分布規(guī)律，并稱統(tǒng)計(jì)量t的分布規(guī)律為t分布，自由度為v，記為t(v)分布。每個自由度v對應(yīng)一個分布，因此t分布是一簇分布 t分布僅與總體均數(shù)有關(guān)，與總體標(biāo)準(zhǔn)差無關(guān) t分布29三條t分布密度曲線 t分布v=1v=5v=30t分布的圖形特征分布特征 t分布曲線是單峰的關(guān)于t = 0對稱自由度越大，t值越小 t分布與正態(tài)分布的關(guān)系自由度v較小時(shí)，t分布與標(biāo)準(zhǔn)正態(tài)分布相差較大，并且t分布曲線的尾部面積大于標(biāo)準(zhǔn)正態(tài)分布曲線的尾部面積當(dāng)自由度時(shí)，t分布逼近于標(biāo)準(zhǔn)正態(tài)分布。31t分布的界值給定自由度v，t分布曲線的雙側(cè)尾部面積為時(shí)對應(yīng)

8、的t值，記為并稱為t的雙側(cè)界值單側(cè)界值：一側(cè)尾部面積為時(shí)對應(yīng)的t值對稱性得：單側(cè)曲線下面積=2雙側(cè)曲線下面積同樣的尾部面積，t分布的界值要大于標(biāo)準(zhǔn)正態(tài)分布的界值 32 t分布界值示意圖，表示陰影的面積 33樣本率的分布總體率由樣本率估計(jì)例如，設(shè)樣本的個體數(shù)(即樣本含量)為n，若x為樣本的某指標(biāo)陽性個體數(shù)，則可用樣本陽性率估計(jì)研究人群的陽性率 (總體陽性率)；由于個體差異和偶然性的影響，樣本率也存在抽樣誤差-由抽樣造成樣本率與總體率(研究人群的率)的差異樣本率是隨機(jī)的，但在概率意義下也是有規(guī)律的-樣本率的分布。34隨機(jī)抽樣試驗(yàn)，分別在總體率=0.4，0.5，0.01的總體中隨機(jī)抽樣

9、，其總體率和樣本含量n每種情況分別隨機(jī)抽10000個樣本，每個樣本計(jì)算其樣本率，把同一種情況的10000個樣本率視為一個新的樣本資料作頻數(shù)圖樣本率的分布 35抽樣136抽樣137抽樣338抽樣439結(jié)果總體率相同時(shí)，樣本含量越大，樣本率的分布越趨向?qū)ΨQ。樣本含量n相同時(shí)，越偏離0.5，樣本率的分布越偏態(tài)分布?？傮w率0.5時(shí)，任意樣本含量的樣本率都呈對稱分布。樣本率p的樣本標(biāo)準(zhǔn)差。樣本率的分布 40中心極限定理及其推論若樣本中的個體個數(shù)(即樣本含量)為n，總體率為，樣本率為p，則樣本率的總體均數(shù)等于總體率樣本率的總體標(biāo)準(zhǔn)差(即率的標(biāo)準(zhǔn)誤) 由于總體率通常是未知的，因而用樣本率p來估計(jì)，故率的標(biāo)準(zhǔn)誤的估計(jì)值常表示為 41對于大量重復(fù)隨機(jī)抽樣而言，樣本率p圍繞著總體率波動樣本含量n越大，這種波動越小。當(dāng)n的值充分大時(shí)，p的分布就近似于均數(shù)為，標(biāo)準(zhǔn)差為的正態(tài)分布。這里樣本含量n “充分大”指、且n40。當(dāng)總體率0.5時(shí)，則樣本率p的分布為對稱分布當(dāng)樣本含量n為定值時(shí)，總體率越接近0.5，樣本率p近似正態(tài)分布的程度就越好中心極限定理及其推論42STATA命令模擬各種分布模擬正態(tài)分布的樣本均

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

復(fù)旦大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)課件08參數(shù)估計(jì)基礎(chǔ)：抽樣分布

文檔簡介

溫馨提示

最新文檔

評論

復(fù)旦大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)課件08參數(shù)估計(jì)基礎(chǔ)：抽樣分布

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔