版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
優(yōu)選第節(jié)均數(shù)的抽樣誤差和總體均數(shù)估計臨本當前1頁,總共57頁??傮w樣本隨機抽取部分觀察單位
μ?
推斷inference參數(shù)估計當前2頁,總共57頁。一、均數(shù)的抽樣誤差與標準誤當前3頁,總共57頁。2009年某市18歲男生身高N(167.7,5.32)的抽樣示意圖
當前4頁,總共57頁。
將此100個樣本均數(shù)看成新變量值,則這100個樣本均數(shù)構(gòu)成一新分布,繪制頻數(shù)圖從正態(tài)分布總體N(167.7,5.32)隨機抽樣所得樣本均數(shù)分布當前5頁,總共57頁。①
,各樣本均數(shù)未必等于總體均數(shù);②
各樣本均數(shù)間存在差異;③
樣本均數(shù)的分布為中間多,兩邊少,左右基本對稱。
④樣本均數(shù)的變異范圍較之原變量的變異范圍大大縮小??伤愕眠@100個樣本均數(shù)的均數(shù)為167.69cm、標準差為1.69cm。
樣本均數(shù)分布具有如下特點:當前6頁,總共57頁。從正態(tài)分布總體中以固定n抽樣時,樣本均數(shù)的分布仍服從正態(tài)分布。
當樣本含量n足夠大時,即使從偏態(tài)分布總體中以固定n抽樣,其樣本均數(shù)的分布也近似服從正態(tài)分布。7理論上可以證明,當前7頁,總共57頁。抽樣誤差:
由個體變異產(chǎn)生的、抽樣造成的樣本統(tǒng)計量與總體參數(shù)的差別原因:1)抽樣
2)個體差異當前8頁,總共57頁。由于變異的存在,抽樣研究所造成的樣本均數(shù)與總體均數(shù)的差異,以及各樣本均數(shù)間的差異稱為均數(shù)的抽樣誤差。抽樣誤差在抽樣研究中是不可避免的,但只要嚴格遵循隨機化抽樣的原則,就能估計抽樣誤差的大小。1.均數(shù)的抽樣誤差的概念當前9頁,總共57頁。表示樣本統(tǒng)計量抽樣誤差大小的統(tǒng)計指標。標準誤:說明抽樣誤差的大小,總體計算公式2、標準誤(standarderror,SE)實質(zhì):樣本均數(shù)的標準差當前10頁,總共57頁。若用樣本標準差s
來估計,
(7-28)當樣本例數(shù)n一定時,標準誤與標準差呈正比當標準差一定時,標準誤與樣本含量n的平方根呈反比。通過增加樣本含量n來降低抽樣誤差。當前11頁,總共57頁。抽樣調(diào)查150名3歲女孩的身高均數(shù)為92.79cm,標準差為4.61cm,則其標準誤是多少?例子:當前12頁,總共57頁。1、反映樣本均數(shù)的可靠性;2、估計總體均數(shù)的置信區(qū)間;3、用于均數(shù)的假設(shè)檢驗。標準誤的應(yīng)用:當前13頁,總共57頁。指標意義應(yīng)用標準差(s)衡量變量值變異程度,s越大表示變量值變異程度越大,s越小表示變量值變異程度越小描述正態(tài)分布(近似正態(tài)分布)資料的頻數(shù)分布;醫(yī)學參考值范圍的估計標準誤()樣本均數(shù)的變異程度,表示抽樣誤差的大小。標準誤越大表示抽樣誤差越大,樣本均數(shù)的可靠性越小;標準誤越小表示抽樣誤差越小,樣本均數(shù)的可靠性越大總體均數(shù)區(qū)間估計;兩個或多個總體均數(shù)間比較的假設(shè)檢驗標準差和標準誤的區(qū)別當前14頁,總共57頁。15當前15頁,總共57頁。二、t分布(一)t分布概念當前16頁,總共57頁。隨機變量XN(m,s2)標準正態(tài)分布N(0,12)z變換當前17頁,總共57頁。當前18頁,總共57頁。
式中為自由度(degreeoffreedom,df)
3.實際工作中,由于未知,用代替,則不再服從標準正態(tài)分布,而服從t分布。
當前19頁,總共57頁。均數(shù)標準正態(tài)分布N(0,12)Studentt分布自由度:n-1當前20頁,總共57頁。0t分布一簇曲線0N(0,1)n足夠大時,(1)(2)(3)以固定n隨機抽樣21英國統(tǒng)計學家Gosset當前21頁,總共57頁。(二)t分布的圖形與特征
分布只有一個參數(shù),即自由度當前22頁,總共57頁。
圖不同自由度下的t分布圖當前23頁,總共57頁。t分布與標準正態(tài)分布24當前24頁,總共57頁。25當前25頁,總共57頁。1.特征:
當前26頁,總共57頁。2、t界值表:詳見P312,可反映t分布曲線下的面積。單側(cè)概率或單尾概率:用
表示;雙側(cè)概率或雙尾概率:用表示。
當前27頁,總共57頁。-tt0當前28頁,總共57頁。
由t界值表可知:
★相同自由度時,︱t︱越大,概率P越小。
★相同t值時,雙側(cè)概率是單側(cè)概率的兩倍。★ν=∞時,t分布即為Z分布,故t界值表中最后一行是Z界值。當前29頁,總共57頁。t分布的分位數(shù)(雙側(cè)t界值)/2/21-t/2,-t/2,30當前30頁,總共57頁。1-t,t分布的分位數(shù)(單側(cè)t界值)31當前31頁,總共57頁。舉例:
當前32頁,總共57頁。三、總體均數(shù)的置信區(qū)間估計用樣本統(tǒng)計量推斷總體參數(shù)??傮w均數(shù)估計:用樣本均數(shù)推斷總體均數(shù)。當前33頁,總共57頁。點估計(pointestimation):用相應(yīng)樣本統(tǒng)計量直接作為其總體參數(shù)的估計值。如用
估計μ、s估計
等。其方法雖簡單,但未考慮抽樣誤差的大小。當前34頁,總共57頁。
按預先給定的概率(1)所確定的包含未知總體參數(shù)的一個范圍。總體均數(shù)的區(qū)間估計:按預先給定的概率(1)所確定的包含未知總體均數(shù)的一個范圍。
如給定=0.05,該范圍稱為參數(shù)的95%可信區(qū)間或置信區(qū)間;如給定=0.01,該范圍稱為參數(shù)的99%可信區(qū)間或置信區(qū)間。2.區(qū)間估計(intervalestimation):當前35頁,總共57頁。計算總體均數(shù)可信區(qū)間需考慮:(1)總體標準差是否已知,(2)樣本含量n的大小通常有兩類方法:(1)t分布法
(2)z分布法當前36頁,總共57頁。1.當未知且n較小時,由于服從t分布,可按t分布原理估計總體均數(shù)的可信區(qū)間。由于即故總體均數(shù)(1-)100%的可信區(qū)間為37當前37頁,總共57頁。2、當未知但n足夠大時(n>100),t分布近似u分布,可以u界值代替t界值,估計總體均數(shù)的可信區(qū)間。3、當已知時,可按正態(tài)分布的原理,估計總體均數(shù)的可信區(qū)間。38當前38頁,總共57頁。例
某地抽取正常成年人200名,測得其血清膽固醇的均數(shù)為3.64mmol/L,標準差為1.20mmol/L,估計該地正常成年人血清膽固醇均數(shù)的95%可信區(qū)間。
故該地正常成年人血清膽固醇均數(shù)的95%可信區(qū)間為(3.47,3.81)mmolL。39當前39頁,總共57頁。四、置信區(qū)間的確切涵義40當前40頁,總共57頁。
1.95%的可信區(qū)間的理解:(1)我們所估計的可信區(qū)間有95%的可能包含所要估計的總體參數(shù)。(2)從正態(tài)總體中隨機抽取100個樣本,可算得100個樣本均數(shù)和標準差,也可算得100個均數(shù)的可信區(qū)間,平均約有95個可信區(qū)間包含了總體均數(shù)。(3)但在實際工作中,只能根據(jù)一次試驗結(jié)果估計可信區(qū)間,我們就認為該區(qū)間包含了總體均數(shù)。
41當前41頁,總共57頁。
2.可信區(qū)間的兩個要素(1)準確度:用可信度(1)表示:即區(qū)間包含總體均數(shù)的理論概率大小。當然它愈接近1愈好,如99%的可信區(qū)間比95%的可信區(qū)間要好。(2)精確度:反映在區(qū)間的寬度上。區(qū)間愈窄愈好,如95%的可信區(qū)間比99%的可信區(qū)間要好。42當前42頁,總共57頁。
當n確定時,上述兩者互相矛盾。提高準確度(可信度),則精確度降低(可信區(qū)間會變寬),勢必降低可信區(qū)間的實際應(yīng)用價值,故不能籠統(tǒng)認為99%可信區(qū)間比95%可信區(qū)間要好。相反,在實際應(yīng)用中,95%可信區(qū)間更為常用。在可信度確定的情況下,增加樣本含量可減小區(qū)間寬度,提高精確度。43當前43頁,總共57頁。44當前44頁,總共57頁。一、假設(shè)檢驗的基本原理第四節(jié)t檢驗當前45頁,總共57頁?!?/p>
假設(shè)檢驗的基本原理反證法:當一件事情的發(fā)生只有兩種可能A和B,為了肯定一種情況A,但又不能直接證實A,這時否定另一種可能B,則間接肯定了A。概率論(小概率):如果一件事情發(fā)生的概率很小,那么在一次試驗時,我們說這個事件是”不會發(fā)生的”。從一般的常識可知,這句話在大多數(shù)情況下是正確的,但有犯錯誤的時候,因為概率小也是有可能發(fā)生的。當前46頁,總共57頁。■
假設(shè)檢驗的基本原理假設(shè)檢驗是利用小概率反證法思想,從問題的對立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立。然后在H0成立的條件下計算檢驗統(tǒng)計量,最后獲得P值來判斷。問題實質(zhì)上都是希望通過樣本統(tǒng)計量與總體參數(shù)的差別,或兩個樣本統(tǒng)計量的差別,來推斷總體參數(shù)是否不同。這種識別的過程,就是本章介紹的假設(shè)檢驗(hypothesistest)。
當前47頁,總共57頁。
例15.13根據(jù)大量調(diào)查,已知一般健康成年男子的脈搏均數(shù)為72次/min。某醫(yī)生在某山區(qū)隨機抽查100名健康成年男子,求得其脈搏均數(shù)為76.2次/min,標準差為4.0次/min,能否認為該山區(qū)的健康成年男子脈搏均數(shù)高于一般健康成年男子的脈搏均數(shù)?當前48頁,總共57頁。
0=72次/min
山區(qū)健康成年男子一般健康成年男子當前49頁,總共57頁。假設(shè)檢驗的基本思想
據(jù)專業(yè)知識,有兩種可能:=0或≠0
直接證明是哪種結(jié)果都很困難,利用反證法。假設(shè)=0,然后借助一定的分布,觀察實測樣本情況是否屬于小概率事件。
如果實測樣本情況屬于小概率事件,則認為原先的假設(shè)是錯的,拒絕這個假設(shè);
如果實測樣本情況不屬于小概率事件,則不拒絕原來的假設(shè)。當前50頁,總共57頁。假設(shè)檢驗的一般步驟(一)建立檢驗假設(shè)(hypothesisundertest),確定檢驗水準無效假設(shè)或零假設(shè)(nullhypothesis)H0:=0假定總體參數(shù)相同備擇假設(shè)或?qū)α⒓僭O(shè)(alternativehypothesis)H1:≠0或
>0(<0)
假定總體參數(shù)不相同,即差別不是由于抽樣誤差所致。當前51頁,總共57頁。注意:假設(shè)針對的是總體;H0和
H1是互斥的;單側(cè)、雙側(cè)的選擇。當前52頁,總共57頁。
樣本均數(shù)所代表的未知總體均數(shù)與已知總體均數(shù)0的比較
目的H0H1雙側(cè)檢驗是否≠0
=0≠0單側(cè)檢驗是否>0
=0
>0
是否<0
=0<0
當前53頁,總共57頁。檢驗水準(sizeoftest)也稱顯著性水準(significanceleve
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)員工轉(zhuǎn)正述職報告8篇
- 學習自我鑒定范文集合十篇
- 醫(yī)生年終工作總結(jié)7篇
- 某國際機場線工程施工組織設(shè)計
- 2025年部編版新教材語文一年級下冊第五單元教案
- 七年級語文的教學工作個人總結(jié)范文(33篇)
- 人教版2022年三年級語文期末復習-作文訓練(童話)B卷
- 2025年合成材料阻燃劑項目合作計劃書
- 攤位租賃協(xié)議書
- 2025年城市市容管理服務(wù)項目發(fā)展計劃
- 歷代反腐完整
- 《現(xiàn)代控制理論》(劉豹-唐萬生)
- 廣東省佛山市南海區(qū)三水區(qū)2022-2023學年七年級上學期期末歷史試題(無答案)
- 譯林版小學英語六年級上冊英文作文范文
- 淺談“五育并舉”背景下中小學勞動教育的探索與研究 論文
- 大樹的故事 單元作業(yè)設(shè)計
- 新加坡雙語教育政策發(fā)展研究
- (全國通用版)小學英語四大時態(tài)綜合練習(含答案)
- 走近翻譯學習通超星課后章節(jié)答案期末考試題庫2023年
- 互聯(lián)網(wǎng)體檢對話版
- 西方憲政民主主義思潮34張課件
評論
0/150
提交評論