第7章 抽樣推斷_第1頁
第7章 抽樣推斷_第2頁
第7章 抽樣推斷_第3頁
第7章 抽樣推斷_第4頁
第7章 抽樣推斷_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第五章抽樣推斷學習目標理解抽樣推斷的特點、作用及基本概念掌握抽樣推斷的抽樣平均誤差、極限誤差的計算方法運用抽樣推斷的一般原理,對全及總體的指標值作出具有一定概率保證程度的推斷正確進行相應的假設(shè)檢驗。第一節(jié)抽樣推斷概述抽樣推斷概述抽樣推斷的概念抽樣即抽樣調(diào)查,是指在總體中選取部分單位組成樣本并收集樣本單位的數(shù)據(jù)資料的過程。抽樣推斷是在抽樣調(diào)查的基礎(chǔ)上,利用樣本數(shù)據(jù)計算樣本統(tǒng)計量,以樣本特征值對總體參數(shù)做出具有一定可靠程度的估計和判斷。統(tǒng)計推斷全及總體指標:參數(shù)(未知量)樣本總體指標:統(tǒng)計量(已知量)抽樣推斷是由部分推斷整體的一種認識方法抽樣推斷建立在隨機取樣的基礎(chǔ)上抽樣推斷運用的是不確定的概率估計方法抽樣推斷的誤差可以事先計算并加以控制抽樣推斷的特征可用于對無法進行全面調(diào)查的總體數(shù)量特征的推斷可用于某些不必要進行全面調(diào)查的總體數(shù)量特征的推斷可用于對全面調(diào)查的資料進行評價和修正可用于生產(chǎn)過程的質(zhì)量控制抽樣推斷的作用全及總體與樣本概率抽樣與非概率抽樣重復抽樣和不重復抽樣抽樣框總體參數(shù)和樣本統(tǒng)計量抽樣誤差抽樣推斷中的基本概念

按照一定的抽樣方法和組織方式,從總體N中抽取n個單位構(gòu)成樣本,一共可以抽出的不同樣本的數(shù)量,一般用M表示.樣本可能數(shù)目考慮順序的不重復抽樣考慮順序的重復抽樣不考慮順序的不重復抽樣不考慮順序的重復抽樣樣本指標與總體指標之差,即抽樣估計值與被估計的未知的真實總體參數(shù)之差。抽樣誤差通過合理的組織和調(diào)整抽樣方式可消除不可消除,但可以進行計算加以控制抽樣誤差抽樣推斷中的誤差登記性誤差代表性誤差系統(tǒng)性代表性誤差偶然性代表性誤差樣本容量的大小容量大抽樣誤差小總體的變異程度變異大抽樣誤差大抽樣方法和抽樣組織方式不同的方式方法產(chǎn)生的抽樣誤差大小也不一樣抽樣誤差的影響因素第二節(jié)抽樣分布

從一個總體中隨機抽取容量相等的樣本,根據(jù)樣本資料計算某一統(tǒng)計量所有可能的概率分布,稱為這個統(tǒng)計量的抽樣分布(samplingdistribution)。簡言之,抽樣分布就是樣本統(tǒng)計量的概率分布。抽樣分布的概念抽樣分布的種類1、正態(tài)分布抽樣分布的種類2、分布3、分布抽樣分布的種類4、分布統(tǒng)計推斷的理論基礎(chǔ)統(tǒng)計推斷的理論基礎(chǔ)—大數(shù)定律如果變量總體存在著有限的平均數(shù)和方差,則對于充分大的抽樣單位數(shù),可以幾乎為1的概率來期望,樣本平均數(shù)和總體平均數(shù)的絕對離差任意?。ǘ邘缀跸嗟龋?。全部可能樣本平均數(shù)的均值等于總體均值,即:從非正態(tài)總體中抽取的樣本平均數(shù)當n足夠大時其分布接近正態(tài)分布。從正態(tài)總體中抽取的樣本平均數(shù)不論容量大小其分布均為正態(tài)分布。樣本均值的標準差為總體標準差的。抽樣分布定理——中心極限定理我們可以利用標準正態(tài)分布函數(shù)來計算任何一個樣本平均值落入某一區(qū)間的概率,及估計樣本的概率分布。抽樣誤差是樣本統(tǒng)計量與總體參數(shù)之間的絕對差異抽樣誤差是一個隨樣本不同而不同的隨機變量。因為總體指標未知,對于任何一個樣本,其抽樣誤差都不可能測量出來抽樣平均誤差抽樣平均誤差即全部可能樣本的樣本平均值或樣本成數(shù)計算的標準差。又稱抽樣標準誤差、抽樣標準誤也就是樣本的均值與總體均值離差的平均數(shù)樣本均值的抽樣分布抽樣平均誤差計算公式總體方差若總體方差

2未知:用樣本方差S2

代替用歷史資料代替總體方差已知總體方差未知用樣本方差代替總體的總體方差已知、未知時,樣本均值的抽樣分布在抽樣推斷中,在一定概率保證下,允許樣本統(tǒng)計量偏離總體統(tǒng)計量的最大幅度。(可允許的誤差范圍)

從實際抽樣角度來看,抽樣極限誤差就是實際樣本指標與總體指標之間存在抽樣誤差的可能范圍.抽樣極限誤差樣本統(tǒng)計量的抽樣分布總體中心值N(總體中心值,)抽樣極限誤差和樣本均值一起構(gòu)造總體指標的區(qū)間估計抽樣極限誤差和樣本均值一起構(gòu)造總體指標的區(qū)間估計抽樣極限誤差第三節(jié)抽樣估計的基本方法

抽樣估計是用樣本統(tǒng)計量去估計總體參數(shù),如用樣本均值估計總體均值,或用樣本成數(shù)估計總體成數(shù)等。抽樣估計通常有兩種方法點估計區(qū)間估計參數(shù)估計——用得到的樣本指標來推斷總體指標。三要素——估計值、估計的誤差范圍、概率保證程度抽樣估計的基本方法:點估計同時給出極限誤差和概率保證程度。1、矩估計法2、順序統(tǒng)計量法3、極大似然法設(shè)為待估計的總體參數(shù),為樣本統(tǒng)計量,則的優(yōu)良標準為:2若,則稱為比更有效的估計量(有效性)1若,則稱為的無偏估計量(無偏性)3若越大越小,則稱為的一致估計量(一致性)抽樣推斷的優(yōu)良標準學生ABCDEFG成績30405060708090按隨機原則抽選出4名學生,并計算平均分數(shù)和中位分數(shù)。樣本均值4547.55052.55557.560出現(xiàn)次數(shù)1123445樣本均值62.56567.57072.575出現(xiàn)次數(shù)443211樣本中位數(shù)45505560657075出現(xiàn)次數(shù)4385834抽樣推斷的優(yōu)良標準——有效性中位數(shù)的抽樣分布平均數(shù)的抽樣分布抽樣推斷的優(yōu)良標準——有效性有偏無偏抽樣推斷的優(yōu)良標準——無偏性學生ABCDEFG成績30405060708090按隨機原則抽選出5名學生,并計算平均分數(shù)。n=4時的抽樣分布n=5時的抽樣分布抽樣推斷的優(yōu)良標準——一致性為的無偏、有效、一致估計量;為的無偏、有效、一致估計量;為的無偏、有效、一致估計量。抽樣推斷的優(yōu)良標準以樣本統(tǒng)計量為中心,以抽樣平均誤差為距離單位,可以構(gòu)造一個區(qū)間,并可以一定的概率保證待估計的總體參數(shù)落在這個區(qū)間之中。區(qū)間越大,則概率保證程度越高。區(qū)間估計同時給出概率保證程度總體指標進行推斷需要三個要素,且三者密切相連。已知可靠性要求,其他量需要計算。已知極限誤差,其他量需要計算。計算樣本統(tǒng)計量計算抽樣平均誤差計算抽樣極限誤差確定置信區(qū)間計算樣本統(tǒng)計量計算抽樣平均誤差計算t,查可靠程度確定置信區(qū)間由532名《商業(yè)周刊》訂閱者組成的樣本表明,其每周使用因特網(wǎng)的平均時間為6.7小時。如果總體標準差為5.8小時,求該周刊訂閱者總體每周平均花費在因特網(wǎng)上時間的95%置信區(qū)間。則:該置信區(qū)間為:已知可靠性要求已知可靠性要求某證券市場由10只股票組成的一個樣本其市盈率分別為:

5791014232015326試求該市場全部股票總體市盈率均值的95%置信區(qū)間。查表總體均值95%置信區(qū)間為:即:已知可靠性要求某校一個由413名大學生組成的樣本中,277名學生沒有宗教信仰。試估計該校學生總體中無宗教信仰比率的95%置信區(qū)間。于是:總體比率估計區(qū)間為:所謂抽樣推斷的可靠程度,就是指總體指標和樣本指標之間的誤差不超過一定范圍的概率保證程度,或者說是總體指標落入?yún)^(qū)間或的概率保證程度.抽樣推斷的可靠程度估計區(qū)間是一定可靠程度下的估計區(qū)間,可靠程度是一定估計精度(誤差范圍)下的可靠程度.樣本統(tǒng)計量的抽樣分布總體中心值N(總體中心值,)抽樣極限誤差可以以抽樣平均誤差為標準單位來衡量.

抽樣推斷可靠程度的計算t——稱為概率度。又稱為置信度。抽樣推斷可靠程度的計算總體中心值0.68270.95450.9973

從總體中抽取一個樣本,該樣本的指標落入?yún)^(qū)間的概率可用占曲線面積的比例表示.抽樣推斷可靠程度的計算樣本統(tǒng)計量的抽樣分布N(總體中心值,)樣本容量調(diào)查誤差調(diào)查費用小樣本容量節(jié)省費用但調(diào)查誤差大大樣本容量調(diào)查精度高但費用較大找出在規(guī)定誤差范圍內(nèi)的最小樣本容量找出在限定費用范圍內(nèi)的最大樣本容量抽樣推斷的樣本容量第三節(jié)必要樣本容量的確定樣本容量大小影響抽樣估計的精確度樣本容量大小影響抽樣調(diào)查的成本和效益確定樣本容量的必要性被調(diào)查現(xiàn)象的變異程度抽樣允許誤差抽樣的概率保證程度抽樣方法抽樣組織方式樣本容量的影響因素

若未知。一般按以下方法確定其估計值:以前類似樣本的

試驗調(diào)查樣本的S計算結(jié)果通常向上進位抽樣推斷樣本容量的計算重復抽樣例:某地碩士研究生畢業(yè)第一年年薪的標準差大約為2000元人民幣。如果以95%的置信度估計其平均年薪,并且希望抽樣極限誤差分別不超過500元和100元,樣本容量應為多少?抽樣推斷樣本容量的計算不重復抽樣抽樣推斷樣本容量的計算

P或p必須事先知道,但通常未知。一般按以下方法確定其估計值:a以前類似樣本的p;b試驗調(diào)查樣本的p

;計算結(jié)果通常向上進位抽樣推斷樣本容量的計算重復抽樣某網(wǎng)站一個由400名使用者組成的樣本表明,該網(wǎng)站的使用者中26%的使用者為女性。在95%的置信度下,若希望將抽樣極限誤差控制在3%,則樣本容量應當為:抽樣推斷樣本容量的計算重復抽樣抽樣推斷樣本容量的計算不重復抽樣第四節(jié)抽樣的組織方式簡單隨機抽樣類型抽樣等距抽樣整群抽樣多階段抽樣抽樣組織方式抽選樣本的方法滾球法抽簽法隨機數(shù)碼表法計算機模擬法純隨機抽樣純隨機抽樣也叫簡單隨機抽樣。它是按照隨機原則直接從總體N個單位中抽取n個單位作為樣本,然后通過對樣本單位的調(diào)查觀測,計算出樣本指標,據(jù)以對相應的總體指標作出推斷。重復抽樣:不重復抽樣:純隨機抽樣

設(shè)總體由N個單位構(gòu)成,把總體劃分為K層(組),使,然后從每類中隨機抽取個單位,構(gòu)成容量為n的樣本,使得分層抽樣可以提高樣本的代表性可以縮小總體變異程度對抽樣誤差的影響,只受組內(nèi)方差影響,不受組間方差影響.分層抽樣抽樣方法等比例類型抽樣不等比例抽樣先將總體各單位按某一標志排隊,然后按固定的順序和間隔來抽取調(diào)查單位的一種組織方式.等距抽樣從12個中抽取3個無關(guān)標志排隊的等距抽樣近似于簡單隨機抽樣,因此,可以按簡單隨機抽樣的方法計算抽樣誤差。有關(guān)標志排隊的等距抽樣相當于等比例類型抽樣,因此可用等比例類型抽樣的公式計算抽樣誤差。并用不重復抽樣的公式。按有關(guān)標志排隊等距抽樣按無關(guān)標志排隊等距抽樣等距抽樣隨機起點等距抽樣確定抽樣距離(間隔)隨機抽取第一個單位依次抽取其他單位等距抽樣中點等距抽樣確定抽樣距離(間隔)隨機抽取第一個單位依次抽取其他單位等距抽樣隨機性差,各單位中選機會不等;只能抽取一個樣本,抽樣框利用率低.對稱等距抽樣確定抽

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論