




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
抽樣與統(tǒng)計(jì)推論第一頁(yè),共五十五頁(yè),編輯于2023年,星期六
一、抽樣調(diào)查簡(jiǎn)介第二頁(yè),共五十五頁(yè),編輯于2023年,星期六抽樣與抽樣調(diào)查抽樣調(diào)查:從研究對(duì)象的整體中選出一部分代表加以調(diào)查研究,然后用所得的結(jié)果推論和說(shuō)明總體的特征。從總體中選出一部分的過(guò)程就是抽樣,選出的代表就是樣本。第三頁(yè),共五十五頁(yè),編輯于2023年,星期六抽樣調(diào)查的歷史始于1891年挪威的人口調(diào)查社會(huì)學(xué)最早運(yùn)用抽樣調(diào)查:A.L.Bowleg對(duì)英國(guó)和威爾士的五城鎮(zhèn)調(diào)查二戰(zhàn)后,日益成為主流的調(diào)查方法第四頁(yè),共五十五頁(yè),編輯于2023年,星期六抽樣調(diào)查的優(yōu)越性調(diào)查費(fèi)用較低速度快應(yīng)用范圍廣可獲得內(nèi)容豐富的資料準(zhǔn)確度高第五頁(yè),共五十五頁(yè),編輯于2023年,星期六抽樣術(shù)語(yǔ)調(diào)查總體:從中實(shí)際抽取調(diào)查樣本的個(gè)體的集合體抽樣單位:一次直接的抽樣所使用的基本單位抽樣框:從中抽取樣本的抽樣單位的名單參數(shù)值:關(guān)于總體中某一變量的綜合描述統(tǒng)計(jì)值:關(guān)于樣本中某一變量的綜合描述抽樣誤差:用樣本的統(tǒng)計(jì)值去推算總體的參數(shù)值時(shí)發(fā)生的偏差,是樣本代表性的一個(gè)標(biāo)準(zhǔn)第六頁(yè),共五十五頁(yè),編輯于2023年,星期六抽樣的基本程序界定調(diào)查總體1936年《文學(xué)摘要》總統(tǒng)選舉民意測(cè)驗(yàn)編制抽樣框:將總體的各元素毫無(wú)遺漏地排列成表;概率抽樣的基本要求,決定著抽樣的質(zhì)量設(shè)計(jì)和抽取樣本評(píng)估樣本和估計(jì)總體第七頁(yè),共五十五頁(yè),編輯于2023年,星期六衡量樣本質(zhì)量的兩個(gè)標(biāo)準(zhǔn):準(zhǔn)確性——樣本沒(méi)有偏差(系統(tǒng)誤差)偏差的來(lái)源:1)抽樣程序的缺點(diǎn),即未能嚴(yán)格遵行隨機(jī)原則;2)無(wú)回答。精確性——抽樣誤差的大小。抽樣誤差:抽樣這種方法所固有的誤差,是隨機(jī)誤差第八頁(yè),共五十五頁(yè),編輯于2023年,星期六抽樣方法非概率抽樣偶遇抽樣判斷抽樣定額抽樣雪球抽樣概率抽樣簡(jiǎn)單隨機(jī)抽樣系統(tǒng)抽樣分層抽樣整群抽樣多段抽樣第九頁(yè),共五十五頁(yè),編輯于2023年,星期六1、非概率抽樣抽取調(diào)查單位的原則是根據(jù)主觀判斷或其它操作上的方便。基本方法:立意抽樣法、偶遇抽樣法、定額抽樣法。非概率抽樣的優(yōu)點(diǎn):成本低、花時(shí)短。缺點(diǎn):不能做統(tǒng)計(jì)推論第十頁(yè),共五十五頁(yè),編輯于2023年,星期六2、概率抽樣含義:總體中的每一個(gè)個(gè)體都有一個(gè)已知的不為零的被選機(jī)會(huì)進(jìn)入樣本。分為等概率抽樣和不等概率抽樣。優(yōu)點(diǎn):雖然無(wú)法完美地代表總體,但較其他抽樣方法更具代表性,能避免各種偏見(jiàn);能夠估計(jì)樣本的精確度及代表性第十一頁(yè),共五十五頁(yè),編輯于2023年,星期六二、抽樣的歷程(5個(gè)步驟):
1.界定總體。
2.搜集全部名單。3.決定樣本大小:必須同時(shí)考慮抽樣誤差和研究代價(jià)。4.設(shè)計(jì)抽樣方法5.評(píng)估樣本的正誤(即代表性)第十二頁(yè),共五十五頁(yè),編輯于2023年,星期六三、概率抽樣方法
1、簡(jiǎn)單隨機(jī)抽樣:按照隨機(jī)原則,直接從總體N個(gè)單位中,抽取幾個(gè)單位作為樣本,保證總體中每個(gè)單位在抽選時(shí)都有同等的機(jī)會(huì)被選中。分為:簡(jiǎn)單重復(fù)抽樣簡(jiǎn)單不重復(fù)抽樣第十三頁(yè),共五十五頁(yè),編輯于2023年,星期六2.等距抽樣(機(jī)械抽樣,系統(tǒng)抽樣)先將總體按某一因素排列,然后依固定的間隔,每間隔若干單位抽出一個(gè)單位。例如:總體單位為N,樣本容量為n,則樣本間隔為:k=N/n,抽樣時(shí),先隨機(jī)抽取一個(gè)單位,假定為a,然后從a單位開始,每間隔K單位都將是入選的單位。優(yōu)點(diǎn):簡(jiǎn)化了抽取過(guò)程缺點(diǎn):可能出現(xiàn)周期性偏差第十四頁(yè),共五十五頁(yè),編輯于2023年,星期六3.分層抽樣(類型抽樣、分類抽樣)分層抽樣:先將總體分類或分層,然后在各層中按隨機(jī)原則抽選一定單位構(gòu)成樣本。
分層(組)標(biāo)準(zhǔn)與研究目的相關(guān)性越強(qiáng)越好。(如生育觀念和教育水平)組與組之間差別大,組內(nèi)差距小。第十五頁(yè),共五十五頁(yè),編輯于2023年,星期六分層抽樣根據(jù)各層抽取比例是否相等,可分作分層定比抽樣和分層異比抽樣:
分層定比抽樣樣本中各層抽取的比例是相同的。例如總體單位N=20000,樣本容量n=500,則抽樣比例:
第十六頁(yè),共五十五頁(yè),編輯于2023年,星期六
設(shè)總體按老、中、青三代分層,于是根據(jù)總體中三代人的總?cè)藬?shù),就可確定三代人的抽樣人數(shù):
第十七頁(yè),共五十五頁(yè),編輯于2023年,星期六
分層異比抽樣
當(dāng)總體中某一層人數(shù)過(guò)少,但又具有較高的研究?jī)r(jià)值,這時(shí)可增大這一層的抽樣比例。但這樣做的結(jié)果,統(tǒng)計(jì)分析時(shí)要做適當(dāng)修正。第十八頁(yè),共五十五頁(yè),編輯于2023年,星期六4.整群抽樣(集體抽樣)
在整群抽樣中,總體被分為很多“群”,這些群是抽樣的單位。隨機(jī)抽取若干群,被選入樣本的群中的全部個(gè)案都進(jìn)入樣本。整群抽樣適用于群間差異小,而群內(nèi)差異大的總體,這點(diǎn)正好和分類抽樣相反。第十九頁(yè),共五十五頁(yè),編輯于2023年,星期六5.多段抽樣
先抽取若干集體,再?gòu)倪x取的集體中抽取若干較小的單位。如:第一步:從全國(guó)的省直轄市中抽取若干省和直轄市第二步:從入選的省和市中抽取縣級(jí)單位第三步:從縣級(jí)單位中抽出鄉(xiāng)和鎮(zhèn)第四步:從鄉(xiāng)和鎮(zhèn)中確定調(diào)查對(duì)象第二十頁(yè),共五十五頁(yè),編輯于2023年,星期六
概率與抽樣分布第二十一頁(yè),共五十五頁(yè),編輯于2023年,星期六機(jī)遇(可能性或機(jī)會(huì))與概率統(tǒng)計(jì)推論以概率論為基礎(chǔ):通過(guò)概率論,可以計(jì)算由樣本推論總體時(shí)犯錯(cuò)誤的大小?!叭绻矣挟?dāng)國(guó)王的機(jī)遇,那么我就有戴上皇冠的命?!保溈税祝└怕剩簷C(jī)遇的數(shù)學(xué)。即用數(shù)學(xué)來(lái)了解機(jī)遇現(xiàn)象的規(guī)律模式。第二十二頁(yè),共五十五頁(yè),編輯于2023年,星期六可能性有多大?1986年1月28日,挑戰(zhàn)者號(hào)航天飛機(jī)發(fā)射后不久爆炸??偨y(tǒng)特別委員會(huì)調(diào)查:這種發(fā)射失敗的機(jī)會(huì)有多大?管理部門:大概10萬(wàn)次才會(huì)發(fā)生一次。物理學(xué)家費(fèi)曼:“你們的意思是說(shuō),如果連續(xù)300年每天發(fā)射一次,你們預(yù)期只會(huì)失敗1次?”第二十三頁(yè),共五十五頁(yè),編輯于2023年,星期六概率的概念概率理論的基礎(chǔ):短期機(jī)遇現(xiàn)象無(wú)法預(yù)測(cè),但是長(zhǎng)期下來(lái),會(huì)呈現(xiàn)有規(guī)則且可預(yù)測(cè)的模式。擲硬幣:投擲的次數(shù)越多,正面向上的比例就會(huì)靠近0.5,而且會(huì)一直維持在0.5附近。0.5—正面出現(xiàn)的概率。第二十四頁(yè),共五十五頁(yè),編輯于2023年,星期六擲銅板的人第二十五頁(yè),共五十五頁(yè),編輯于2023年,星期六死亡的概率20-24歲的男性中,在任一年中會(huì)死的比率為0.0015,這是一個(gè)年輕男人明年會(huì)死的概率。對(duì)于同年齡層的女性,死亡概率大約是0.0005。如果一個(gè)保險(xiǎn)公司賣人壽保險(xiǎn)給20-24歲的年輕人,那么公司會(huì)知道,賣給男性的保險(xiǎn)明年大約有0.15%要理賠,女性有0.05%要理賠。因?yàn)槟行岳碣r比例要高一些,所以收費(fèi)要多一些。第二十六頁(yè),共五十五頁(yè),編輯于2023年,星期六抽樣分布的概念根據(jù)概率論的原則成立的理論性分布,顯示由同一總體反復(fù)不斷地抽取不同樣本時(shí),各個(gè)可能出現(xiàn)的樣本統(tǒng)計(jì)值的分布情況。均值抽樣分布二項(xiàng)抽樣分布第二十七頁(yè),共五十五頁(yè),編輯于2023年,星期六
(一)均值抽樣分布第二十八頁(yè),共五十五頁(yè),編輯于2023年,星期六例:設(shè)某村有5戶人家,以下是總體家庭人口的統(tǒng)計(jì)表
第二十九頁(yè),共五十五頁(yè),編輯于2023年,星期六圖1
1/5
45678第三十頁(yè),共五十五頁(yè),編輯于2023年,星期六第三十一頁(yè),共五十五頁(yè),編輯于2023年,星期六現(xiàn)從總體(N=5)中,作樣本容量n=2的簡(jiǎn)單隨機(jī)抽樣,它可能選出的樣本有55=25種,結(jié)果如表2
第三十二頁(yè),共五十五頁(yè),編輯于2023年,星期六經(jīng)過(guò)整理,得出樣本平均家庭人口數(shù)的抽樣分布如下(表3)
第三十三頁(yè),共五十五頁(yè),編輯于2023年,星期六平均家庭人口數(shù)的概率分布圖2
p
x45678第三十四頁(yè),共五十五頁(yè),編輯于2023年,星期六樣本均值的平均值仍等于總體平均值6
可見(jiàn),樣本的均值平均數(shù)=第三十五頁(yè),共五十五頁(yè),編輯于2023年,星期六
樣本均值的方差(所有可能出現(xiàn)樣本均值的方差)第三十六頁(yè),共五十五頁(yè),編輯于2023年,星期六樣本均值的抽樣分布:三個(gè)令人驚異的事實(shí)1、樣本均值的抽樣分布的均值等于總體均值;意義:利用樣本均值來(lái)推斷總體均值成為可能2、樣本均值的抽樣分布的標(biāo)準(zhǔn)差(SE)等于總體的標(biāo)準(zhǔn)差除以樣本規(guī)模的平方根;3、(1)如果從中隨機(jī)抽取樣本的總體服從正態(tài)分布,那么樣本均值的抽樣分布也會(huì)服從正態(tài)分布;(2)不管總體是不是正態(tài)分布,當(dāng)樣本規(guī)模越來(lái)越大時(shí),樣本均值的抽樣分布將越來(lái)越接近正態(tài)分布第三十七頁(yè),共五十五頁(yè),編輯于2023年,星期六中心極限定理:設(shè)有均值,方差2的分布總體,如隨機(jī)抽取所有可能容量為n的樣本,則樣本平均數(shù)的抽樣分布將隨著n的增大而漸漸接近于以下正態(tài)分布~N(,)n30為大樣本n<30為小樣本第三十八頁(yè),共五十五頁(yè),編輯于2023年,星期六正態(tài)曲線第三十九頁(yè),共五十五頁(yè),編輯于2023年,星期六正態(tài)曲線方程第四十頁(yè),共五十五頁(yè),編輯于2023年,星期六第四十一頁(yè),共五十五頁(yè),編輯于2023年,星期六標(biāo)準(zhǔn)正態(tài)分布含義:以標(biāo)準(zhǔn)差為單位的正態(tài)分布作用:將不同形態(tài)的正態(tài)分布簡(jiǎn)化為一種統(tǒng)計(jì)分布,簡(jiǎn)化統(tǒng)計(jì)分析第四十二頁(yè),共五十五頁(yè),編輯于2023年,星期六例1:假設(shè)某大學(xué)擁有手機(jī)的所有同學(xué)每月的話費(fèi)支出的均值為100元,標(biāo)準(zhǔn)差為30元,那么,如果從這些擁有手機(jī)的同學(xué)中隨機(jī)抽取100人,統(tǒng)計(jì)他們每月的平均話費(fèi)支出,那么:(1)其均值(即樣本均值)大于100元/月的概率是多少?(2)其均值分別在97-103元/月,94-106元/月和91-109元/月之間的概率分別是多少?(3)如果出現(xiàn)110元/月這樣的均值,你是否會(huì)感到驚訝,為什么?第四十三頁(yè),共五十五頁(yè),編輯于2023年,星期六
例2,某學(xué)院1000名學(xué)生,其平均身高是168cm,標(biāo)準(zhǔn)差為22.5cm,現(xiàn)從學(xué)生中隨機(jī)抽出100名,求其樣本平均數(shù)大于1.70m的概率。解=168cm=22.5,n=100X=170cm
p(x>170)=第四十四頁(yè),共五十五頁(yè),編輯于2023年,星期六(二)二項(xiàng)抽樣分布所研究的變量只有兩個(gè)值:是與否、高與低、男與女一個(gè)值出現(xiàn),稱為“成功”;另一個(gè)值出現(xiàn),稱為“失敗”。第四十五頁(yè),共五十五頁(yè),編輯于2023年,星期六二項(xiàng)抽樣分布(N=樣本大小r=成功數(shù))
第四十六頁(yè),共五十五頁(yè),編輯于2023年,星期六
1、當(dāng)P=Q=1/2時(shí)的二項(xiàng)分布是對(duì)稱的2、各個(gè)幾率是可以相加的例如:N=5時(shí),得到4個(gè)或5個(gè)成功的幾率是:P(4、5)=P(4)+P(5)=0.156+0.031=0.187得到兩個(gè)或以下是成功的幾率是:P(2)=P(0)+P(1)+P(2)=0.031+0.156+0.313=0.500一個(gè)也不成功的幾率是P(0)=0.031第四十七頁(yè),共五十五頁(yè),編輯于2023年,星期六例3:研究青年人是否同意只生一個(gè)孩子假設(shè):同意與反對(duì)的比例各占50%。從總體中隨機(jī)抽取五名青年(n=5),發(fā)現(xiàn)全部同意(r=5)。根據(jù)二項(xiàng)分布,獲得這個(gè)結(jié)果的可能性很?。╬=0.031)。所以假設(shè)可能不對(duì)。第四十八頁(yè),共五十五頁(yè),編輯于2023年,星期六上面介紹的二項(xiàng)分布是假定P=Q=1/2其實(shí),只要是P+Q=1,P與Q可以是任何數(shù)值:0不成功X(e)=1成功第四十九頁(yè),共五十五頁(yè),編輯于2023年,星期六第五十頁(yè),共五十五頁(yè),編輯于2023年,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 中外歌劇鑒賞知到課后答案智慧樹章節(jié)測(cè)試答案2025年春齊魯師范學(xué)院
- 海南大學(xué)《數(shù)字出版設(shè)計(jì)》2023-2024學(xué)年第一學(xué)期期末試卷
- 北京工商大學(xué)《基礎(chǔ)日語(yǔ)⑴》2023-2024學(xué)年第一學(xué)期期末試卷
- 遼寧省朝陽(yáng)市2025屆高三下學(xué)期診斷性考試物理試題含解析
- 華陰市2024-2025學(xué)年小升初數(shù)學(xué)模擬試卷含解析
- 2025屆河南省開封市重點(diǎn)中學(xué)高三考前熱身英語(yǔ)試題解析含解析
- 云南國(guó)土資源職業(yè)學(xué)院《大學(xué)英語(yǔ)Ⅲ(藝體類)》2023-2024學(xué)年第二學(xué)期期末試卷
- 古老的船屋文化江蘇無(wú)錫的世界文化遺產(chǎn)
- 智能農(nóng)業(yè)需求背景調(diào)研
- 2025年中考語(yǔ)文文言文總復(fù)習(xí):文言文閱讀之對(duì)比閱讀(講義)教師版
- 污水處理廠安全教育培訓(xùn)
- 護(hù)理工作血液透析操作規(guī)范
- Unit+6+The+Admirable+Lesson+2+History+makers 高一英語(yǔ)北師大版(2019)必修第二冊(cè)
- 設(shè)計(jì)變更流程圖
- 學(xué)校消防防火月檢查記錄表
- 外墻水包砂施工方案模板
- 無(wú)犯罪記錄證明申請(qǐng)表
- 聚酯生產(chǎn)技術(shù) 聚酯工藝技術(shù)
- 2023年四川省綿陽(yáng)市中考語(yǔ)文試卷真題(含答案)
- 新大象版三年級(jí)下冊(cè)科學(xué)第二單元《電與我們的生活》全部課件(共5課時(shí))
- 混床計(jì)算書(新)
評(píng)論
0/150
提交評(píng)論