




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第7章抽樣與抽樣分布統(tǒng)計圖表2統(tǒng)計圖表3統(tǒng)計圖表4統(tǒng)計圖表5統(tǒng)計圖表6統(tǒng)計圖表7統(tǒng)計圖表8劉濤個人百度指數近30天平均搜索指數達105098,同比上升240%,環(huán)比上升353%。王子文的人氣迅速躥升,百度指數近30天平均搜索指數為143401,同比增長大于1000%,環(huán)比增長大于1000%。喬欣詞條下近30天平均搜索指數為48263,環(huán)比增長大于1000%。因為角色關關的乖巧可人,就連“關關”都有其下詞條,近30天平均搜索指數為5590,環(huán)比上漲61%。歡樂頌統(tǒng)計圖表9統(tǒng)計圖表10抽樣調查研究了26個字母統(tǒng)計圖表11本章要點:第7章抽樣與抽樣分布簡單隨機抽樣方法點估計的基本方法樣本均值與樣本比例的抽樣分布*其他常見的抽樣方法簡介例:諾里斯電器公司的一項研究
諾里斯電器公司生產了一種能在各種電器上使用的高亮度燈泡,為了提高燈泡壽命,產品設計部門研發(fā)了一種新型燈絲,為了評估新燈絲的優(yōu)點,生產了200只利用新型燈絲制作的燈泡進行壽命試驗,得到樣本數據如右,試對所有用新型燈絲生產的燈泡使用壽命進行評估。
第7章抽樣與抽樣分布14引例:聯(lián)合電氣公司抽樣問題的案例
問題:
聯(lián)合電氣公司的人事部門經理要擬訂一份公司2500名經理的簡介。內容包括經理們的平均年薪和已完成公司培訓計劃的經理所占比例。
15
16事件:人事部門經理不想用全面調查而是抽樣的方法,從2500名經理中抽取30名來估計總體信息。分析:
以下內容將圍繞這一案例的分析、解決展開。統(tǒng)計推斷統(tǒng)計推斷過程1、總體是2500名管理人員信息的數據2、樣本是選中的30名管理人員的信息數據3、根據樣本數據計算出樣本平均年薪是51814(美元)4、根據樣本平均值對總體平均值進行估計.定義:根據樣本數據對總體進行估計并對總體參數的有關假定做出檢驗.推斷統(tǒng)計中有關概念總體(population):在一個特定研究中感興趣的對象全體所組成的集合,總體分:有限總體與無限總體樣本(sample):總體的一個子集抽樣(samplesurvey):收集一個樣本數據的過程被抽樣總體(statisticalinference):根據指理論上應抽樣的對象的全體抽樣框(frame):指事實上被抽樣的全體元素的集合統(tǒng)計圖表19幾個概念平均數標準差比例參數(唯一性)p統(tǒng)計量(隨機變量)x
sp
總體樣本統(tǒng)計應用:兩個例子
ThepurposeofStatisticsinferenceistoobtaininformationaboutapopulationfrominformationcontainedinsample.
例1:一汽車輪胎制造商生產一種被認為壽命更長新型輪胎。
例2:某黨派想支持某一候選人參選美國某州議員,為了決定是否支持該候選人,該黨派領導需要估計支持該候選人的民眾占全部登記投票人總數的比例。由于時間及財力的限制:120個樣本測試平均里程:36,500公里推斷新輪胎平均壽命:36,500公里400個樣本
支持人數:160推斷支持該候選人的選民占全部選民的比例:160/400=40%21統(tǒng)計推斷對樣本要求
要利用樣本的信息對總體特征做合理的推斷,樣本必須具有代表性.
調查:新華學院學生的就餐情況統(tǒng)計圖表22統(tǒng)計圖表23統(tǒng)計圖表2425簡單隨機抽樣
簡單隨機抽樣(Simplerandomsampling)是最常用的一種抽樣方法。它的定義和樣本抽取程序取決于總體是有限總體還是無限總體。
26一、有限總體抽樣(一)有限總體的含義可以列出或計數總體中所有元素(單位)的總體稱為有限總體。(二)簡單隨機樣本定義從容量為N的有限總體中進行抽樣,如果容量為n的每個可能樣本被抽到的機會相同,我們稱容量為n的樣本為簡單隨機樣本。27事件:人事部門經理不想用全面調查而是抽樣的方法,從2500名經理中抽取30名來估計總體信息。分析:
以下內容將圍繞這一案例的分析、解決展開。28(三)抽樣方法1.無放回抽樣(不重復抽樣)一個元素一旦選入樣本,就從總體中剔除,不能再次被選入。
[例]
在聯(lián)合電氣公司的問題中,用無放回抽樣方法抽取樣本。一、有限總體抽樣29分析:在此問題中,N=2500,n=30。用無放回抽樣方法抽取樣本的方法步驟如下:(1)抽樣的準備工作第一步:將2500名聯(lián)合電氣公司經理編號1,2,3,…,2499,2500。第二步:將每個號碼寫在大小相等的紙片上,并揉成均勻的球狀。第三步:每個紙球放入圓形容器中搖勻。
30(2)具體抽樣第一步:從2500個紙球中隨機抽取1個,做好編號記錄,然后將其放在一邊。第二步:從剩下的2499個紙球中再抽取另1個,做好記錄后再放在一邊。第三步:以此類推,直至抽夠30個為止。
由此就構成一個無放回抽樣的簡單隨機樣本。
312.放回抽樣(重復抽樣)一個元素一旦選入樣本,仍被放回總體中。先前被選入的元素可能再次被選,并且在樣本中可能出現(xiàn)多次(多于一次)。[例7.2]
在聯(lián)合電氣公司問題中,用放回抽樣方法抽取樣本。32分析:抽樣的準備工作同無放回抽樣。具體抽樣:第一步:從2500個紙球中隨機抽取第1個,做好編號記錄,然后將其放回總體參加下一次抽選。第二步:從2500個紙球中再隨機抽取第2個,做好編號記錄,然后將其放回總體參加下一次抽選。第三步:以此類推,直至抽夠30個為止。
33
最常用的抽樣方法是無放回抽樣(不重復抽樣)。以后,只要提到簡單隨機抽樣,就假定是無放回抽樣。
統(tǒng)計圖表34簡單隨機抽樣中的具體方法2.利用Excel函數抽取樣本利用函數randbetween(bottom,top)進行重復隨機抽樣3.利用Excel數據分析工具中的“抽樣”選項抽取樣本(重復)流程:工具----->數據分析---->抽樣---->抽樣選項,---->抽樣對話框---->輸入區(qū)域框中輸入總體單位編號或數字---->確定1.利用隨機數表抽取樣本4.利用SPSS可方便快捷地進行簡單隨機“抽樣”(不重復)37二、無限總體抽樣(一)無限總體的含義
在實際應用中,若總體單位數很多,要逐一編號是難以辦到的,特別是有些現(xiàn)象,事前也不可能編號(如一些連續(xù)大量正在生產的產品)因此我們定義:被研究的總體中所涉及某一正在進行的過程使得不可能列出總體中的所有元素,則可視為無限總體。38二、無限總體抽樣
(二)無限總體簡單隨機樣本定義
滿足下面條件的樣本稱為無限總體簡單隨機樣本:每個個體都來自同一個總體。每個個體被抽取是相互獨立的。
39
統(tǒng)計應用:兩個例子
ThepurposeofStatisticsinferenceistoobtaininformationaboutapopulationfrominformationcontainedinsample.
例1:一汽車輪胎制造商生產一種被認為壽命更長新型輪胎。
例2:某黨派想支持某一候選人參選美國某州議員,為了決定是否支持該候選人,該黨派領導需要估計支持該候選人的民眾占全部登記投票人總數的比例。由于時間及財力的限制:120個樣本測試平均里程:36,500公里推斷新輪胎平均壽命:36,500公里400個樣本
支持人數:160推斷支持該候選人的選民占全部選民的比例:160/400=40%常用的估計量有:(1)樣本平均數為總體平均數的估計量;(2)樣本方差為總體方差的估計量(3)樣本成數為總體成數p的估計量。三、點估計點估計就是用樣本估計量的一個具體觀測值直接作為總體的未知參數的估計值的方法。42
點估計例現(xiàn)在再回到聯(lián)合電氣公司的問題上來。假定已經抽取了一個由30名經理所組成的簡單隨機樣本,他們相應的年薪以及參加管理培訓計劃情況的數據如下表:43
點估計例44
點估計例將樣本結果與總體參數的真值作對比:總體參數參數值點估計量點估計值5180040000.605181433480.6345
抽樣分布
46
例:在一箱(5×50×200=50000支)卷煙中隨機抽出40支測量煙絲重量X,然后對這箱卷煙的煙絲重量進行分析。樣本樣本指標N=50000n=40放回抽樣不放回抽樣X1、X2、…XN
X
的抽樣分布
如果將整理成分布數列,得到以下形式:樣本平均數概率(頻率)
p1p2pk形成了抽樣分布表,該表便為X的抽樣分布。x的抽樣分布49一、的期望值
(7-1)公式(7-1)說明,是的無偏估計。
無偏性(Unbiasedness)點估計量的一個性質。點估計量的數學期望等于所估總體參數的值。
[例]總體A、B、C三人年齡為:1,2,3,N=3n=2。=2歲結論是:樣本均值的無偏性
51(一)無限總體的標準差(重復抽樣)(7-2)(二)有限總體的標準差(不重復抽樣)(7-3)二、的標準差
抽樣平均數的標準差A、重復抽樣
B、不重復抽樣54[例]在聯(lián)合電氣公司問題中,假定求:分析:由于抽樣比
所以可以直接用計算
考察一個N=6的總體(6點的骰子),其原始分布屬于均勻分布:X123456p1/61/61/61/61/61/6
從這個總體中有放回地抽取n=2的樣本(二個骰子同時拋點數),所有可能的樣本總數為Nn=36,假定要通過樣本估計總體的均值,則所有36個可能結果為:三、X的抽樣分布的形態(tài)
第一次第二次123456111.522.533.521.522.533.54322.533.544.542.533.544.55533.544.555.563.544.555.56所有36個可能結果:樣本均值的分布整理成:11.522.533.544.555.56p1/362/363/364/365/366/365/364/363/362/361/36用圖示反映其分布狀況如:
58
X的抽樣分布的形態(tài)中心極限定理對于三種不同總體的演示60這一命題要解決的問題就是,根據抽樣誤差確定在一次抽樣中,樣本均值落在以總體均值為中心,左右分別小于(等于)和大于(等于)一個數據范圍內的概率有多大。
樣本均值與總體均值之差的絕對值稱作抽樣誤差(單個樣本的抽樣誤差):
61[例7.6]
在聯(lián)合電氣公司問題中,假定人事部經理把樣本均值落在總體均值左右各500元以內作為一個可接受的估計值。
那么,根據30名經理組成的簡單隨機樣本得到的樣本均值在總體均值左右500元以內的概率有多大呢?
即要計算:
62解:
圖7.7
樣本均值在總體均值左右500元范圍之間的概率63結論:
上述計算結果表明,
人事部經理有50.36%的把握保證由30名公司經理組成的樣本,他們平均年薪在51300~52300元之間。
64樣本容量與抽樣分布之間的關系
由公式可以看出,均值的標準誤差與樣本容量的平方根有關。即當樣本容量增加時,均值的標準誤差會減少。
例如,當n=30時,聯(lián)合電氣公司問題均值標準誤差為730.30,當樣本容量增加到100時,則新烽電子公司問題均值標準誤差減少到
65在的情況下,由100名新烽電子公司經理組成的簡單隨機樣本所得到樣本均值落在總體均值左右500元之間的概率。
查標準正態(tài)分布表
66
由此,樣本均值在51300~52300元之間的概率為:0.3944+0.3944=0.7888圖7.8
簡單隨機樣本均值的抽樣分布比較(樣本由和名聯(lián)合電氣公司經理年薪組成)
在許多商務和經濟領域中,決策人員還經常要用樣本比例對總體比例進行統(tǒng)計推斷。這一過程我們用下圖來描述:
67總體比例p=?從總體中抽取容量為n的樣本
推斷
68一、樣本比例的期望值
(7-4)
69
(一)無限總體(重復抽樣)
(7-5)
(二)有限總體(不重復抽樣)(7-6)
計算.70
例如,在聯(lián)合電氣公司問題中,已經參加了公司管理培訓計劃的經理所占比例是0.60,因為
71
大樣本容量的標準:
72例如,在聯(lián)合電氣公司問題中,由于
73
當抽取一個簡單隨機樣本并用樣本比例的值來估計總體比例p的值時,二者之間會有一定的抽樣誤差,即
74
例如,在聯(lián)合電氣公司問題中,人事部經理想知道樣本比例在總體比例的范圍之內的概率,即樣本比例在0.55和0.65之間的概率是多少?分析:補充:其他抽樣方法
抽樣組織方式是指在抽樣時對總體的加工整理形式。根據對總體的加工整理形式不同,在抽樣調查中抽樣的組織方式很多,除簡單隨機抽樣外,還有類型抽樣、等距抽樣、整群抽樣、多階段抽樣、方便抽樣和判斷抽樣等其他抽樣方法。一、類型抽樣類型抽樣又稱分層抽樣或分類抽樣。它是先將總體的全部單按照某個標志分成若干組,然后在各組中采用簡單隨機抽樣方式或其他方式抽取樣本單位的抽樣組織方式。[例]10人年齡資料如下。N=10n=3,推斷總體平均年齡。人:ABC
DEFG
HIJ年齡:5812
40424648
707276[簡單隨機抽樣](B
、H、I),(
C、D
、E
),(F
、G
、
I)結論:總體變異較大時類型抽樣。[類型抽樣](B
、E、I),(
C、D
、H
),(A
、G
、
J)類型抽樣是應用于總體內各單位在被研究標志上有明顯差別的抽樣,如研究農作物產量時,耕地有平原、丘陵和山地等;研究職工的工資水平時,各行業(yè)之間有明顯的差別。類型抽樣實質上是把統(tǒng)計分組和抽樣原理有機結合的抽樣組織方式。通過分組,可以使組中具有同質性,組間具有差異性,然后從各組中簡單隨機抽樣。這樣可以保證樣本對總體具有更高的代表性,所以計算出的抽樣誤差就比較小。類型抽樣應掌握的主要原則是:分組時應使組內差異盡可能小,使組間差異盡可能大。
設全及總體有N個單位,現(xiàn)在需要抽取一個容量為n的樣本,可以將總體單位N按一定標志排隊,然后將N劃分為n個單位相等的部分,每一部分都包含K個單位,即N/n=K。
二、等距抽樣等距抽樣又稱為機械抽樣或系統(tǒng)抽樣。它是先將總體各單位按某一標志順序排列,然后按照固定的順序和相同的間隔來抽取樣本單位的抽樣組織方式。1、2、3、…、i、…、Ki+2Ki+(n-1)Kn在第一部分K個單位中(順序為1、2、3、…、i、…、K)隨機抽取一個單位i,而在第二部分中抽取第i+K單位。第三部分中抽取第i+2K單位……在第n部分抽取第i+(n-1)K單位,共n個單位組成一個樣本,而且每個樣本的間隔均為K,這種抽樣方法稱等距抽樣。等距抽樣的隨機性表現(xiàn)在抽取第一個樣本單位上,當第一個單位確定后,其余各個單位的位置也就確定了。等距抽樣可以分為無關標志排序抽樣和有關標志排序抽樣兩類。
無關標志排序抽樣是指排序的標志與被研究的標志無關,如:觀察學生考試成績用姓氏筆劃;觀察產品質量按生產的先后順序等。無關標志排序可以保證抽樣的隨機性,它實質上相當于簡單隨機抽樣。
有關標志排序抽樣是指排序的標志與被研究標志相關。
在對總體各單位的變異情況有所了解的情況下,也可以采用有關標志進行總體單位排列,使各單位的排列順序和它的變量數值大小保持密切的關系。如:農產量抽樣調查,可利用各縣或各鄉(xiāng)當年估計畝產或最近三年平均畝產標志排隊,抽取調查單位;又如職工家計調查,可按職工平均工資排隊,抽取調查企業(yè)或調查戶。由此可見,按有關標志排序實質上是運用類型抽樣的一些特點,有利于提高樣本的代表性。但也必須注意到,等距抽樣在排序時,第一個樣本單位的位置確定后,其余單位也隨之確定,因此要避免抽樣間隔和現(xiàn)象本身的周期性節(jié)奏相重合,引起系統(tǒng)性的影響。三、整群抽樣整群抽樣又稱為分群抽樣或集團抽樣。它是將總體劃分為若干群,然后以群為單位從中按簡單隨機抽樣方式或等距抽樣方式抽取部分群,對中選群中的所有單位一一進行調查的抽樣組織方式。
ABCDEFGHIJKLNOPLHPD1、按某種標志或要求將總體區(qū)分為若干群(R),群內單位數(M)相等;2、采取不重復抽樣方式從R群隨機抽出r群,爾后對樣本群進行全面調查以推斷總體??傮w群數R樣本群數r
在大規(guī)模的抽樣調查中,如果總體單位多且分布區(qū)域廣,缺少進行抽樣的抽樣框,或者在按經濟效益原則不宜編制這種抽樣框的情況下,宜采用整群抽樣方式。整群抽樣中的群主要是自然形成的,如按行政區(qū)域、地理區(qū)域劃分群。整群抽樣和其他抽樣組織方式比較,在相同的條件下,抽樣誤差較大,代表性較低。在統(tǒng)計工作實踐中采用整群抽樣時,一般都要比其他抽樣方式抽樣更多的單位,借以降低抽樣誤差,提高抽樣結果的準確程度。四、多階段抽樣
多階段抽樣又稱多級抽樣。它是將抽取樣本單位的過程劃分為幾個階段,然后逐階段抽取樣本單位的抽樣組織方式。
如果先將總體進行分組,從中隨機抽出一些組,然后再從中選的組中隨機抽取總體單位,稱為二階段抽樣,如整群抽樣隨機抽出群,再從群中隨機抽出樣本單位就是二階段抽樣。
如果將總體進行多層次分組,然后依次在各層中隨機抽取,直到抽到總體單位,就稱為多階段抽樣,如我國農產量調查就是采用多階段抽樣調查,即先從省中抽縣,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 大自然探秘題目及答案
- 大學數學專業(yè)題目及答案
- 2025年低碳城市建設規(guī)劃與汕頭實踐深度分析報告
- 2025年九年級中考前沖刺~八年級上冊??季淠瑢懠枺?)(含答案)
- 湖北建筑安全員考試試題及答案
- 云南省衛(wèi)生健康委所屬事業(yè)單位2025年面向社會公開招聘工作人員筆試及最低合格分數線筆試歷年典型考題及考點剖析附帶答案詳解
- 【菏澤】2025年山東菏澤市牡丹區(qū)區(qū)直事業(yè)單位引進高層次急需緊缺人才25人筆試歷年典型考題及考點剖析附帶答案詳解
- 2025甘肅蘭州新區(qū)市政投資管理集團有限公司招聘32人筆試參考題庫附帶答案詳解
- 直流傳動礦井提升機項目投資風險評估報告
- 車輛抵押租賃品牌授權合同模板
- GB/T 19964-2024光伏發(fā)電站接入電力系統(tǒng)技術規(guī)定
- 鐵路施工安全培訓
- 保密知識培訓與教育
- 地類及變化原因劃分、數據庫結構、森林資源變化圖斑現(xiàn)地核實表、年度更新統(tǒng)計報表
- 材料科學基礎-第9章-材料的亞穩(wěn)態(tài)
- 2023(買賣合同)買賣合作協(xié)議正規(guī)范本(通用版)
- 【中國禮儀文化在高鐵乘務中的體現(xiàn)及提升策略8000字(論文)】
- 國家開放大學《土木工程力學(本)》形考作業(yè)1-5參考答案
- 中國胰腺囊性腫瘤診斷指南
- 驗證前風險評估精密檢驗儀器風險評估報告
- 檢驗科醫(yī)院感染管理質量考核標準
評論
0/150
提交評論