版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第四章 抽樣分布,主要內(nèi)容 第一節(jié) 抽樣的概念與方法 第二節(jié) 簡單隨機樣本的抽樣分布 第三節(jié) 抽樣其它組織形式及其分布特征,統(tǒng)計應用:兩個例子,The purpose of Statistics inference is to obtain information about a population from information contained in sample. 例1:一汽車輪胎制造商生產(chǎn)一種被認為壽命更長新型輪胎。 例2:某黨派想支持某一候選人參選美國某州議員,為了決定是否支持該候選人,該黨派領(lǐng)導需要估計支持該候選人的民眾占全部登記投票人總數(shù)的比例。由于時間及財力的限制:,抽樣
2、估計方法主要用在下列兩種情況: 1、對所考查的總體不可能進行全部測度; 2、從理論上說可以對所考查的總體進行全部測度,但實踐上由于人力、財力、時間等方面的原因,無法或沒有必要(不劃算)進行全部測度。 注意: 抽樣調(diào)查必須遵循隨機原則。 抽樣估計只能得到對總體特征的近似測度,因此,抽樣估計還必須同時考察所得結(jié)果的“可能范圍”與“可靠程度”。,第一節(jié) 抽樣的概念與方法,一、抽樣的基本概念 二、簡單隨機抽樣的方法,一、抽樣的基本概念,例3:某大公司人事部經(jīng)理整理其2500個中層干部的檔案。其中一項內(nèi)容是考察這些中層干部的平均年薪及參加過公司培訓計劃的比例。 總體:2500名中層干部(populati
3、on ), 如果:上述情況可由每個人的個人檔案中得知,可容易地測出這2500名中層干部的平均年薪及標準差。 假如:1:已經(jīng)得到了如下的結(jié)果: 總體均值=51800 總體標準差=4000,2、同時,有1500人參加了公司培訓, 則參加公司培訓計劃的比例為: P =1500/2500=0.60 參數(shù)是總體的數(shù)值特征(A parameter is a numerical characteristic of a population.)。 如:例3中的中層干部平均年薪,年薪標準差及受培訓人數(shù)所占比例均為該公司中層干部這一總體的參數(shù)。 抽樣估計就是要通過樣本而非總體來估計總體參數(shù)。,假如抽取30名,得到
4、樣本平均數(shù)、標準差和成數(shù)是,則,樣本:抽取到的30名中層干部。 統(tǒng)計量:根據(jù)樣本分布計算的綜合指標,是樣本變量的函數(shù)。 另注意區(qū)分樣本容量和樣本個數(shù): 樣本容量是指一個樣本所包含的單位數(shù)。 樣本個數(shù)是指樣本的可能數(shù)目。,二、簡單隨機抽樣的方法,(一)放回抽樣 n個單位的樣本是有n次試驗的結(jié)果構(gòu)成 每次試驗都是獨立的 每次試驗都在相同條件進行 樣本的可能個數(shù)為 (考慮順序)或 (不考慮順序),(二)不放回抽樣,n個單位的樣本是有n次試驗的結(jié)果構(gòu)成 每次試驗不是獨立的 每個單位在多次試驗中中選機會是不等的 樣本的可能個數(shù)為N(N-1)(N-2)(N-n+1)(考慮順序)或 (不考慮順序),在社會經(jīng)
5、濟統(tǒng)計中,往往采用的是較大總體(視為無限總體)下的無序不重復抽樣。,第二節(jié) 簡單隨機樣本的抽樣分布,一、重置抽樣的抽樣分布 二、不重置抽樣的抽樣分布,一、重置抽樣的抽樣分布,樣本統(tǒng)計量的分布就是抽樣分布 (一)樣本均值的抽樣分布 容量相同的所有可能樣本的樣本均值的概率分布 一種理論概率分布 進行推斷總體總體均值的理論基礎(chǔ),【例】設一個總體,含有4個元素(個體) ,即總體單位數(shù)N=4。4 個個體分別為x1=1、x2=2、x3=3 、x4=4 ??傮w的均值、方差及分布如下,均值和方差,總體特征值, 現(xiàn)從總體中抽取n2的簡單隨機樣本,在重復抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為,樣本均值
6、的抽樣分布,樣本均值的抽樣分布, 計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布,樣本均值的分布與總體分布的比較, = 2.5 2 =1.25,總體分布,顯然,不同的樣本對應著不同的樣本統(tǒng)計量,而由于樣本抽取的隨機性,樣本統(tǒng)計量即為一種隨機變量。 一般地,樣本統(tǒng)計量的可能取值及其取值概率,形成其概率分布,統(tǒng)計上稱為抽樣分布(sampling distribution)。 正是抽樣分布及其特征使得用樣本統(tǒng)計量估計總體參數(shù)的“精確程度”能夠給予概率上的描述。 由于樣本統(tǒng)計量的隨機性及其抽樣分布的存在,同樣可計算其均值、方差、標準差等數(shù)字特征來反映該分布的中心趨勢和離散趨勢。,1、樣本平均數(shù)的
7、期望值 由于不同的樣本可得到不同的樣本均值,因此,考察樣本均值的期望就顯得非常重要。 用 表示樣本均值的期望值, 表示總體均值,可證明在簡單隨機抽樣中。,結(jié)論:,樣本平均數(shù)的標準差可得: 樣本均值的標準差可用來測度樣本均值與總體均值的“距離”,即可用來計算可能的誤差,它也被稱為均值標準誤(standard error of the mean)或抽樣平均誤差。,2.樣本平均數(shù)的標準差,(二)樣本比例的抽樣分布,在經(jīng)濟與商務的許多場合,需要用樣本比例p對總體比例P進行統(tǒng)計推斷。 樣本比例抽樣分布是樣本比例所有可能值概率分布。 同樣地,要考察樣本比例p與總體比例P的接近程度,需要有樣本比例抽樣分布的
8、相關(guān)信息。,結(jié)論,根據(jù)p的期望值、標準差及前面樣本平均數(shù)的特性(抽樣分布形狀)。 1、期望值:E (p)=P 2、標準差:, 現(xiàn)從總體中抽取n2的簡單隨機樣本,在不重復抽樣條件下,共有12個樣本。所有樣本的結(jié)果為,二、不重置抽樣的抽樣分布(一)樣本均值的抽樣分布,樣本均值的抽樣分布, 計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布,X,樣本均值的分布與總體分布的比較, = 2.5 2 =1.25,總體分布,結(jié)論:(不放回抽樣),1、樣本平均數(shù)的期望值 2、樣本平均數(shù)的標準差 稱為有限總體修正因子(finite population correction factor),(二)樣本比例的抽
9、樣分布,不放回抽樣p的期望值、標準差分別為。 1、期望值:E (p)=P 2、標準差:,附注:正態(tài)分布理論與中心極限定理,1、正態(tài)分布的密度函數(shù) 式中 為正態(tài)分布的平均數(shù), 是它的標準差。這兩個參數(shù)決定正態(tài)分布密度函數(shù)的形狀。也可簡記為N,正態(tài)分布密度函數(shù)特性:,(1)對稱性。 (2)非負性。 (3)當x處于中心位置時,密度函數(shù)值最大。 (4)在 處為密度函數(shù)的拐點,越大圖形越 扁平。,(5)當x 時,密度函數(shù)f(x) 0,即曲線向兩邊下垂,伸向無窮遠處。,2、正態(tài)分布標準化,正態(tài)分布函數(shù)為:,不同的正態(tài)分布參數(shù)也就有不同的正態(tài)分布形式,利用上式分布函數(shù)計算各類不同的正態(tài)分布形式某點或某區(qū)間的
10、概率是很困難的。必須對各種正態(tài)分布加以標準化,才能求其概率, 標準化:要求平均數(shù)為0,方差為1,用N(0,1)來表示。即是原變量變?yōu)樾伦兞浚?例 :某農(nóng)場的小麥畝產(chǎn)量服從正態(tài)分布,已知平均畝產(chǎn)為550公斤,標準差50公斤,求畝產(chǎn)在525575公斤間所占的比例。,例:解放軍戰(zhàn)士的身高是按正態(tài)分布,經(jīng)抽查平均身高175公分,標準差是4公分,現(xiàn)軍服廠要裁制100,000套軍服,問身高在171179公分之間要裁多少套?,3、正態(tài)分布再生定理,則無論樣本容量n大小如何,樣本均值都為正態(tài)分布。,當總體分布未知時,需要用到中心極限定理: 對容量為n 的簡單隨機樣本,樣本均值的分布隨樣本容量的增大而趨于正態(tài)分
11、布。 經(jīng)驗上驗證,當樣本容量等于或大于30時,無論總體的分布如何,樣本均值的分布則非常接近正態(tài)分布。因此統(tǒng)計上常稱容量在30(含30)以上的樣本為大樣本(large-sample-size)。,4、中心極限定理(Central limit Theorem),5、樣本容量與樣本均值分布的關(guān)系 由于樣本標準差與總體標準差及樣本容量有關(guān): 因此,樣本容量增大,樣本均值標準差變小,從而使樣本分布峰度變高,于是在相同區(qū)間內(nèi),概率分布線下的面積變大,提高了樣本均值落在該區(qū)間的可能性。 注意: 1、所有可能的樣本均值的平均數(shù)等于總體均值,而與樣本容量無關(guān)。 2、點估計往往是在總體方差已知的情況下進行的。,附
12、注:關(guān)于正態(tài)分布查表的基本方法,概率是曲線下的面積,關(guān)于正態(tài)分布查表的基本方法: f(z) f(z) f(z) z z z -0.5 0 0.5 -0.5 0.5 P(-0.5x 0.5)=0.3829 P(x-0.5)=(1-0.3829)/2=0.5-0.3829/2=0.30855 P(x0.5)=0.30855 P (x0.5)=1-0.30855=0.69145,第三節(jié) 抽樣其它組織形式及其分布特征,一、抽樣其他組織形式 二、抽樣設計的基本原則 三、抽樣組織設計 四、抽樣方案的設計,一、抽樣其他組織形式,類型抽樣 整群抽樣 系統(tǒng)抽樣 分層抽樣 多階段抽樣,(一)保證隨機原則的實現(xiàn) (
13、二)考慮樣本容量和結(jié)構(gòu)問題 (三)關(guān)于抽樣的組織形式問題 (四)必須重視調(diào)查費用這個基本因素,二、抽樣設計的基本原則,三、抽樣的組織設計,(一)簡單隨機抽樣 1、有限總體的抽樣 方法:將總體單位編成抽樣框,而后用直接抽選法、抽簽法或隨機數(shù)表法抽取樣本單位。 適用:總體規(guī)模不大;總體內(nèi)部差異小。 2、無限總體的抽樣 方法:必須特殊制定一種獨立選取樣本點的抽樣過程,以避免由于某些類型的個體以較大概率被選入而產(chǎn)生誤差。 適用:總體太大或是無限的;總體內(nèi)部差異小。,隨機數(shù)字表(摘錄),63271 59986 71744 51102 15141 80714 58683 93108 13554 79945
14、 88547 09896 95436 79115 08303 01041 20030 63754 08459 28364 55957 57243 83865 09911 19761 66355 40102 26646 60147 15702 46276 87453 44790 67122 45573 84358 21625 16999 13385 22782 55363 07449 34835 15290 76616 67191 12777 21861 68689 03263 69393 92785 49902 58447 42048 30378 87618 26933 40640 16281
15、 13186 29431 88190 04588 38733 81290 89541 70290 40113 08243 17726 28652 56836 78351 47327 18518 92222 55201 27340 10493 36520 64465 05550 30157 82242 29520 69753 72602 23756 54935 81628 36100 39254 56835 37636 02421 98063 89641 64953 99337 隨機數(shù)字表中,可以從任何一個位置、任何方向開始挑選隨機數(shù)。一旦選擇一個任意起點,就采用事先確定的程序。,(二)類型抽樣
16、(分層抽樣或分類抽樣) 1、方法:將總體全部單位分類,形成若干個類型組,后從各類型中分別抽取樣本單位,合成樣本。,總體,層1,層2,層, ,2、類型抽樣的特點:,根據(jù)方差定理: 總方差=組內(nèi)方差的平均數(shù)+組間方差 在劃分類型后,類型抽樣實際是對每組都抽去了一個樣本,如果各組內(nèi)的抽樣誤差都為0,那么不論各組之間差異如何,整個樣本的方差就等于總方差(總方差=組間方差),也就是說抽取得到的樣本分布完全和總體分布一樣,也就不存在抽樣誤差。 所以說,類型抽樣總的抽樣誤差主要取決于各組內(nèi)的抽樣誤差。,3、類型抽樣平均誤差的計算,設總體有N個單位組成,把總體分為k組,然后從每組中抽取樣本單位構(gòu)成樣本總體。怎
17、樣從每類中抽取呢?通常是等比例抽樣。,(三)等距抽樣(機械抽樣或系統(tǒng)抽樣),1、方法:將總體單位按某一標志排序,而后按一定的間隔抽取樣本單位。設總體有N個單位組成,現(xiàn)在抽取一個容量為n的樣本,現(xiàn)將總體N個單位按標志排隊,然后將N劃分為n個單位相等部分,每部分包含k個單位,(Nnk),然后在每部分中抽取一個單位。 按排隊標志性質(zhì)的不同,可分為有關(guān)標志排隊等距抽樣和無關(guān)標志排隊等距抽樣。,按有關(guān)標志排隊的抽取方法: ()半距中點取樣 1 2 3 4 n ()對稱等距抽樣 或 1 2 3 4 n 按無關(guān)標志排隊的抽取方法: ()任意起點抽樣 1 2 3 4 n,1、方法,2、等距抽樣平均誤差的計算,
18、關(guān)于等距抽樣的平均誤差,它和標志排列順序有關(guān), 情況比較復雜。如果用來排隊的標志是無關(guān)標志, 而且是隨機起點抽樣,那么它的抽樣誤差就十分 接近簡單隨機抽樣的誤差,為了簡便起見,可以 采用簡單隨機抽樣誤差公式來近似計算即:,(四)整群抽樣(集團抽樣),1、方法: 將總體全部單位分為許多個“群”,然后隨機抽取若干“群”,對被抽中的各“群”內(nèi)的所有單位登記調(diào)查。,總體,群1,群2,群, ,2、整群抽樣的特點:,根據(jù)方差定理: 總方差=組內(nèi)方差的平均數(shù)+組間方差 在分群后,整群抽樣實際是對中選群進行全面調(diào)查,其樣本的代表性取決于抽中的群體對總體的代表性每組。如果各群體之間沒有差異(即組間方差=0),群內(nèi)方差就等于總方差(總方差=組內(nèi)方差),則樣本能完全代替總體,也就不存在抽樣誤差。 所以說,整群抽樣總的抽樣誤差主要取決于各群間的抽樣誤差或群間差異程度。,3、整群抽樣平均抽樣誤差計算公式: 設總體全部單位劃分為群每群包含單位則現(xiàn)在從總體群中隨機抽取群組成樣本,并分別對中選群的所有單位進行調(diào)查,(五)階段抽樣,1、方法:是指在抽樣時先抽總體中某種更大范圍的單位,再從中選大單位中較小的單
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度個人教育分期借款合同范本3篇
- 二零二五年度內(nèi)燃機核心零部件代理銷售合同3篇
- 二零二五年度門臉房屋租賃與文創(chuàng)產(chǎn)業(yè)合作合同4篇
- 二零二五年度生態(tài)農(nóng)莊木工建造服務合同4篇
- 二零二五版門頭智能化控制系統(tǒng)研發(fā)與安裝合同4篇
- 二零二五年度文化旅游產(chǎn)業(yè)發(fā)展基金合同及違約賠償細則4篇
- 二零二五版高新技術(shù)企業(yè)研發(fā)項目財務監(jiān)管合同范本2篇
- 2025年度個人抵押借款合同風險評估范本
- 2025年度個人漁業(yè)貸款合同模板3篇
- 2025年度個人對個人光伏發(fā)電項目借款合同
- 三位數(shù)除以兩位數(shù)-豎式運算300題
- 2023年12月廣東珠海市軌道交通局公開招聘工作人員1人筆試近6年高頻考題難、易錯點薈萃答案帶詳解附后
- 寺院消防安全培訓課件
- 比摩阻-管徑-流量計算公式
- GB/T 42430-2023血液、尿液中乙醇、甲醇、正丙醇、丙酮、異丙醇和正丁醇檢驗
- 五年級數(shù)學應用題100道
- 西方經(jīng)濟學(第二版)完整整套課件(馬工程)
- 高三開學收心班會課件
- GB/T 33688-2017選煤磁選設備工藝效果評定方法
- 科技計劃項目申報培訓
- 591食堂不合格食品處置制度
評論
0/150
提交評論