




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第6章參數估計統(tǒng)計推論基本概念抽樣分布點估計區(qū)間估計大樣本區(qū)間估計6.1統(tǒng)計推論統(tǒng)計推論是根據局部資料(樣本資料)對總體的特征進行推斷。屬于歸納推理的范疇。統(tǒng)計推論的特點:(1)局部反映總體;(2)抽樣結果總是存在隨機性。統(tǒng)計推論的內容:(1)參數估計(parameter’sestimation)(2)假設檢驗(Hypothesistest)6.2基本概念總體(Population):是研究對象的全體。可以看作是一個研究對象的集合,又可以看作是所研究的變量的一個分布。例如家庭和家庭收入??傮w由個體(調查單位)構成。樣本(Sample):從總體中按一定方式將要調查的個體抽出來,就組成一個樣本。其中包含的個體數目n稱為樣本大小或樣本容量。簡單隨機樣本:樣本中個體的抽取是獨立的,且和總體同分布,由此形成的樣本即簡單隨機樣本。要研究的總體的特征叫做參數值。要研究的樣本的特征叫做統(tǒng)計量。根據樣本觀測值得到的統(tǒng)計數字叫做統(tǒng)計量的觀測值。有時也把它們看作是統(tǒng)計量的本身。統(tǒng)計量的分布即抽樣分布。6.3抽樣分布總體分布(populationdistribution)是變量X的所有取值形成的分布。但我們在分析中往往不能知道總體分布的情況。1、樣本均值的分布(1)總體正態(tài)分布,方差已知
反映了統(tǒng)計量圍繞總體均值(μ)的分散程度,或者說反映了抽樣均值與μ的平均誤差水平。所以它又稱作抽樣均值的平均誤差或標準誤差。
是由抽樣引起的,其大小可以反映統(tǒng)計量的可靠性程度。其標準化后也得到標準正態(tài)分布。(2)總體正態(tài)分布,方差未知用樣本方差作為總體方差的估計值;統(tǒng)計量服從t分布。(3)任意總體,大樣本情況在社會現象的研究中,可以不考慮總體分布如何,只要n足夠大(≥50),樣本均值的分布將確定為一個近似的正態(tài)分布。2、樣本方差S2的分布樣本方差是隨機變量,當總體為正態(tài)分布時,S2的分布與分布相聯系?!?/p>
2023/2/57
分布回顧該分布是指一些相互獨立、服從標準正態(tài)分布的隨機變量平方和的分布。即從正態(tài)分布總體中抽取出來的樣本,經過標準化后,它的平方和服從分布?!╪-1)常用于列聯表檢驗。2023/2/586.4點估計點估計:是以一個最適當的樣本統(tǒng)計值來代表總體參數值。具體說,用樣本均值作為總體均值的點估計值。用樣本方差作為總體方式差的點估計值。估計量如果具有無偏性、一致性和有效性,就可以認為這種統(tǒng)計量是總體參數的合理估計或最佳估計。6.4.1求點估計值的標準無偏性:要求統(tǒng)計量抽樣分布的均值恰好等于被估計的參數之值。比如,中心極限定理告訴我們,樣本均值抽樣分布的均值恰好等于總體均值,因此用樣本均值估計總體均值就滿足這個標準。但絕不是說任何的值將等于μ。一致性:當樣本容量逐漸增加時,統(tǒng)計量越來越接近總體參數。要求統(tǒng)計量隨著樣本容量n的增大以更大的概率接近被估計參數。有效性:是指統(tǒng)計量的抽樣分布集中在真實參數周圍的程度。要求估計值的抽樣分布有較小的分散性,即選擇抽樣分布的標準差較小的統(tǒng)計量作為估計量。6.4.2點估計值的計算總體均值的點估計總體方差的點估計值在統(tǒng)計學中,常常用符號“”來表示無偏估計量。數學上可以證明,對于隨機樣本而言,才是總體方差的無偏估計量,它稱為修正樣本方差。當Xi表示的是變量,其取值是0和1。如果A類(X=1)出現了m次,我們用樣本的成數P作為總體的估計值。[例]工會為了了解春游期間需用幾輛公共汽車,在全廠10000名職工中進行了共100人的簡單隨機抽樣調查。統(tǒng)計結果,其中有20名愿意外出春游。假設每輛車可載乘客50名,問估計要預租多少輛公共汽車?用樣本成數來估計。[例]研究者要調查某社區(qū)居民家庭收入分布的差異情況,現隨機抽查了10戶,得到樣本方差為=200(元2)。試以此資料估計總體家庭收入分布的差異情況。
[解]因為樣本容量較小,宜用修正樣本方差作為總體方差點估計量。即
===222.26.5區(qū)間估計(Intervalestimation)區(qū)間估計的任務是,在點估計值的兩側設置一個區(qū)間,使得總體參數被估計到的概率大大增加??煽啃院途_性(即信度和效度)在區(qū)間估計中是相互矛盾的兩個方面。
6.5.1有關區(qū)間估計的幾個概念置信區(qū)間:區(qū)間估計是求所謂置信區(qū)間的方法。置信區(qū)間就是我們?yōu)榱嗽黾訁当还烙嫷降男判亩邳c估計兩邊設置的估計區(qū)間。區(qū)分精確性與可靠性顯著性水平
α:表示用置信區(qū)間來估計的不可靠的概率。置信度(水平)1-α:表示置信區(qū)間估計的可靠性(把握度)。例如置信水平取0.90。抽樣平均誤差與概率度
Z抽樣平均誤差:樣本均值抽樣分布的標準差。反映在參數周圍抽樣平均值的平均變異程度。越大,樣本均值越分散。概率度:Z在參數估計中被稱為概率度,其大小由
α決定.
顯著性水平、置信水平、概率度之間的關系:
α
=0.10時,1-
α
=0.90,Zα/2=1.65
α=0.05時,1-
α
=0.95,Zα/2=1.96
α=0.01時,1-
α
=0.99,Zα/2=2.582023/2/5186.5.2區(qū)間估計的做法從點估計值開始,向兩側展開一定倍數的抽樣平均誤差,并估計總體參數很可能就包含在這個區(qū)間之內。置信區(qū)間的大小主要由和Z這兩個量所決定,并且是2Z。所以參數μ的區(qū)間估計就歸結為計算這兩個量(即就各種抽樣分布計算概率度和就各種抽樣方式計算抽樣平均誤差)。
的大小對設置置信區(qū)間的范圍起著很重要的作用。在同等置信度的情況下,抽樣平均誤差小,估計區(qū)間就縮小了,從而獲得對參數較為有效的估計(決定效度的關鍵因素)。Z則與信度相聯系。對參數μ的區(qū)間估計的步驟:
1.首先從總體抽取一個樣本,根據收集的樣本資料求出它的均值。
2.根據合乎實際的置信水平查表求得概率度
3.根據總體標準差和樣本容量求出抽樣平均誤差
4.以均值為基準,向兩側展開Z倍抽樣平均誤差的區(qū)間。根據總體方差是否知道,估計分兩種情況。(1)已知(2)未知,用S代替6.5.3大樣本,總體均值的區(qū)間估計[例]設某工廠婦女從事家務勞動服從正態(tài)分布N
[μ
,0.662],根據36人的隨機抽樣調查,樣本每天平均從事家務勞動的時間為2.65小時,求μ的置信區(qū)間(置信度1-α
=0.95)。
[解]按題意,此為大樣本,且總體方差已知,又
n=36,=2.65,=0.66,1-α=0.95。查表得Z=1.96,代入公式有=2.65±1.96=2.65±0.22
因此,有95%的把握,該廠婦女平均從事家務勞動的時間在2.87~2.43小時之間。[例]從某校隨機地抽取100名男學生,測得平均身高為170厘米,標準差為7.5厘米,試求該校學生平均身高95%的置信區(qū)間。
[解]按題意,此為大樣本,且總體方差未知,又n=100,=170,S=7.5,1—α=0.95.查表得=1.96,代入公式有
=170±1.96=170±1.47因此,有95%的把握,該校學生的平均身高在168.5~171.5厘米之間。[習題]從來自“白領犯罪與罪犯生涯:一些初步研究結果”的一項研究報告的數據表明,白領犯罪可能是年紀較大者,并且顯示比街頭罪犯有較低的犯罪率。給出數據為:白領犯罪發(fā)作平均年齡為54歲,n
=100,標準差被估計為7.5歲。建立真實平均年齡的90%置信區(qū)間。采用t分布6.5.4小樣本,正態(tài)總體均值區(qū)間估計[例]在一個正態(tài)總體中抽取一個容量為25的樣本,其均值為52,標準差為12,求置信水平為95%的總體均值的置信區(qū)間。
[解]根據題意,總體方差未知,且為小樣本,故用t分布統(tǒng)計量。由95%置信水平查t分布表得概率度=(24)=2.064
代入公式得
=52±2.064=52±4.95因此,置信水平95%的總體均值的置信區(qū)間是從47.05到56.95。從總體的均值估計過渡到總體的成數估計,其方法和思路完全相同,只要用代替,用代替。6.5.5大樣本總體成數的估計[例]假若從某社區(qū)抽取一個由200個家庭組成的樣本,發(fā)現其中有36%的家庭由丈夫在家庭開支上作決定的次數超過半數。試問家庭開支的半數以上由丈夫決定的家庭的置信區(qū)間是多少?(置信水平99%)[例]假若從某社區(qū)抽取一個由200個家庭組成的樣本,發(fā)現其中有36%的家庭由丈夫在家庭開支上作決定的次數超過半數。試問家庭開支的半數以上由丈夫決定的家庭的置信區(qū)間是多少?(置信水平99%)
[解法一][解法二]2023/2/530n1≥50n2≥50現在從兩總體獨立地各抽取一個隨機樣本:只要樣本都大于或等于50,則兩個樣本均值的抽樣分布都服從正態(tài)分布,根據正態(tài)隨機變量線性組合的隨機變量仍然服從正態(tài)分布的原理,則均值差也服從正態(tài)分布。6.5.5大樣本二總體均值差的估計若總體方差未知,則用樣本方差代替總體方差。在大樣本的情況下置信度為1-a的(μ1-μ2)的區(qū)間估計為:2023/2/533
與單樣本成數的區(qū)間估計一樣,成數差區(qū)間估計可以被看作均值差的特例來處理(但它適用于各種量度層次)。即對給定的置信水平(1―α),得兩總體成數差(p1―p2)之估計區(qū)間為
6.5.5大樣本成數差的區(qū)間估計2023/2/534
[例]有一個大學生的隨機樣本,按照性格“外向”和“內向”,把他們分成兩類。結果發(fā)現,新生中有73%屬于“外向”類,四年級學生中有58%屬于“外向”類。樣本中新生有171名,四年級學生有117名。試在99%的置信水平上,求新生、老生性性格“外向”的成數差的置信區(qū)間。2023/2/535
[解]據題意,
新生組的抽樣結果為:=0.73,
=027,
n1=171(人)
四年級學生組的抽樣結果為:
=0.58,
=0.42,n2=117(人)
由(1―α)=0.99,得Zα/2=Z0.005=2.58,代入上式得
得在99%置信水平上,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年河北省邯鄲二十五中中考數學二模試卷
- 2025年中考地理模擬試卷:地理環(huán)境與人類活動案例分析
- 上海市楊浦區(qū)2025屆高三下學期模擬質量調研數學試卷(解析版)
- 2025年育嬰師職業(yè)技能測評模擬試題匯編試卷
- 2025年潛水教練資格考試模擬試卷歷年真題回顧
- 2025年人力資源管理師專業(yè)技能考核試卷:勞動法律法規(guī)與合規(guī)風險控制試題
- 2025年注冊會計師考試《會計》合并財務報表重點難點解析實戰(zhàn)試卷
- 2025年美發(fā)師創(chuàng)意造型考核試卷:美發(fā)師團隊協(xié)作與領導能力試題
- 2025年大數據分析師職業(yè)技能測試卷:數據清洗與預處理操作試題匯編
- 2025年英語翻譯資格考試筆譯模擬試卷(語法應用)
- 院感試題100題及答案
- 急性冠脈綜合征診斷及治療課件
- 吹小號的天鵝試題及答案
- 數據庫開發(fā) 試題及答案
- GB/T 45434.3-2025中國標準時間第3部分:公報
- 2024年鄭州工業(yè)應用技術學院單招職業(yè)適應性測試題庫附答案
- 北京市消防條例解讀
- 農業(yè)合作社管理與運營模式試題及答案
- Unit 4 Clothes 單元整體(教學設計)-2024-2025學年人教精通版(2024)英語三年級下冊
- 2025年版中等職業(yè)教育專業(yè)教學標準 710205 大數據技術應用
- 2025年河南省鄭州市九年級中考一模數學試題 (原卷版+解析版)
評論
0/150
提交評論