




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第五章參數(shù)估計第一節(jié)參數(shù)估計基本方法第二節(jié)總體均值和總體比例的區(qū)間估計第五章參數(shù)估計第一節(jié)參數(shù)估計的基本方法推斷統(tǒng)計就是根據(jù)抽樣分布的原理進(jìn)行的。推斷統(tǒng)計分為兩大類:參數(shù)估計:根據(jù)一個隨機(jī)樣本的統(tǒng)計值來估計總體之參數(shù)值是多少。先看樣本情況,再推總體情況。假設(shè)檢驗:首先假設(shè)總體的情況是怎樣的,然后以一個隨機(jī)樣本的統(tǒng)計值來檢驗這個假設(shè)是否正確。第一節(jié)參數(shù)估計的基本方法推斷統(tǒng)計就是根據(jù)抽樣分布的原理進(jìn)行的第一節(jié)參數(shù)估計的基本方法只要采用隨機(jī)抽樣法,就可根據(jù)抽樣分布,以樣本統(tǒng)計值來推測總體情況。即根據(jù)一個隨機(jī)樣本的統(tǒng)計值來估計總體參數(shù)是多少。參數(shù)估計方法:1.點(diǎn)估計:以一個最適當(dāng)?shù)臉颖窘y(tǒng)計值來代表總體的參數(shù)值;2.區(qū)間估計:以一個區(qū)間去估計總體參數(shù)值;第一節(jié)參數(shù)估計的基本方法只要采用隨機(jī)抽樣法,就可根據(jù)抽樣分布一、點(diǎn)估計從總體中抽取一個樣本,根據(jù)該樣本的統(tǒng)計量對總體的未知參數(shù)作出一個數(shù)值點(diǎn)的估計,用于估計總體某一參數(shù)的隨機(jī)變量;例如:用樣本均值作為總體未知均值的估計值就是一個點(diǎn)估計。樣本越大,抽樣方法越嚴(yán)謹(jǐn),點(diǎn)估計越可信。一、點(diǎn)估計從總體中抽取一個樣本,根據(jù)該樣本的統(tǒng)計量對總體的未點(diǎn)估計的缺陷
抽樣誤差總是難免的。點(diǎn)估計沒給出估計值接近總體未知參數(shù)程度的信息,即估計的可信程度很難確定。點(diǎn)估計的缺陷抽樣誤差總是難免的。二、區(qū)間估計1.根據(jù)一個樣本的觀察值給出總體參數(shù)的估計范圍2.給出總體參數(shù)落在這一區(qū)間的概率3.例如:總體均值落在50~70之間,可信度為95%樣本統(tǒng)計量
(點(diǎn)估計)置信區(qū)間置信下限置信上限二、區(qū)間估計1.根據(jù)一個樣本的觀察值給出總體參數(shù)的估計范圍樣總體未知參數(shù)落在某區(qū)間內(nèi)的概率表示為(1-×100為顯著性水平,是總體參數(shù)未在區(qū)間內(nèi)的概率常用的可信度值有99%,95%;相應(yīng)的為0.01,0.05??尚哦龋ㄖ眯潘剑?/p>
總體未知參數(shù)落在某區(qū)間內(nèi)的概率可信度(置信水平)正態(tài)分布落在總體均值某一區(qū)間內(nèi)的樣本X95%的樣本-1.96
+1.9699%的樣本-2.58+2.5890%的樣本-1.65+1.65正態(tài)分布落在總體均值某一區(qū)間內(nèi)的樣本X95%的樣本-總體均值的間距估計假定條件總體服從正態(tài)分布,且總體方差(2)已知如果不是正態(tài)分布,可以由正態(tài)分布來近似(n
≥30)總體均值的間距估計假定條件均值的間距估計可用下面公式計算可信間距:當(dāng)可信度為99%時,Z取±2.58均值的間距估計可用下面公式計算可信間距:間距的大小與可信度成正比不難理解:在估計時所用的間距如果很小,錯誤的機(jī)會當(dāng)然較大,可信度自然較低。應(yīng)用間距估計法時,可以選用任意的可信度,但一般用95%或99%。間距的大小與可信度成正比總體均值的間距估計某行業(yè)職工日工資收入服從正態(tài)分布,從該行業(yè)職工中隨機(jī)抽取9人,測得其平均日工資收入為21.4元。已知總體標(biāo)準(zhǔn)差=0.15元,試估計建立該行業(yè)職工日均收入的置信區(qū)間,給定置信水平為0.95。我們可以95%的概率保證該行業(yè)職工日均工資在21.302~21.498元之間總體均值的間距估計某行業(yè)職工日工資收入服從正態(tài)分布,從該行業(yè)均值抽樣分布的標(biāo)準(zhǔn)差,稱為均值的標(biāo)準(zhǔn)誤:計算方法是用總體的標(biāo)準(zhǔn)差除以樣本大小(n)的的平方根。然而,總體的標(biāo)準(zhǔn)差很難知道,如果樣本相當(dāng)大,通常以樣本的標(biāo)準(zhǔn)差S作為總體的標(biāo)準(zhǔn)差σ。但是,這種做法有將實際的標(biāo)準(zhǔn)誤估計得稍偏。因為樣本標(biāo)準(zhǔn)差傾向稍小于總體標(biāo)準(zhǔn)差。為彌補(bǔ)這個差異,在計算樣本標(biāo)準(zhǔn)差時,除以n-1而不是n。這樣就可以得到總體方差和標(biāo)準(zhǔn)差的無偏估計。均值抽樣分布的標(biāo)準(zhǔn)差,稱為均值的標(biāo)準(zhǔn)誤:計算方法是用總體的標(biāo)此處的“n-1”稱為“自由度”。此處的“n-1”稱為“自由度”。
第一,自由度的產(chǎn)生是與抽樣分布聯(lián)系在一起的。因為從總體中抽取樣本,因而我們需要計算樣本的“統(tǒng)計量”,“統(tǒng)計量”是研究者通過調(diào)查樣本數(shù)據(jù)人為地計算出來的,而“參數(shù)”是被調(diào)查者的總體所客觀存在的,這是兩者的區(qū)別。在統(tǒng)計學(xué)的理論層面上,要求統(tǒng)計量是參數(shù)的無偏估計,認(rèn)為兩者是相等的。在實際研究中,由于抽樣的誤差可能導(dǎo)致兩者的不相等,但對于這種情況,研究者是無法知道的,否則就沒有抽樣的必要了。在理論假設(shè)下,統(tǒng)計量和參數(shù)一樣被看作是客觀的、確定性的。第一,自由度的產(chǎn)生是與抽樣分布聯(lián)系在一起的。因為從總體中抽
第二,既然在理論上統(tǒng)計量被要求是確定的,那么在實際層面上計算統(tǒng)計量的那組數(shù)據(jù)就不是完全自由的。這一點(diǎn)很重要,因為“自由度”中“自由”的含義就是相對這個“確定”而言的。正是統(tǒng)計量的這個“確定性”限制了與之相關(guān)的一組數(shù)據(jù)的“自由度”,也就是說,一組數(shù)據(jù)不是可以完全自由取值的,它必須支持“統(tǒng)計量與總體參數(shù)相等”的理論假設(shè)。這就是“自由度”存在的理由。第二,既然在理論上統(tǒng)計量被要求是確定的,那么在實際層面上計
研究者對某一社區(qū)內(nèi)居民家庭的收入狀況進(jìn)行調(diào)查,該社區(qū)共有1000戶,采取隨機(jī)抽取的方式對100戶進(jìn)行了調(diào)查。在這個例子中,總體1000戶的收入的平均數(shù)是總體參數(shù),是客觀的、確定的,盡管研究者不知道。通過隨機(jī)抽樣和入戶問卷調(diào)查,研究者獲得了100戶的收入數(shù)據(jù)。運(yùn)用這組數(shù)據(jù)可以算出樣本的平均數(shù),它是統(tǒng)計量。由于在理論上要求統(tǒng)計量與參數(shù)相等。當(dāng)99個數(shù)據(jù)被選擇以后,第100個數(shù)據(jù)就是確定的,所以,這組數(shù)據(jù)在求平均數(shù)這統(tǒng)計量時的自由度就是:k=100-1=99。研究者對某一社區(qū)內(nèi)居民家庭的收入狀況進(jìn)行調(diào)查,該社區(qū)共有1t分布以均值標(biāo)準(zhǔn)誤的估計作為分母計算的值,不完全符合Z分布或者說標(biāo)準(zhǔn)正態(tài)分布,我們給這個分布起個名字,叫做t分布。t值符合t分布。n-1被稱作自由度,自由度不同t分布的形狀有差異。隨著樣本規(guī)模增大,也就是自由度的增大,t分布會變得更加近似于標(biāo)準(zhǔn)正態(tài)分布。t分布以均值標(biāo)準(zhǔn)誤的估計作為分母計算的值,不完全符總體均值的間距估計例題:我們欲了解某地區(qū)家庭用于請客送禮的每月平均支出(μ)情況,現(xiàn)從該地區(qū)抽取一個樣本是:n=226戶,=43元,S=10.5。則可信度為95%的間距估計值為?總體均值的間距估計例題:
41.63≤M≤44.37當(dāng)可信度為99%時的間距估計值是多少?41.63≤M≤44.37影響可信間距寬度的因素:數(shù)據(jù)的離散程度,用來測度;樣本容量n;置信水平(1-),影響Z的取值。影響可信間距寬度的因素:算例1某大學(xué)從該校學(xué)生中隨機(jī)抽取100人,調(diào)查到他們平均每天參加體育鍛煉的時間為26分鐘。試以95%的置信水平估計該大學(xué)全體學(xué)生平均每天參加體育鍛煉的時間(已知總體方差為36分鐘)。我們可以95%的概率保證平均每天參加鍛煉的時間在24.824~27.176分鐘之間算例1某大學(xué)從該校學(xué)生中隨機(jī)抽取100人,調(diào)查到他們平均每天算例2從一個正態(tài)總體中抽取一個隨機(jī)樣本,
n=25,其均值`x=50,標(biāo)準(zhǔn)差s=8。建立總體均值m
的95%的置信區(qū)間。我們可以95%的概率保證總體均值在46.69~53.30之間算例2從一個正態(tài)總體中抽取一個隨機(jī)樣本,四、總體比例的間距估計我們要估計某城鎮(zhèn)有多少家庭是不和睦的。現(xiàn)一個隨機(jī)樣本(n=100)中知道有20.0%的家庭不和,請估計該城鎮(zhèn)總體家庭不和睦情況。要求置信度是95%。四、總體比例的間距估計我們要估計某城鎮(zhèn)有多少家庭是不和睦的。估計總體的比例或百分率,其邏輯基本上與估計均值的相同。如果樣本頗大,百分率(或比例)的抽樣分布會近似正態(tài)分布,各個樣本的百分率都對稱地散布于總體百分率的兩旁。其標(biāo)準(zhǔn)誤差是:其中P是總體的比例(即百分率)。由于難以知道P的數(shù)值,樣本相當(dāng)大時,樣本中的比例可以代替總體中的比例P??傮w比例區(qū)間估計:估計總體的比例或百分率,其邏輯基本上與估計均值的相同。如果樣總體比例的間距估計我們要估計某城鎮(zhèn)有多少家庭是不和睦的。現(xiàn)一個隨機(jī)樣本(n=100)中知道有20.0%的家庭不和,請估計該城鎮(zhèn)總體家庭不和睦情況。要求置信度是95%。0.122≤P≤0.278總體比例的間距估計我們要估計某城鎮(zhèn)有多少家庭是不和睦的?,F(xiàn)一總體比例的間距估計上面的方法,是在Sp公式中以樣本
值代替總體P值。如果樣本相當(dāng)大,這個方法是可以的。另一個較為保守的做法,是以P=0.50代入SE公式,使SE達(dá)到最大值,再將SE值代入可信間距公式就獲得最大的間距,以之來估計參數(shù)值最安全。如上述家庭不和睦的例子:
0.071≤P≤0.329總體比例的間距估計上面的方法,是在Sp公式中以樣本值代算例3某企業(yè)在一項關(guān)于職工流動原因的研究中,從該企業(yè)前職工的總體中隨機(jī)選取了200人組成一個樣本。在對其進(jìn)行訪問時,有140人說他們離開該企業(yè)是由于同管理人員不能融洽相處。試估計由于這種原因而離開該企業(yè)的人員的比例(95%的置信度)。我們可以95%的概率保證該企業(yè)職工由于同管理人員不能融洽相處而離開的比例在63.6%~76.4%之間算例3某企業(yè)在一項關(guān)于職工流動原因的研究中,從該企業(yè)前職工的第三節(jié)決定樣本的大小樣本越大越好在能夠付出的研究代價的限度內(nèi),選取最大的樣本。除此之外的兩個標(biāo)準(zhǔn):1、我們愿意容忍多少錯誤2、所研究的個案之間的相互差異有多大第三節(jié)決定樣本的大小樣本越大越好均值間距估計樣本大小的決定某變量X總體均值為μ,一個隨機(jī)抽取樣本的均值為抽樣均值與總體均值的差就是錯誤e,如果用絕對值表示如下:e=|-μ|均值間距估計樣本大小的決定某變量X總體均值為μ,一個隨機(jī)抽均值間距估計樣本大小的決定假定我們知道總體的標(biāo)準(zhǔn)差σ的數(shù)值,則在估計總體的均值時,95%的可信度間距為:
均值間距估計樣本大小的決定假定我們知道總體的標(biāo)準(zhǔn)差σ的數(shù)值,均值間距估計樣本大小的決定在上述公式中,容忍錯誤的大小可以隨研究的需要來決定,但標(biāo)準(zhǔn)差σ的值卻難以確定,原則上用總體的標(biāo)準(zhǔn)差,如果不知道,只有參考前人的研究或自己進(jìn)行試點(diǎn)研究,依據(jù)這些研究計算出來的標(biāo)準(zhǔn)差數(shù)值,盡可能猜想總體的標(biāo)準(zhǔn)差是多少。這項猜想工作不容易,準(zhǔn)確性也有疑問。所以社會學(xué)研究多不用此公式來決定樣本的大小,但以之作參考只用是可以的。均值間距估計樣本大小的決定在上述公式中,容忍錯誤的大小可以隨算例4我們想調(diào)查某地區(qū)工人的平均工資,根據(jù)前人研究,該地區(qū)工人工資變量的標(biāo)準(zhǔn)差大約是15元,我們希望樣本均值與總體均值的差距最好不要多過3元。應(yīng)該抽取多少名工人來研究?如果置信度為95%n=(1.96σ/e)2=(1.96×15÷3)2
=96如果可信度為99%,則n=(2.58σ/e)2
=166算例4我們想調(diào)查某地區(qū)工人的平均工資,根據(jù)前人研究,該地區(qū)工比例間距估計樣本大小的決定原理與均值間距估計樣本大小的決定一樣。例:研究某地區(qū)工人有多少是滿意目前的工作環(huán)境的,根據(jù)前人研究大概有60%的工人滿意目前的工作環(huán)境,要求本研究的可信度為95%,而且樣本比例與總體比例的差異不大于5%,要抽取多少名工人來研究?比例間距估計樣本大小的決定原理與均值間距估計樣本大小的決定一e=1.96(SE)σ2
=P(1-P)計算結(jié)果,當(dāng)可信度為95%時,n=(1.96)2(0.60)(1-0.60)/(0.05)2=369當(dāng)可信度為99%時,n=(2.58)2(0.60)(1-0.60)/(0.05)2=639可見,要求的可信度越高,樣本要越大。e=1.96(SE)上面的公式要求我們推測總體P值。如果有困難,可改用比較保守的方法,就是上一節(jié)所講的,以P=0.50代入公式中,得到一個更大的樣本。如上面例題,95%的可信度:n=(1.96)2(0.50)(1-0.50)/(0.05)2
=384上面的公式要求我們推測總體P值。如果有困難,可改用比較保守的決定樣本大小要注意的問題一、以統(tǒng)計公式來推斷樣本的大小,最大的困難是要先推測若干總體參數(shù)值,如標(biāo)準(zhǔn)差、比例等。倘若我們的推測犯錯誤,決定的樣本大小就有問題。較為適當(dāng)?shù)淖龇ㄊ牵环矫鎱⒖冀y(tǒng)計公式算得的結(jié)果,另一方面看能夠付得起多少研究代價,然后決定樣本的大小。例如根據(jù)公式推測n=369,如果研究經(jīng)費(fèi)許可,可以決定樣本的大小為400,甚至500。決策時,寧多勿少。決定樣本大小要注意的問題一、以統(tǒng)計公式來推斷樣本的大小,最大決定樣本大小要注意的問題二、每一項調(diào)查研究都包括多個變量,我們應(yīng)該根據(jù)哪一個變量來計算樣本的大小呢?同樣是前述工人的例子,如果根據(jù)工資變量,n=96,如果根據(jù)滿意工作環(huán)境變量,則n=369。因此,大部分的社會學(xué)研究是難于應(yīng)用統(tǒng)計公式的。如果一定要應(yīng)用公式來決定樣本的大小,通常以樣本中最重要的變量作為準(zhǔn)則,而且只是作為參考用。決定樣本大小要注意的問題二、每一項調(diào)查研究都包括多個變量,我決定樣本大小要注意的問題三、決定樣本的大小,還要考慮日后采用的資料分析方法。如果計劃采用多變量分析法或每個變量的分類都很精細(xì),就要選用一個較大的樣本,才能提供足夠的分析材料。決定樣本大小要注意的問題三、決定樣本的大小,還要考慮日后采用算例5一家廣告公想估計某類商店去年所花的平均廣告費(fèi)用有多少。經(jīng)驗表明,總體方差約為1800000元。如置信度取95%,并要使估計處在總體平均值附近500元的范圍內(nèi),這家廣告公司應(yīng)抽多大的樣本?N≈28算例5一家廣告公想估計某類商店去年所花的平均廣告費(fèi)用有多少。算例6一家市場調(diào)研公司想估計某地區(qū)有彩色電視機(jī)的家庭所占的比例。該公司希望對比例p的估計誤差不超過0.05,要求的可靠程度為95%,應(yīng)抽多大容量的樣本(沒有可利用的p估計值)。N≈385算例6一家市場調(diào)研公司想估計某地區(qū)有彩色電視機(jī)的家庭所占的比算例7某工廠374名工人的平均年齡為36.24歲,標(biāo)準(zhǔn)差為10.32歲,分別求當(dāng)可信度為95%和99%時工人平均年齡的可信間距,并對結(jié)果加以比較。95%——(35.20,37.28)99%——(34.86,37.62)算例7某工廠374名工人的平均年齡為36.24歲,標(biāo)準(zhǔn)差為1算例8計劃研究某社區(qū)男性青年的結(jié)婚年齡,容許樣本平均結(jié)婚年齡與總體平均年齡的誤差為1歲。在試調(diào)查中求得結(jié)婚年齡的標(biāo)準(zhǔn)差為3歲。計算當(dāng)可信度為99%時,應(yīng)抽取多少樣本。N=60算例8計劃研究某社區(qū)男性青年的結(jié)婚年齡,容許樣本平均結(jié)婚年齡算例9計劃研究某地區(qū)的性別比例。容許樣本男性所占的百分比與總體的百分比的誤差是3。在試調(diào)查中求得男性所占的百分比是45%。計算當(dāng)可信區(qū)間為99%時,應(yīng)抽取多少樣本。N=1831算例9計劃研究某地區(qū)的性別比例。容許樣本男性所占的百分比與總再見再見第五章參數(shù)估計第一節(jié)參數(shù)估計基本方法第二節(jié)總體均值和總體比例的區(qū)間估計第五章參數(shù)估計第一節(jié)參數(shù)估計的基本方法推斷統(tǒng)計就是根據(jù)抽樣分布的原理進(jìn)行的。推斷統(tǒng)計分為兩大類:參數(shù)估計:根據(jù)一個隨機(jī)樣本的統(tǒng)計值來估計總體之參數(shù)值是多少。先看樣本情況,再推總體情況。假設(shè)檢驗:首先假設(shè)總體的情況是怎樣的,然后以一個隨機(jī)樣本的統(tǒng)計值來檢驗這個假設(shè)是否正確。第一節(jié)參數(shù)估計的基本方法推斷統(tǒng)計就是根據(jù)抽樣分布的原理進(jìn)行的第一節(jié)參數(shù)估計的基本方法只要采用隨機(jī)抽樣法,就可根據(jù)抽樣分布,以樣本統(tǒng)計值來推測總體情況。即根據(jù)一個隨機(jī)樣本的統(tǒng)計值來估計總體參數(shù)是多少。參數(shù)估計方法:1.點(diǎn)估計:以一個最適當(dāng)?shù)臉颖窘y(tǒng)計值來代表總體的參數(shù)值;2.區(qū)間估計:以一個區(qū)間去估計總體參數(shù)值;第一節(jié)參數(shù)估計的基本方法只要采用隨機(jī)抽樣法,就可根據(jù)抽樣分布一、點(diǎn)估計從總體中抽取一個樣本,根據(jù)該樣本的統(tǒng)計量對總體的未知參數(shù)作出一個數(shù)值點(diǎn)的估計,用于估計總體某一參數(shù)的隨機(jī)變量;例如:用樣本均值作為總體未知均值的估計值就是一個點(diǎn)估計。樣本越大,抽樣方法越嚴(yán)謹(jǐn),點(diǎn)估計越可信。一、點(diǎn)估計從總體中抽取一個樣本,根據(jù)該樣本的統(tǒng)計量對總體的未點(diǎn)估計的缺陷
抽樣誤差總是難免的。點(diǎn)估計沒給出估計值接近總體未知參數(shù)程度的信息,即估計的可信程度很難確定。點(diǎn)估計的缺陷抽樣誤差總是難免的。二、區(qū)間估計1.根據(jù)一個樣本的觀察值給出總體參數(shù)的估計范圍2.給出總體參數(shù)落在這一區(qū)間的概率3.例如:總體均值落在50~70之間,可信度為95%樣本統(tǒng)計量
(點(diǎn)估計)置信區(qū)間置信下限置信上限二、區(qū)間估計1.根據(jù)一個樣本的觀察值給出總體參數(shù)的估計范圍樣總體未知參數(shù)落在某區(qū)間內(nèi)的概率表示為(1-×100為顯著性水平,是總體參數(shù)未在區(qū)間內(nèi)的概率常用的可信度值有99%,95%;相應(yīng)的為0.01,0.05??尚哦龋ㄖ眯潘剑?/p>
總體未知參數(shù)落在某區(qū)間內(nèi)的概率可信度(置信水平)正態(tài)分布落在總體均值某一區(qū)間內(nèi)的樣本X95%的樣本-1.96
+1.9699%的樣本-2.58+2.5890%的樣本-1.65+1.65正態(tài)分布落在總體均值某一區(qū)間內(nèi)的樣本X95%的樣本-總體均值的間距估計假定條件總體服從正態(tài)分布,且總體方差(2)已知如果不是正態(tài)分布,可以由正態(tài)分布來近似(n
≥30)總體均值的間距估計假定條件均值的間距估計可用下面公式計算可信間距:當(dāng)可信度為99%時,Z取±2.58均值的間距估計可用下面公式計算可信間距:間距的大小與可信度成正比不難理解:在估計時所用的間距如果很小,錯誤的機(jī)會當(dāng)然較大,可信度自然較低。應(yīng)用間距估計法時,可以選用任意的可信度,但一般用95%或99%。間距的大小與可信度成正比總體均值的間距估計某行業(yè)職工日工資收入服從正態(tài)分布,從該行業(yè)職工中隨機(jī)抽取9人,測得其平均日工資收入為21.4元。已知總體標(biāo)準(zhǔn)差=0.15元,試估計建立該行業(yè)職工日均收入的置信區(qū)間,給定置信水平為0.95。我們可以95%的概率保證該行業(yè)職工日均工資在21.302~21.498元之間總體均值的間距估計某行業(yè)職工日工資收入服從正態(tài)分布,從該行業(yè)均值抽樣分布的標(biāo)準(zhǔn)差,稱為均值的標(biāo)準(zhǔn)誤:計算方法是用總體的標(biāo)準(zhǔn)差除以樣本大小(n)的的平方根。然而,總體的標(biāo)準(zhǔn)差很難知道,如果樣本相當(dāng)大,通常以樣本的標(biāo)準(zhǔn)差S作為總體的標(biāo)準(zhǔn)差σ。但是,這種做法有將實際的標(biāo)準(zhǔn)誤估計得稍偏。因為樣本標(biāo)準(zhǔn)差傾向稍小于總體標(biāo)準(zhǔn)差。為彌補(bǔ)這個差異,在計算樣本標(biāo)準(zhǔn)差時,除以n-1而不是n。這樣就可以得到總體方差和標(biāo)準(zhǔn)差的無偏估計。均值抽樣分布的標(biāo)準(zhǔn)差,稱為均值的標(biāo)準(zhǔn)誤:計算方法是用總體的標(biāo)此處的“n-1”稱為“自由度”。此處的“n-1”稱為“自由度”。
第一,自由度的產(chǎn)生是與抽樣分布聯(lián)系在一起的。因為從總體中抽取樣本,因而我們需要計算樣本的“統(tǒng)計量”,“統(tǒng)計量”是研究者通過調(diào)查樣本數(shù)據(jù)人為地計算出來的,而“參數(shù)”是被調(diào)查者的總體所客觀存在的,這是兩者的區(qū)別。在統(tǒng)計學(xué)的理論層面上,要求統(tǒng)計量是參數(shù)的無偏估計,認(rèn)為兩者是相等的。在實際研究中,由于抽樣的誤差可能導(dǎo)致兩者的不相等,但對于這種情況,研究者是無法知道的,否則就沒有抽樣的必要了。在理論假設(shè)下,統(tǒng)計量和參數(shù)一樣被看作是客觀的、確定性的。第一,自由度的產(chǎn)生是與抽樣分布聯(lián)系在一起的。因為從總體中抽
第二,既然在理論上統(tǒng)計量被要求是確定的,那么在實際層面上計算統(tǒng)計量的那組數(shù)據(jù)就不是完全自由的。這一點(diǎn)很重要,因為“自由度”中“自由”的含義就是相對這個“確定”而言的。正是統(tǒng)計量的這個“確定性”限制了與之相關(guān)的一組數(shù)據(jù)的“自由度”,也就是說,一組數(shù)據(jù)不是可以完全自由取值的,它必須支持“統(tǒng)計量與總體參數(shù)相等”的理論假設(shè)。這就是“自由度”存在的理由。第二,既然在理論上統(tǒng)計量被要求是確定的,那么在實際層面上計
研究者對某一社區(qū)內(nèi)居民家庭的收入狀況進(jìn)行調(diào)查,該社區(qū)共有1000戶,采取隨機(jī)抽取的方式對100戶進(jìn)行了調(diào)查。在這個例子中,總體1000戶的收入的平均數(shù)是總體參數(shù),是客觀的、確定的,盡管研究者不知道。通過隨機(jī)抽樣和入戶問卷調(diào)查,研究者獲得了100戶的收入數(shù)據(jù)。運(yùn)用這組數(shù)據(jù)可以算出樣本的平均數(shù),它是統(tǒng)計量。由于在理論上要求統(tǒng)計量與參數(shù)相等。當(dāng)99個數(shù)據(jù)被選擇以后,第100個數(shù)據(jù)就是確定的,所以,這組數(shù)據(jù)在求平均數(shù)這統(tǒng)計量時的自由度就是:k=100-1=99。研究者對某一社區(qū)內(nèi)居民家庭的收入狀況進(jìn)行調(diào)查,該社區(qū)共有1t分布以均值標(biāo)準(zhǔn)誤的估計作為分母計算的值,不完全符合Z分布或者說標(biāo)準(zhǔn)正態(tài)分布,我們給這個分布起個名字,叫做t分布。t值符合t分布。n-1被稱作自由度,自由度不同t分布的形狀有差異。隨著樣本規(guī)模增大,也就是自由度的增大,t分布會變得更加近似于標(biāo)準(zhǔn)正態(tài)分布。t分布以均值標(biāo)準(zhǔn)誤的估計作為分母計算的值,不完全符總體均值的間距估計例題:我們欲了解某地區(qū)家庭用于請客送禮的每月平均支出(μ)情況,現(xiàn)從該地區(qū)抽取一個樣本是:n=226戶,=43元,S=10.5。則可信度為95%的間距估計值為?總體均值的間距估計例題:
41.63≤M≤44.37當(dāng)可信度為99%時的間距估計值是多少?41.63≤M≤44.37影響可信間距寬度的因素:數(shù)據(jù)的離散程度,用來測度;樣本容量n;置信水平(1-),影響Z的取值。影響可信間距寬度的因素:算例1某大學(xué)從該校學(xué)生中隨機(jī)抽取100人,調(diào)查到他們平均每天參加體育鍛煉的時間為26分鐘。試以95%的置信水平估計該大學(xué)全體學(xué)生平均每天參加體育鍛煉的時間(已知總體方差為36分鐘)。我們可以95%的概率保證平均每天參加鍛煉的時間在24.824~27.176分鐘之間算例1某大學(xué)從該校學(xué)生中隨機(jī)抽取100人,調(diào)查到他們平均每天算例2從一個正態(tài)總體中抽取一個隨機(jī)樣本,
n=25,其均值`x=50,標(biāo)準(zhǔn)差s=8。建立總體均值m
的95%的置信區(qū)間。我們可以95%的概率保證總體均值在46.69~53.30之間算例2從一個正態(tài)總體中抽取一個隨機(jī)樣本,四、總體比例的間距估計我們要估計某城鎮(zhèn)有多少家庭是不和睦的?,F(xiàn)一個隨機(jī)樣本(n=100)中知道有20.0%的家庭不和,請估計該城鎮(zhèn)總體家庭不和睦情況。要求置信度是95%。四、總體比例的間距估計我們要估計某城鎮(zhèn)有多少家庭是不和睦的。估計總體的比例或百分率,其邏輯基本上與估計均值的相同。如果樣本頗大,百分率(或比例)的抽樣分布會近似正態(tài)分布,各個樣本的百分率都對稱地散布于總體百分率的兩旁。其標(biāo)準(zhǔn)誤差是:其中P是總體的比例(即百分率)。由于難以知道P的數(shù)值,樣本相當(dāng)大時,樣本中的比例可以代替總體中的比例P??傮w比例區(qū)間估計:估計總體的比例或百分率,其邏輯基本上與估計均值的相同。如果樣總體比例的間距估計我們要估計某城鎮(zhèn)有多少家庭是不和睦的?,F(xiàn)一個隨機(jī)樣本(n=100)中知道有20.0%的家庭不和,請估計該城鎮(zhèn)總體家庭不和睦情況。要求置信度是95%。0.122≤P≤0.278總體比例的間距估計我們要估計某城鎮(zhèn)有多少家庭是不和睦的?,F(xiàn)一總體比例的間距估計上面的方法,是在Sp公式中以樣本
值代替總體P值。如果樣本相當(dāng)大,這個方法是可以的。另一個較為保守的做法,是以P=0.50代入SE公式,使SE達(dá)到最大值,再將SE值代入可信間距公式就獲得最大的間距,以之來估計參數(shù)值最安全。如上述家庭不和睦的例子:
0.071≤P≤0.329總體比例的間距估計上面的方法,是在Sp公式中以樣本值代算例3某企業(yè)在一項關(guān)于職工流動原因的研究中,從該企業(yè)前職工的總體中隨機(jī)選取了200人組成一個樣本。在對其進(jìn)行訪問時,有140人說他們離開該企業(yè)是由于同管理人員不能融洽相處。試估計由于這種原因而離開該企業(yè)的人員的比例(95%的置信度)。我們可以95%的概率保證該企業(yè)職工由于同管理人員不能融洽相處而離開的比例在63.6%~76.4%之間算例3某企業(yè)在一項關(guān)于職工流動原因的研究中,從該企業(yè)前職工的第三節(jié)決定樣本的大小樣本越大越好在能夠付出的研究代價的限度內(nèi),選取最大的樣本。除此之外的兩個標(biāo)準(zhǔn):1、我們愿意容忍多少錯誤2、所研究的個案之間的相互差異有多大第三節(jié)決定樣本的大小樣本越大越好均值間距估計樣本大小的決定某變量X總體均值為μ,一個隨機(jī)抽取樣本的均值為抽樣均值與總體均值的差就是錯誤e,如果用絕對值表示如下:e=|-μ|均值間距估計樣本大小的決定某變量X總體均值為μ,一個隨機(jī)抽均值間距估計樣本大小的決定假定我們知道總體的標(biāo)準(zhǔn)差σ的數(shù)值,則在估計總體的均值時,95%的可信度間距為:
均值間距估計樣本大小的決定假定我們知道總體的標(biāo)準(zhǔn)差σ的數(shù)值,均值間距估計樣本大小的決定在上述公式中,容忍錯誤的大小可以隨研究的需要來決定,但標(biāo)準(zhǔn)差σ的值卻難以確定,原則上用總體的標(biāo)準(zhǔn)差,如果不知道,只有參考前人的研究或自己進(jìn)行試點(diǎn)研究,依據(jù)這些研究計算出來的標(biāo)準(zhǔn)差數(shù)值,盡可能猜想總體的標(biāo)準(zhǔn)差是多少。這項猜想工作不容易,準(zhǔn)確性也有疑問。所以社會學(xué)研究多不用此公式來決定樣本的大小,但以之作參考只用是可以的。均值間距估計樣本大小的決定在上述公式中,容忍錯誤的大小可以隨算例4我們想調(diào)查某地區(qū)工人的平均工資,根據(jù)前人研究,該地區(qū)工人工資變量的標(biāo)準(zhǔn)差大約是15元,我們希望樣本均值與總體均值的差距最好不要多過3元。應(yīng)該抽取多少名工人來研究?如果置信度為95%n=(1.96σ/e)2=(1.96×15÷3)2
=96如果可信度為99%,則n=(2.58σ/e)2
=166算例4我們想調(diào)查某地區(qū)工人的平均工資,根據(jù)前人研究,該地區(qū)工比例間距估計樣本大小的決定原理與均值間距估計樣本大小的決定一樣。例:研究某地區(qū)工人有多少是滿意目前的工作環(huán)境的,根據(jù)前人研究大概有60%的工人滿意目前的工作環(huán)境,要求本研究的可信度為95%,而且樣本比例與總體比例的差異不大于5%,要抽取多少名工人來研究?比例間距估計樣本大小的決定原理與均值間距估計樣本大小的決定一e=1.96(SE)σ2
=P(1-P)計算結(jié)果,當(dāng)可信度為95%時,n=(1.96)2(0.60)(1-0.60)/(0.05)2=369當(dāng)可信度為99%時,n=(2.58)2(0.60)(1-0.60)/(0.05)2=639可見,要求的可信度越高,樣本要越大。e=1.96(SE)上面的公式要求我們推測總體P值。如果有困難,可改用比較保守的方法,就是上一節(jié)所講的,以P=0.50代入公式中,得到一個更大的樣本。如上面例
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- hCAI-II-IN-10-生命科學(xué)試劑-MCE
- CRX-527-生命科學(xué)試劑-MCE
- 1-2-Dioleoyl-3-caprin-1-2-Dioleoyl-3-decanoyl-rac-glycerol-生命科學(xué)試劑-MCE
- 科技生活下的健康飲食與營養(yǎng)搭配
- 香米購買合同范本
- 酒店員工勞動合同管理規(guī)定制度
- 現(xiàn)代商業(yè)組織結(jié)構(gòu)與管理模式探索
- 工程代工合同范本
- 2025年度水產(chǎn)養(yǎng)殖人才培養(yǎng)與交流合作協(xié)議合同
- 科技安全從網(wǎng)絡(luò)安全技術(shù)培訓(xùn)開始
- 三年級體育下冊全冊教案
- 2024年八年級語文下冊《經(jīng)典常談》第一章《說文解字》練習(xí)題卷附答案
- 人教版數(shù)學(xué)六年級下冊全冊核心素養(yǎng)目標(biāo)教學(xué)設(shè)計
- (研究生)商業(yè)倫理與會計職業(yè)道德ppt教學(xué)課件(完整版)
- 二年級科學(xué)上冊期末考試質(zhì)量分析
- 相聲《治病》
- 行動學(xué)習(xí)-組織能力提升新境界培訓(xùn)課件.ppt
- QTD01鋼質(zhì)無縫氣瓶檢驗工藝指導(dǎo)書課件
- 投資入股協(xié)議書樣本通用版
- 中學(xué)部春季學(xué)期升旗主題、班會課安排
- 論自然(美)愛默生
評論
0/150
提交評論