教育評(píng)價(jià)信息的推斷性統(tǒng)計(jì)_第1頁(yè)
教育評(píng)價(jià)信息的推斷性統(tǒng)計(jì)_第2頁(yè)
教育評(píng)價(jià)信息的推斷性統(tǒng)計(jì)_第3頁(yè)
教育評(píng)價(jià)信息的推斷性統(tǒng)計(jì)_第4頁(yè)
教育評(píng)價(jià)信息的推斷性統(tǒng)計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩28頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

教育評(píng)價(jià)信息的推斷性統(tǒng)計(jì)第一頁(yè),共三十三頁(yè),2022年,8月28日6.1統(tǒng)計(jì)量的分布6.1.1總體的描述6.1.2樣本均值的分布6.1.3樣本方差的分布6.1.4統(tǒng)計(jì)量6.1.5F統(tǒng)計(jì)量第二頁(yè),共三十三頁(yè),2022年,8月28日6.1統(tǒng)計(jì)量的分布

推斷性統(tǒng)計(jì)是根據(jù)樣本提供的信息(樣本統(tǒng)計(jì)量或樣本分布),在一定的可靠性程度上對(duì)總體的特征(總體參數(shù)或總體分布)所進(jìn)行的估計(jì)或推測(cè)。第三頁(yè),共三十三頁(yè),2022年,8月28日總體的描述1.總體平均分樣本的平均分是根據(jù)樣本的觀察數(shù)據(jù)獲得的,類似地,總體的平均分是根據(jù)總體的觀察數(shù)據(jù)獲得的。一般用符號(hào)或表示總體平均分。2.總體的標(biāo)準(zhǔn)差和方差3.參數(shù)和統(tǒng)計(jì)量第四頁(yè),共三十三頁(yè),2022年,8月28日樣本均值的分布

設(shè)x1,x2,…,xn是總體x的一個(gè)容量為n的隨機(jī)樣本,統(tǒng)計(jì)量稱為樣本均值。第五頁(yè),共三十三頁(yè),2022年,8月28日樣本方差的分布

設(shè)x1,x2,…,xn是總體x的一個(gè)容量為n的隨機(jī)樣本,統(tǒng)計(jì)量稱為樣本方差。樣本方差的算術(shù)根s稱為樣本標(biāo)準(zhǔn)差。第六頁(yè),共三十三頁(yè),2022年,8月28日t統(tǒng)計(jì)量設(shè)x1,x2,…,xn是取自正態(tài)總體(,)的一個(gè)容量為的隨機(jī)樣本,與分別為樣本均值和樣本方差,可以證明,統(tǒng)計(jì)量第七頁(yè),共三十三頁(yè),2022年,8月28日F統(tǒng)計(jì)量第八頁(yè),共三十三頁(yè),2022年,8月28日6.2參數(shù)估計(jì)6.2.1參數(shù)點(diǎn)估計(jì)6.2.2參數(shù)區(qū)間估計(jì)第九頁(yè),共三十三頁(yè),2022年,8月28日6.2參數(shù)估計(jì)

參數(shù)估計(jì)就是根據(jù)樣本統(tǒng)計(jì)量去估計(jì)總體參數(shù)。例如,根據(jù)樣本平均數(shù)估計(jì)總體平均數(shù)等。參數(shù)估計(jì)可分為點(diǎn)估計(jì)和區(qū)間估計(jì)。第十頁(yè),共三十三頁(yè),2022年,8月28日參數(shù)點(diǎn)估計(jì)

直接用樣本統(tǒng)計(jì)量的值作為總體參數(shù)的估計(jì)值,稱為點(diǎn)估計(jì)。通常要估計(jì)的總體參數(shù)有:均值(數(shù)學(xué)期望)、方差、標(biāo)準(zhǔn)差、比例、相關(guān)系數(shù)等。第十一頁(yè),共三十三頁(yè),2022年,8月28日參數(shù)區(qū)間估計(jì)

區(qū)間估計(jì)就是在一定的可靠性程度上估計(jì)總體參數(shù)所在的范圍。這里,所謂估計(jì)的可靠性通常用概率來(lái)描述。例如,通過對(duì)113名6歲男孩的抽樣調(diào)查,以0.95的概率估計(jì)某市6歲男孩的平均身高在109.82~111.58厘米,就是區(qū)間估計(jì)。而這一估計(jì)正確的可能性,即可靠性是95%。第十二頁(yè),共三十三頁(yè),2022年,8月28日參數(shù)區(qū)間估計(jì)

對(duì)總體參數(shù)的區(qū)間估計(jì),必須首先明確相應(yīng)統(tǒng)計(jì)量的分布形態(tài)和特征,從而在一定的置信度下,推測(cè)樣本統(tǒng)計(jì)量將落在以總體參數(shù)為中心的一個(gè)什么樣的區(qū)間內(nèi)。然后通過對(duì)數(shù)學(xué)式子的簡(jiǎn)單變形,即可在同樣的置信度下,推測(cè)以樣本統(tǒng)計(jì)量的觀測(cè)值為中心的某個(gè)包含總體參數(shù)的區(qū)間范圍(置信區(qū)間)。第十三頁(yè),共三十三頁(yè),2022年,8月28日參數(shù)區(qū)間估計(jì)

1.單個(gè)總體均值的置信區(qū)間

2.兩個(gè)總體均值差異的置信區(qū)間

3.總體比例的區(qū)間估計(jì)第十四頁(yè),共三十三頁(yè),2022年,8月28日6.3參數(shù)假設(shè)檢驗(yàn)6.3.1假設(shè)檢驗(yàn)的基本原理6.3.2假設(shè)檢驗(yàn)的幾個(gè)基本概念6.3.3單總體的Z檢驗(yàn)和檢驗(yàn)6.3.4兩總體的檢驗(yàn)第十五頁(yè),共三十三頁(yè),2022年,8月28日6.3參數(shù)假設(shè)檢驗(yàn)

假設(shè)檢驗(yàn)與參數(shù)估計(jì)都屬于統(tǒng)計(jì)推斷的范疇,但它們的提法是不同的,處理問題的方法也各具特色。簡(jiǎn)單地說,參數(shù)假設(shè)檢驗(yàn)是檢驗(yàn)未知參數(shù)的假設(shè)成立與否,非參數(shù)檢驗(yàn)是檢驗(yàn)未知總體分布的假設(shè)成立與否。第十六頁(yè),共三十三頁(yè),2022年,8月28日假設(shè)檢驗(yàn)的幾個(gè)基本概念顯著性水平小概率原理雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)檢驗(yàn)的兩類錯(cuò)誤及控制第十七頁(yè),共三十三頁(yè),2022年,8月28日單總體的Z檢驗(yàn)和t檢驗(yàn)

單個(gè)樣本平均值假設(shè)檢驗(yàn)的方法有三種:?jiǎn)蝹€(gè)樣本Z檢驗(yàn)、單個(gè)樣本t檢驗(yàn)法和威爾科克森符號(hào)秩檢驗(yàn)(Wilcosonsignedranktest)。每一種方法都有兩種假設(shè)檢形式,即臨界值檢驗(yàn)法和P值法。這里主要介紹單個(gè)樣本Z檢驗(yàn)和單個(gè)樣本t檢驗(yàn)法。第十八頁(yè),共三十三頁(yè),2022年,8月28日單總體的Z檢驗(yàn)和t檢驗(yàn)1.總體標(biāo)準(zhǔn)差已知時(shí),單總體的Z檢驗(yàn)在某些情況下,當(dāng)校長(zhǎng)或教師將班級(jí)的考試結(jié)果與學(xué)校平均值進(jìn)行比較時(shí),考試機(jī)構(gòu)的研究人員和學(xué)科秘書將學(xué)校的考試結(jié)果與全市的平均值比較,或與市重點(diǎn)、省重點(diǎn)的平均值比較時(shí);教育行政部門領(lǐng)導(dǎo)將區(qū)、縣的平均成績(jī)與省、市的平均成績(jī)比較時(shí),可能知道全市、全省的平均分及標(biāo)準(zhǔn)差,這時(shí)的比較就屬于總體標(biāo)準(zhǔn)差已知的條件下,單個(gè)樣本平均值與總體比較。第十九頁(yè),共三十三頁(yè),2022年,8月28日單總體的Z檢驗(yàn)和t檢驗(yàn)用Z檢驗(yàn)法進(jìn)行假設(shè)檢驗(yàn)時(shí),應(yīng)注意以下幾點(diǎn):(1)樣本容量小于15時(shí),只有在研究的變量呈正態(tài)分布,或非常接近于正態(tài)分布時(shí),可以使用Z檢驗(yàn)法;(2)樣本容量在15到30之間時(shí),如果數(shù)據(jù)中不存在極大或極小值,或變量分布不明顯偏離正態(tài),可以使用Z檢驗(yàn)法;第二十頁(yè),共三十三頁(yè),2022年,8月28日單總體的Z檢驗(yàn)和t檢驗(yàn)

(3)樣本容量大于30時(shí),一般可以比較放心地應(yīng)用Z檢驗(yàn)法。但如果樣本中存在極大、極小值,且刪除這些極值不合理時(shí),應(yīng)該檢查極值對(duì)假設(shè)檢驗(yàn)的影響,即樣本中包含極值檢驗(yàn)一次,不包含極值再檢驗(yàn)一次,如果兩次檢驗(yàn)結(jié)果相同,那么可以認(rèn)為結(jié)論可靠。否則應(yīng)該得出更加保守的結(jié)論,或者采用其他方法進(jìn)行檢驗(yàn)。(4)如果樣本中含有極值,且可以將其合理刪除,剩余的樣本數(shù)據(jù)適合進(jìn)行Z檢驗(yàn),可以采用此方法。第二十一頁(yè),共三十三頁(yè),2022年,8月28日單總體的Z檢驗(yàn)和t檢驗(yàn)2.總體標(biāo)準(zhǔn)差未知時(shí),單總體的檢驗(yàn)在許多研究應(yīng)用中,總體的標(biāo)準(zhǔn)差是未知的。因而需要用樣本標(biāo)準(zhǔn)關(guān)代替總體標(biāo)準(zhǔn)差,相應(yīng)地,檢驗(yàn)統(tǒng)計(jì)量變成了統(tǒng)計(jì)量。第二十二頁(yè),共三十三頁(yè),2022年,8月28日兩總體的檢驗(yàn)1.相關(guān)樣本相關(guān)樣本是指兩個(gè)樣本內(nèi)個(gè)體之間存在著一一對(duì)應(yīng)關(guān)系,具體有兩種情況:用同一個(gè)測(cè)驗(yàn)對(duì)同一組被試前后進(jìn)行兩次測(cè)量,所獲得的兩組測(cè)量結(jié)果是相關(guān)樣本(同一被試組)。根據(jù)某些條件基本相同的原則,把被試一一匹配成對(duì),然后將每對(duì)被試隨機(jī)地分入兩個(gè)組,對(duì)兩組被試施以不同的處理后,用同一個(gè)測(cè)驗(yàn)所獲得的兩組測(cè)量結(jié)果,也是相關(guān)樣本(匹配被試組)。第二十三頁(yè),共三十三頁(yè),2022年,8月28日兩總體的檢驗(yàn)2.獨(dú)立樣本獨(dú)立樣本是指兩個(gè)樣本內(nèi)的個(gè)體是隨機(jī)抽取的,它們之間不存在一一對(duì)應(yīng)關(guān)系。獨(dú)立樣本檢驗(yàn)較為復(fù)雜,涉及兩個(gè)樣本所來(lái)自的兩個(gè)總體的方差是否齊性(即是否相等)。第二十四頁(yè),共三十三頁(yè),2022年,8月28日6.4非參數(shù)檢驗(yàn)6.4.1檢驗(yàn)6.4.2單一樣本K-S檢驗(yàn)6.4.3兩個(gè)獨(dú)立樣本的非參數(shù)檢驗(yàn)6.4.4兩個(gè)相關(guān)樣本的非參數(shù)檢驗(yàn)第二十五頁(yè),共三十三頁(yè),2022年,8月28日6.4非參數(shù)檢驗(yàn)

假設(shè)檢驗(yàn)分為參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)。參數(shù)檢驗(yàn)是根據(jù)樣本的統(tǒng)計(jì)量對(duì)關(guān)于相應(yīng)總體參數(shù)的假設(shè)進(jìn)行檢驗(yàn),它要求總體服從正態(tài)分布,適用于等距數(shù)據(jù)和比率數(shù)據(jù),檢驗(yàn)的靈敏度較高;而非參數(shù)檢驗(yàn)是指在總體不服從正態(tài)分布或分布情況不明時(shí),主要用來(lái)檢驗(yàn)數(shù)據(jù)是否來(lái)自同一個(gè)總體的假設(shè),其假定的前提比參數(shù)檢驗(yàn)少得多,也容易滿足,適用于各種類型的數(shù)據(jù),但檢驗(yàn)的靈敏度較差。第二十六頁(yè),共三十三頁(yè),2022年,8月28日6.4非參數(shù)檢驗(yàn)

在用SPSS工具時(shí),非參數(shù)檢驗(yàn)主要通過調(diào)用NonparametricTest菜單項(xiàng)來(lái)進(jìn)行,其中包括:Chi-squareTest:檢驗(yàn);BinomialTest:二項(xiàng)式檢驗(yàn);RunsTest:游程檢驗(yàn);第二十七頁(yè),共三十三頁(yè),2022年,8月28日6.4非參數(shù)檢驗(yàn)1-SampleK-STest:?jiǎn)我粯颖綤-S檢驗(yàn);2-IndependentSamplesTest:兩個(gè)獨(dú)立樣本非參數(shù)檢驗(yàn);K-IndependentSamplesTest:多個(gè)獨(dú)立樣本非參數(shù)檢驗(yàn);2-RelatedSamplesTest:兩個(gè)相關(guān)樣本非參數(shù)檢驗(yàn);K-RelatedSamplesTest:多個(gè)相關(guān)樣本非參數(shù)檢驗(yàn)。第二十八頁(yè),共三十三頁(yè),2022年,8月28日

檢驗(yàn)

檢驗(yàn)既可用于推斷某個(gè)變量是否服從某種特定分布的擬合度檢驗(yàn)(GoodnessofFitTest),也可用于推斷兩個(gè)離散型變量是否存在依從關(guān)系的獨(dú)立性檢驗(yàn)或推斷幾次重復(fù)試驗(yàn)的結(jié)果是否是相同的同質(zhì)性檢驗(yàn)。第二十九頁(yè),共三十三頁(yè),2022年,8月28日

檢驗(yàn)1.?dāng)M合度檢驗(yàn)所謂擬合,統(tǒng)計(jì)學(xué)上也稱為擬合度,即擬合的程度。當(dāng)總體分布未知時(shí),通過樣本有時(shí)可以猜測(cè)它們的分布是某種特定的分布。這種猜測(cè)是否合理就需要檢驗(yàn),這種檢驗(yàn)過程實(shí)際上是考察理論分布曲線和實(shí)際觀察曲線相適合的程度。2.獨(dú)立性或同質(zhì)性檢驗(yàn)第三十頁(yè),共三十三頁(yè),2022年,8月28日單一樣本K-S檢驗(yàn)

單一樣本K-S檢驗(yàn)以前蘇聯(lián)數(shù)學(xué)家Kolmogorov和Smirnov人名命名的,是柯爾莫哥洛夫-斯米爾諾夫非參數(shù)檢驗(yàn)的簡(jiǎn)稱。用以檢驗(yàn)?zāi)硞€(gè)樣本所來(lái)自的總體是否服從某一理論分布(如正態(tài)分布、均勻分布、泊松分布或指數(shù)分布)的分布擬合度檢驗(yàn)方法,其零假設(shè)為:樣本所來(lái)自的總體分布服從所指定的理論分布。第三十一頁(yè),共三十三頁(yè),2022年,8月28日兩個(gè)獨(dú)立樣本的非參數(shù)檢驗(yàn)

兩獨(dú)立樣本的差異顯著性檢驗(yàn)只有在滿足變量為正態(tài)分布的連續(xù)測(cè)量數(shù)據(jù)條件時(shí)才能進(jìn)行檢驗(yàn),如果兩個(gè)樣本所屬的總體分布類型不明,或兩個(gè)變量中至少有一個(gè)屬于離散型變量,這時(shí)要推斷樣本所來(lái)自的兩個(gè)總體分布是否存在顯著差異,或兩個(gè)總體的平均數(shù)或中位數(shù)是否存在顯著差異,就必須調(diào)用兩個(gè)獨(dú)立樣本的非參數(shù)檢驗(yàn),強(qiáng)行進(jìn)行檢驗(yàn)容易造成錯(cuò)誤的結(jié)論。其零假設(shè)為:兩個(gè)總體分布之間沒

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論