單變量描述統(tǒng)計(jì)課件_第1頁
單變量描述統(tǒng)計(jì)課件_第2頁
單變量描述統(tǒng)計(jì)課件_第3頁
單變量描述統(tǒng)計(jì)課件_第4頁
單變量描述統(tǒng)計(jì)課件_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

資料的統(tǒng)計(jì)與初步分析(之一)

??單變量描述統(tǒng)計(jì)資料的統(tǒng)計(jì)與初步分析(之一)

??單變量描述統(tǒng)計(jì)1一、單變量統(tǒng)計(jì)類型

二、描述統(tǒng)計(jì)(一)集中趨勢分析

1、頻數(shù)分布與頻率分布[主要適用于定類尺度變量的描述]——單變量分析一、單變量統(tǒng)計(jì)類型二、描述統(tǒng)計(jì)——單變量分析22、集中趨勢分析的概念:是用一個(gè)典型值或代表值來反映數(shù)據(jù)的一般水平,或者說反映這組數(shù)據(jù)向這個(gè)典型值集中的情況。3、常用集中量數(shù)2、集中趨勢分析的概念:是用一個(gè)典型值或代表值來反映數(shù)據(jù)的一3(二)離散趨勢分析

1、含義

2、常用離中量數(shù)(二)離散趨勢分析

1、含義

2、常用離中4(三)相關(guān)操作如何利用SPSS生成頻數(shù)/頻率表實(shí)例:對變量“文化程度”進(jìn)行頻數(shù)統(tǒng)計(jì)。操作步驟:單擊Analyze→DescriptiveStatistics→Frequencies…,此時(shí)會(huì)出現(xiàn)Frequencies對話框:(三)相關(guān)操作5將變量“文化程度”從對話框左邊的變量列表選入右邊的方框內(nèi)→點(diǎn)擊OK,便可得到如下頻數(shù)與頻率表。將變量“文化程度”從對話框左邊的變量列表選入右邊的方框內(nèi)→點(diǎn)6統(tǒng)計(jì)表中的英—中文對譯:Frequency:頻次Percent:百分比ValidPercent:有效百分比CumulativePercent:累計(jì)百分比Valid:有效值Missing:缺失值Total:合計(jì)統(tǒng)計(jì)表中的英—中文對譯:7如何利用SPSS求集中量數(shù)實(shí)例:求“年齡”這一變量的集中量數(shù)。操作步驟如下:第一步:單擊Analyze→DescriptiveStatistics→Frequencies…,此時(shí)會(huì)出現(xiàn)Frequencies對話框,將變量“年齡”從對話框左邊的變量列表選入右邊的Variable(s):框內(nèi)→OK,如下圖所示:如何利用SPSS求集中量數(shù)8第二步:單擊“Statistics…”按鈕,出現(xiàn)如下對話框:

第二步:單擊“Statistics…”按鈕,出現(xiàn)如下對話框:9第三步:根據(jù)需要選擇集中趨勢統(tǒng)計(jì)量由于“年齡”是一個(gè)定距級以上的變量,所以從理論上講剛才所介紹的集中量數(shù)都可以選擇。不過實(shí)務(wù)操作中一般不選Mode和Sum(請同學(xué)們思考這是為什么)。第四步:單擊“Continue”→“OK”即可。第三步:根據(jù)需要選擇集中趨勢統(tǒng)計(jì)量10統(tǒng)計(jì)表中的英—中文對譯:

PercentileValues(百分位計(jì)算)框

Quartiles(四分位數(shù))

Cutpointsfor:□equalgroups(若干等分位數(shù),默認(rèn)為10分位數(shù))

Percentile(s):不定分位數(shù),如求第5%和95%位置上的值。CentralTendency(集中趨勢測量的統(tǒng)計(jì)量)框

Mean(均值)

Median(中位數(shù))

Mode(眾數(shù))

Sum(總和)統(tǒng)計(jì)表中的英—中文對譯:11如何利用SPSS求離中量數(shù)實(shí)例:求“年齡”這一變量的離中量數(shù)。操作步驟如下:第一步:操作與前面所講的求“年齡”這一變量的集中量數(shù)完全相同。第二步:操作與前面所講的求“年齡”這一變量的集中量數(shù)完全相同。統(tǒng)計(jì)表中的英—中文對譯:

Dispersion(離散趨勢測量的統(tǒng)計(jì)量)框

Std.deviation(標(biāo)準(zhǔn)差)

Variance(方差)

Range(全距)

Minimum(最小值)

Maximum(最大值)

S.E.mean(均值的標(biāo)準(zhǔn)誤)第三步:根據(jù)需要選擇離散趨勢統(tǒng)計(jì)量由于“年齡”是一個(gè)定距級以上的變量,所以從理論上講剛才所介紹的離中量數(shù)都可以選擇。不過實(shí)務(wù)操作中一般不選異眾比率(請同學(xué)們思考這是為什么)。

第四步:單擊“Continue”→“OK”即可。如何利用SPSS求離中量數(shù)12實(shí)訓(xùn)單變量描述統(tǒng)計(jì)上機(jī)操作。實(shí)訓(xùn)單變量描述統(tǒng)計(jì)上機(jī)操作。13資料的統(tǒng)計(jì)與初步分析(之二)

——單變量推論統(tǒng)計(jì)之區(qū)間估計(jì)區(qū)間估計(jì)1、含義就是在一定的可信度(置信度)下,用樣本統(tǒng)計(jì)值的某個(gè)范圍(置信區(qū)間)來“框”住總體的參數(shù)值。2、常用的置信度:90%,95%、99%,對應(yīng)的允許誤差分別為10%,5%,1%。置信度P=1-

資料的統(tǒng)計(jì)與初步分析(之二)

——單變量推論統(tǒng)計(jì)之區(qū)間估計(jì)143、總體均值的區(qū)間估計(jì)公式:

——樣本均值

——置信度為所的Z值S——樣本標(biāo)準(zhǔn)差N——樣本規(guī)模3、總體均值的區(qū)間估計(jì)15

例1:調(diào)查某廠職工的工資狀況,隨機(jī)抽取900名工人作樣本,調(diào)查得到他們的月平均工資為186元,標(biāo)準(zhǔn)差為42元。求在95%的置信度下,全廠職工的月平均工資的置信區(qū)間是多少?例1:調(diào)查某廠職工的工資狀況,隨機(jī)抽取900名工人作樣本,16學(xué)生練習(xí):從某工廠隨機(jī)抽取400名工人進(jìn)行調(diào)查,結(jié)果表明女工的比例為20%,現(xiàn)在要求90%的置信度下,估計(jì)全廠工人中女工比例的置信區(qū)間。學(xué)生練習(xí):從某工廠隨機(jī)抽取400名工人進(jìn)行調(diào)查,結(jié)果表明女工174、總體百分比的區(qū)間估計(jì)公式:P——樣本中的百分比4、總體百分比的區(qū)間估計(jì)18例:調(diào)查某廠職工的工資狀況,隨機(jī)抽取900名工人作樣本,調(diào)查得到他們的月平均工資為186元,標(biāo)準(zhǔn)差為42元。求在95%的置信度下,全廠職工的月平均工資的置信區(qū)間是多少?例:調(diào)查某廠職工的工資狀況,隨機(jī)抽取900名工人作樣本,調(diào)查19課堂練習(xí)1、根據(jù)居民區(qū)100戶抽樣家計(jì)調(diào)查,居民用于食品費(fèi)用占總收入的比例平均為75﹪,比例的標(biāo)準(zhǔn)差為20﹪,求食品費(fèi)用占居民總收入比例的區(qū)間估計(jì)(置信度為95﹪時(shí))。課堂練習(xí)1、根據(jù)居民區(qū)100戶抽樣家計(jì)調(diào)查,居民用于食品費(fèi)用20資料的統(tǒng)計(jì)與初步分析(之三)

——單變量推論統(tǒng)計(jì)之假設(shè)檢驗(yàn)資料的統(tǒng)計(jì)與初步分析(之三)21假設(shè)檢驗(yàn)

1、假設(shè)含義:此是指和抽樣手段聯(lián)系在一起,并且依靠抽樣調(diào)查的數(shù)據(jù)進(jìn)行驗(yàn)證的經(jīng)驗(yàn)層次的假設(shè),即統(tǒng)計(jì)假設(shè)。(與理論假設(shè)不同)

2、假設(shè)檢驗(yàn):就是先對總體的某一參數(shù)作出假設(shè),然后樣本的統(tǒng)計(jì)量去進(jìn)行驗(yàn)證,以決定假設(shè)是否為總體所接受。3、基本思想依據(jù):小概率原理(即“小概率事件在一次觀察中不可能出現(xiàn)”原理)假設(shè)檢驗(yàn)1、假設(shè)含義:此是指和抽樣手段聯(lián)系在一起,并且依靠224、步驟①建立虛無假設(shè)(H:M=

或P=

)與研究假設(shè)(:

或P<、>、≠

)②選擇適當(dāng)?shù)娘@著性水平(即小概率的大小)=0.05、=0.01等。統(tǒng)計(jì)值的計(jì)算公式:Z=

Z=③根據(jù)樣本數(shù)據(jù)計(jì)算統(tǒng)計(jì)值,并根據(jù)顯著性水平查出對應(yīng)的臨界值。④比較統(tǒng)計(jì)值與臨界值,若統(tǒng)計(jì)值的絕對值或,則接受虛無假設(shè):若或,則接受研究假設(shè)。4、步驟23例如:(1)總體均值的假設(shè)檢驗(yàn)?zāi)硢挝宦毠ど显缕骄杖霝?10元,本月調(diào)查了100名職工,平均月收入為220元,標(biāo)準(zhǔn)差為15元。問職工總體的收入本月與上月相比有無變化?解:設(shè)H:M=210:210選擇顯著性水平=0.05,查Z檢驗(yàn)表得Z=1.96根據(jù)樣本數(shù)據(jù)計(jì)算統(tǒng)計(jì)值,代入公式得

Z=

——

樣本均值

M——

原值(總體原均值)

s——

樣本標(biāo)準(zhǔn)差

n——

樣本規(guī)模由于Z=6.67>Z=1.96,所以拒絕虛無假設(shè),接受研究假設(shè)。即從總體上說,職工本月收入與上月收入有變化。例如:(1)總體均值的假設(shè)檢驗(yàn)24例如:(2)總體百分比的假設(shè)檢驗(yàn)?zāi)承Hw學(xué)生中抽煙比例為35%,經(jīng)過戒煙宣傳后,隨機(jī)抽取100名學(xué)生進(jìn)行調(diào)查,結(jié)果發(fā)現(xiàn)抽煙比例為25%。問戒煙宣傳有效嗎?解:設(shè)H:P=0.35:P<0.35

選擇=0.05,查Z檢驗(yàn)表得Z=1.65統(tǒng)計(jì)值Z==由于Z=1.65所以,拒絕虛無假設(shè),接受研究假設(shè)。即戒煙宣傳有效。例如:(2)總體百分比的假設(shè)檢驗(yàn)25實(shí)訓(xùn)單變量推論統(tǒng)計(jì)——假設(shè)檢驗(yàn)上機(jī)操作。實(shí)訓(xùn)單變量推論統(tǒng)計(jì)——假設(shè)檢驗(yàn)上機(jī)操作。26資料的統(tǒng)計(jì)與初步分析(之四)

——雙變量相關(guān)分析資料的統(tǒng)計(jì)與初步分析(之四)

——雙變量相關(guān)分析27學(xué)習(xí)目標(biāo):

培養(yǎng)資料的統(tǒng)計(jì)與分析能力學(xué)習(xí)目標(biāo):

培養(yǎng)資料的統(tǒng)計(jì)與分析能力28函數(shù)關(guān)系:事物之間具有完全確定的關(guān)系,即一一對應(yīng)的關(guān)系。相關(guān)關(guān)系:一個(gè)變量發(fā)生變化時(shí)(或取不同值時(shí)),另外一個(gè)變量也隨之發(fā)生變化(或取值也不同),反之也一樣。A、方向:正相關(guān):當(dāng)兩個(gè)變量的取值變化具有相同的變化的相關(guān)關(guān)系。負(fù)相關(guān):當(dāng)兩個(gè)變量的取值變化具有相反方向變化相關(guān)關(guān)系。

B、大?。豪孟嚓P(guān)系數(shù)因果關(guān)系:當(dāng)其中一個(gè)變量變化時(shí),會(huì)引起或?qū)е铝硗庖粋€(gè)變量也隨之發(fā)生變化,但是反過來,當(dāng)后一個(gè)變量發(fā)生變化時(shí),卻不會(huì)引起前一個(gè)變量的變化。(是特殊的相關(guān)關(guān)系)一、變量關(guān)系類型函數(shù)關(guān)系:事物之間具有完全確定的關(guān)系,即一一對應(yīng)的關(guān)系。一、29二、交互分類(Grossclassification)【只適用于定類、定序變量】二、交互分類(Grossclassification)30交互分類表的形式要求:(1)規(guī)范簡潔,最好不用豎線。(學(xué)術(shù)論文中常用三線表)(2)如果計(jì)算的是百分比,則要在表的下端用括號標(biāo)出每一縱欄所對應(yīng)的頻數(shù)。(3)常以自變量作縱欄標(biāo)題,以因變量作橫行標(biāo)題,并取縱欄%,即自變量為基準(zhǔn)計(jì)算%。(4)兩個(gè)變量的變量值應(yīng)有所限制。不能同時(shí)具有多個(gè)變量值。如果變量值都多,那么可采將某些變量值進(jìn)行合并的方法減少變量值,以縮小交互分類的規(guī)模。交互分類表的形式要求:31X檢驗(yàn)的具體步驟:①建立兩變量間無關(guān)系的假設(shè),即兩變量相互獨(dú)立,互不相關(guān)。②計(jì)算出X值。③根據(jù)自由度df=(r-1)(c-1)和給出的顯著性水平(α值),查X分布表,得臨界值。④將計(jì)算出的X值與查得的臨界值對比:若X值≥臨界值,則進(jìn)入否定域,稱差異顯著,并拒絕兩變量獨(dú)立的假設(shè),即承認(rèn)兩變量間有關(guān)系;若X值<臨界值,則稱差異不顯著,并接受兩變量獨(dú)立的假設(shè),即兩變量間無關(guān)系。說明:X≥臨界值,表明統(tǒng)計(jì)差異不在抽樣誤差允許的范圍內(nèi),即總體實(shí)際上存在差異,相關(guān),不獨(dú)立;X<臨界值,表明統(tǒng)計(jì)差異是由抽樣誤差造成的,總體實(shí)際上無顯著差異,不相關(guān),無關(guān)系。X檢驗(yàn)的具體步驟:①建立兩變量間無關(guān)系的假設(shè),即兩變量相互獨(dú)32三、定序變量與定序變量之間的相關(guān)測量1.Gamma系數(shù)(G或γ)公式:G=(N----同序?qū)?,N----異序?qū)Γ㎞=左上角頻數(shù)×右下角頻數(shù)N=右上角頻數(shù)×左下角頻數(shù)2.Gamma系數(shù)的檢驗(yàn)——Z檢驗(yàn)Z檢驗(yàn)的步驟:①先將G值標(biāo)準(zhǔn)化為Z值,公式為:Z=②選擇不同的顯著性水平,并查Z檢驗(yàn)表,假定=0.05,檢Z表得,Z=1.96。③將計(jì)算所得的Z值與查得的Z進(jìn)行對比。若Z≥Z,則進(jìn)入否定域,說明在總體中兩變量之間存在相關(guān)關(guān)系;若Z<Z,則說明在總體中兩變量之間不存在相關(guān)關(guān)系。三、定序變量與定序變量之間的相關(guān)測量1.Gamma系數(shù)(G或33四、定類(序)變量與定距變量之間的相關(guān)測量1.相關(guān)比率(CorrelationRatio)(記作E),又稱Eta平方系數(shù)。四、定類(序)變量與定距變量之間的相關(guān)測量1.相關(guān)比率(Co342.E

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論