多元統(tǒng)計分析及SPSS應(yīng)用_第1頁
多元統(tǒng)計分析及SPSS應(yīng)用_第2頁
多元統(tǒng)計分析及SPSS應(yīng)用_第3頁
多元統(tǒng)計分析及SPSS應(yīng)用_第4頁
多元統(tǒng)計分析及SPSS應(yīng)用_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

session3

聚類分析

應(yīng)用多元統(tǒng)計分析及SPSS應(yīng)用

Session3統(tǒng)計數(shù)據(jù)的收集、整理與描述

目前一頁\總數(shù)四十頁\編于十九點SessionTopics統(tǒng)計數(shù)據(jù)的來源

統(tǒng)計數(shù)據(jù)的收集

統(tǒng)計數(shù)據(jù)的描述

統(tǒng)計數(shù)據(jù)的整理

目前二頁\總數(shù)四十頁\編于十九點統(tǒng)計數(shù)據(jù)的來源一、統(tǒng)計數(shù)據(jù)的直接來源來源于管理和研究需要而專門組織的調(diào)查來源于科學(xué)試驗的數(shù)據(jù)二、統(tǒng)計數(shù)據(jù)的間接來源來源于公開出版物的數(shù)據(jù)來源于內(nèi)部調(diào)查的數(shù)據(jù)目前三頁\總數(shù)四十頁\編于十九點統(tǒng)計數(shù)據(jù)的收集數(shù)據(jù)的搜集方法詢問調(diào)查訪問調(diào)查觀察實驗電話調(diào)查郵寄調(diào)查觀察電腦輔助座談會個別深訪實驗?zāi)壳八捻揬總數(shù)四十頁\編于十九點訪問調(diào)查

1. 調(diào)查者與被調(diào)查者通過面對面地交談而獲得資料2. 有標(biāo)準(zhǔn)式訪問和非標(biāo)準(zhǔn)式訪問標(biāo)準(zhǔn)式訪問通常按事先設(shè)計好的問卷進行非標(biāo)準(zhǔn)式訪問事先一般不制作問卷目前五頁\總數(shù)四十頁\編于十九點郵寄調(diào)查也稱郵寄問卷調(diào)查是一種標(biāo)準(zhǔn)化調(diào)查調(diào)查者與被調(diào)查者沒有直接的語言交流,信息的傳遞依賴于問卷通過某種方式將調(diào)查表或問卷送至某調(diào)查者手中,由被調(diào)查者填寫,然后將問卷寄回指定收集點問卷或表格的發(fā)放方式有郵寄、宣傳媒介傳送、專門場所分發(fā)三種

目前六頁\總數(shù)四十頁\編于十九點電話調(diào)查調(diào)查者利用電話與被調(diào)查者進行語言交流以獲得信息時效快、成本低問題的數(shù)量不宜過多

您好!我是××調(diào)查公司的調(diào)查員…目前七頁\總數(shù)四十頁\編于十九點電腦輔助調(diào)查又稱電腦輔助電話調(diào)查電腦與電話相結(jié)合完成調(diào)查的全過程一般需借助專門的軟件進行硬件設(shè)備要求較高

目前八頁\總數(shù)四十頁\編于十九點座談會1. 也稱集體訪談2. 將一組被調(diào)查者集中在調(diào)查現(xiàn)場,讓他們對調(diào)查的主題發(fā)表意見以獲得資料3. 參加座談會的人數(shù)不宜過多,一般為6~10人4. 側(cè)重于定性研究目前九頁\總數(shù)四十頁\編于十九點個別深度訪問

一次只有一名受訪者參加、針對特殊問題的調(diào)查適合于較隱秘的問題,如個人隱私問題;或較敏感的問題,如政治方面的問題側(cè)重于定性研究目前十頁\總數(shù)四十頁\編于十九點觀察法1. 就調(diào)查對象的行動和意識,調(diào)查人員邊觀察邊記錄以收集所需信息2. 調(diào)查人員不是強行介入3. 能夠在被調(diào)查者不察覺的情況下獲得資料目前十一頁\總數(shù)四十頁\編于十九點實驗法

1. 在設(shè)定的特殊實驗場所、特殊狀態(tài)下,對調(diào)查對象進行實驗以獲得所需資料2. 有室內(nèi)實驗法和市場實驗法目前十二頁\總數(shù)四十頁\編于十九點統(tǒng)計數(shù)據(jù)的間接來源1.公開出版物:《中國統(tǒng)計年鑒》、《中國統(tǒng)計摘要》、《中國社會統(tǒng)計年鑒》、《中國工業(yè)經(jīng)濟統(tǒng)計年鑒》、《中國農(nóng)村統(tǒng)計年鑒》、《中國人口統(tǒng)計年鑒》、《中國市場統(tǒng)計年鑒》、《世界經(jīng)濟年鑒》、《國外經(jīng)濟統(tǒng)計資料》、《世界發(fā)展報告》……Internet

2.

網(wǎng)絡(luò)中國統(tǒng)計年鑒2001中國人口統(tǒng)計年鑒中國市場統(tǒng)計年鑒世界發(fā)展報告世界經(jīng)濟年檢工業(yè)普查數(shù)據(jù)中國統(tǒng)計出版社目前十三頁\總數(shù)四十頁\編于十九點統(tǒng)計數(shù)據(jù)的整理一、統(tǒng)計分組

根據(jù)統(tǒng)計研究的目的和客觀現(xiàn)象的內(nèi)在特點,按某個標(biāo)(或幾個標(biāo)志)把被研究的總體劃分為若干個不同性質(zhì)的組,稱為統(tǒng)計分組。例:某班學(xué)生按考試成績分組目前十四頁\總數(shù)四十頁\編于十九點二、頻數(shù)分布與頻率分布將數(shù)據(jù)按其分組標(biāo)志進行分組的過程,就是頻數(shù)分布和頻率分布形成的過程。表示各組的單位的次數(shù)稱為頻數(shù),各組次數(shù)與總次數(shù)之比稱為頻率。目前十五頁\總數(shù)四十頁\編于十九點二、頻數(shù)分布與頻率分布頻數(shù)分布就是觀察值按其分組標(biāo)志分配在各組內(nèi)的次數(shù),由分組標(biāo)志序列和各組相對應(yīng)的分布次數(shù)兩個要素構(gòu)成。由分組標(biāo)志序列和各組相應(yīng)的頻率構(gòu)成頻率分布。目前十六頁\總數(shù)四十頁\編于十九點當(dāng)所觀察的次數(shù)很多,組距很小并且組數(shù)很多時,所繪出的折線圖就會越來越光滑,逐漸形成一條光滑的曲線,這種曲線即頻數(shù)分布曲線,反映了數(shù)據(jù)的分布規(guī)律。目前十七頁\總數(shù)四十頁\編于十九點三、累積頻數(shù)分布與頻率分布為了統(tǒng)計分析的需要,有時要觀察某一數(shù)值以上或某一數(shù)值以下頻數(shù)或頻率之和,這就需要繪出累積頻數(shù)或累計頻率。在SPSS中對下數(shù)據(jù)進行頻數(shù)(率)分析目前十八頁\總數(shù)四十頁\編于十九點1.定義工人編號和加工零件數(shù)的變量名分別為NO和X,然后輸入變量NO和X的原始數(shù)據(jù)。目前十九頁\總數(shù)四十頁\編于十九點2.選擇[Analyze]=>[DescriptiveStatistics]=>[Frequencies...],彈出[Frequencies]主對話框。目前二十頁\總數(shù)四十頁\編于十九點現(xiàn)欲X進行頻數(shù)分析,在對話框左側(cè)的變量列表中選X,單擊按鈕使之進入[Variable(s)]列表框,并選擇[DisplayFrequencyTables]顯示頻數(shù)分布表。目前二十一頁\總數(shù)四十頁\編于十九點3.可單擊[Format...]按鈕彈出[Frequencies:Format]子對話框根據(jù)數(shù)值大小按升序從小到大作頻數(shù)分布數(shù)值大小按降序從大到小作頻數(shù)分布頻數(shù)多少按升序從少到多作頻數(shù)分布頻數(shù)多少按降序從多到少作頻數(shù)分布目前二十二頁\總數(shù)四十頁\編于十九點4.可單擊[Statistics...]按鈕,彈出[Frequencies:Statistics]子對話框,并單擊相應(yīng)項目,在作頻數(shù)表分析的基礎(chǔ)上,附帶作各種統(tǒng)計指標(biāo)的描述,特別是可進行任何水平的百分位數(shù)計算。這里不選。5.可單擊[Charts...]鈕,彈出[Frequencies:Charts]子對話框,目前二十三頁\總數(shù)四十頁\編于十九點用戶可選三種圖形:直條圖(Barchart)、餅圖(PieCharts)和直方圖(Histogram)。這里選擇[Histogram]項,并選擇[WithNormalCurve]要求繪制正態(tài)曲線。單擊[Continue]按鈕返回[Frequencies]主對話框,再單擊[OK]鈕即可得到(累計)頻數(shù)(頻率)分布表和直方圖。目前二十四頁\總數(shù)四十頁\編于十九點輸出結(jié)果頻數(shù)(率)分布表目前二十五頁\總數(shù)四十頁\編于十九點加工零件數(shù)目前二十六頁\總數(shù)四十頁\編于十九點應(yīng)該注意的是,SPSS在未特別指定的情形下,直方圖或頻數(shù)分布表是按照原始數(shù)值逐一作頻數(shù)分布的,這與日常需要的等距分組、且組數(shù)保持在一定數(shù)目的要求不符。在調(diào)用[Frequencies]統(tǒng)計過程命令之前,可先對原始數(shù)據(jù)進行預(yù)處:已知最小值為84,最大值為128,全距為10,故可要求分成5組,起點為80,組距為10。選擇[Transform]=>[Recode]=>[IntoDifferentVariable...],在彈出的[RecodeIntoDifferentVariable]對話框中選定X,單擊按鈕使之進入[NumericVariable→OutputVariable]列表框,在[OutputVariable]欄的[Name]文本框中輸入x1,單擊[Change]按鈕表示新生成的變量名為x1。單擊[OldandNewValues]按鈕彈出[RecodeIntoDifferentVariable:OldandNewValues]子對話框,在[OldValue]選項中單擊[Range]項,輸入第一個分組的數(shù)值范圍:80~89,在[Newvalue]欄內(nèi)輸入新值:80,單擊[Add]按鈕.

依此將各組的范圍及對應(yīng)的新值逐一輸入,最后單擊[Continue]按鈕返回,再單擊[OK]按鈕即完成。系統(tǒng)在原數(shù)據(jù)庫中生成一新變量為x1,這時再調(diào)用[Frequencies]統(tǒng)計過程將輸出等距分組且組數(shù)為5的頻數(shù)分布表。目前二十七頁\總數(shù)四十頁\編于十九點統(tǒng)計數(shù)據(jù)的描述作為統(tǒng)計數(shù)據(jù)的代表值,一個是分布的中心,反映分布的集中趨勢,另一個是分布的形狀,反映分布的離散程度。這些代表性的數(shù)量特征值精確地描述出不同的統(tǒng)計數(shù)據(jù)分布。一、分布的中心眾數(shù)(mode)在正態(tài)分布和一般的偏態(tài)分布中,分布曲線最高點所對應(yīng)的數(shù)值即是眾數(shù)。如果沒有明顯的最高點,眾數(shù)可以不存在。當(dāng)然,如果有兩個最高點,也可以有兩個眾數(shù)。目前二十八頁\總數(shù)四十頁\編于十九點中位數(shù)(median)與分位數(shù)中位數(shù)是數(shù)據(jù)排序后,位置在最中間的數(shù)值。與中位數(shù)相似的還有四分位數(shù)(quartiles)、十分位數(shù)(decile)和百分位數(shù)(percentile)。中位數(shù)是將統(tǒng)計分布從中間分成相等的兩部分,而四分位數(shù)就是將數(shù)據(jù)分布四等分的三個數(shù)值,其中中間的四分位數(shù)就是中位數(shù)。十分位數(shù)和百分位數(shù)分別是將數(shù)據(jù)分布十等分和一百等分的數(shù)值。平均數(shù)(均值)(mean)平均數(shù)是數(shù)據(jù)集中趨勢的最主要測度值目前二十九頁\總數(shù)四十頁\編于十九點三個中心度量的比較目前三十頁\總數(shù)四十頁\編于十九點二、分布的形狀用于描述數(shù)據(jù)分布形狀即分布關(guān)于其中心的波動程度的代表值有:極差、內(nèi)距、方差和標(biāo)準(zhǔn)等,它們描述了分布的離散程度和差異程度。(一)極差(range)極差也稱為全距,是最大值與最小值之間的距離,它是數(shù)據(jù)離散或差異程度的最簡單測度值,即例如,在前面的數(shù)據(jù)中,極差為128-84=44(件)。顯然,數(shù)據(jù)的離散程度大,極差就越大。極差雖然很容易計算,但它只告訴我們數(shù)據(jù)分布范圍,至于分布的中間部分是如何變化的則不得而知。而且它受極端值的影響可能是很大的。目前三十一頁\總數(shù)四十頁\編于十九點(二)內(nèi)距(Inter-QuartileRange,IQR)內(nèi)距又稱為四分位差,是兩個四分位數(shù)之差,IQR=高四分位數(shù)—低四分位數(shù)。若內(nèi)距比較小,則說明數(shù)據(jù)比較集中在中位數(shù)附近;反之則比較分散。內(nèi)距常和中位數(shù)一起用來描述一個定距特別是定序測量數(shù)據(jù)的分布。(三)方差(variance)和標(biāo)準(zhǔn)差(standarddeviation)方差是離差平方的平均數(shù),即或目前三十二頁\總數(shù)四十頁\編于十九點三、偏度與峰度(一)偏度(skewness)所謂偏度是指反映頻數(shù)分布偏態(tài)方向和程度的測度。在頻數(shù)分布中,最大集中點以上(頻數(shù)曲線圖橫軸上眾數(shù)的右邊)的頻數(shù)占總頻數(shù)的一半多,稱為右偏或正偏。最大集中點以下(頻數(shù)曲線圖橫軸上眾數(shù)的左邊)的頻數(shù)占總頻數(shù)的一半多,稱為左偏或負(fù)偏。偏度的計算公式為:目前三十三頁\總數(shù)四十頁\編于十九點(二)峰度(kurtosis)所謂峰度,是指頻數(shù)分布曲線高峰的形態(tài),即反映分布曲線的尖峭程度的測度。峰度的計算公式為當(dāng)β=0時,表示分布的峰度是正態(tài)分布的峰度;當(dāng)β>0時,表示分布曲線的高峰是尖頂高峰;當(dāng)β<0時,表示分布曲線的高峰是平頂高峰。目前三十四頁\總數(shù)四十頁\編于十九點四、SPSS操作在SPSS中計算上例各種指標(biāo)的步驟為:(一)定義加工零件數(shù)的變量名為X,并輸入原始數(shù)據(jù)。(二)選擇[Analyze]=>[DescriptiveStatistics]=>[Descriptives...],打開[Descriptives]主對話框。目前三十五頁\總數(shù)四十頁\編于十九點打開[Descriptives]主對話框。在主對話框左邊列表中選定變量X,單擊按鈕使之進入[Variables(s)]列表框。目前三十六頁\總數(shù)四十頁\編于十九點(三)單擊[Options...]按鈕,打開[Descriptives:Options]子對話框。選擇均值(Mean)、總和(Sum)、標(biāo)準(zhǔn)差(Std.Deviation)、方差(Variance)、極差(Range)、最小值(Minimum)、最大值(Maximum)、偏度(Skewness)和峰度(Kurtosis),選好后單擊[Continue]按鈕返回[Descriptives]主對話框,再單擊[OK]按鈕即可得到各種統(tǒng)計量的計算結(jié)果。目前三十七頁\總數(shù)四十頁\編于十九點輸出結(jié)果:以上結(jié)果沒有給出中位數(shù)、眾數(shù)等統(tǒng)計量,可以在頻數(shù)(率)分析時增加選項計算相應(yīng)的統(tǒng)計量,具體操作步驟如下:(一)定義工人編號和加工零件數(shù)的變量名分別為NO和X,然后輸入變量NO和X的原始數(shù)據(jù)。(二)選擇[Analyze]=>[DescriptiveStatistics]=>[Frequencies...],目前三十八頁\總數(shù)四十頁\編于十九點彈出[Frequencies]主對話框?,F(xiàn)欲X進行頻數(shù)分析,在對話框左側(cè)的變量列表中選X,單擊按鈕使之進入[Variable(s)]列表框,并選擇[DisplayFrequencyTables]顯示頻數(shù)分布表。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論