實驗四描述性統(tǒng)計分析_第1頁
實驗四描述性統(tǒng)計分析_第2頁
實驗四描述性統(tǒng)計分析_第3頁
實驗四描述性統(tǒng)計分析_第4頁
實驗四描述性統(tǒng)計分析_第5頁
免費預(yù)覽已結(jié)束,剩余10頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

試驗四描述性統(tǒng)計分析數(shù)據(jù)的特征和測度數(shù)據(jù)的特征和測度集中趨勢離散程度分布的外形異眾比率眾偏態(tài)數(shù)四分位差中位數(shù)方差和標(biāo)準(zhǔn)差均值峰度離散系數(shù)一、集中趨勢的測度定類數(shù)據(jù):眾數(shù)定距和定比數(shù)據(jù):均值眾數(shù)、中位數(shù)和均值的比較一組數(shù)據(jù)向其中心值靠攏的傾向和程度測度集中趨勢就是查找數(shù)據(jù)一般水平的代表值或中心值不同類型的數(shù)據(jù)用不同的集中趨勢測度值數(shù)據(jù)的集中趨勢測度值并不適用于低層次的測量數(shù)據(jù)確定眾數(shù)〔Mode〕1、集中趨勢的測度值之一2、消滅次數(shù)最多的變量值3、不受極端值的影響4、可能沒有眾數(shù)或有幾個眾數(shù)5、主要用于定類數(shù)據(jù),也可用于定序數(shù)據(jù)和數(shù)值型數(shù)據(jù)中位數(shù)(Median)6、集中趨勢的測度值之一7、排序后處于中間位置上的值505050%Me8、不受極端值的影響9、主要用于定序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)10、 各變量值與中位數(shù)的離差確定值之和最小,即四分位數(shù)(Quartiles)集中趨勢的測度值之一252525252525QL QM QU不受極端值的影響主要用于定序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)均值〔Mean〕集中趨勢的測度值之一最常用的測度值一組數(shù)據(jù)的均衡點所在易受極端值的影響用于數(shù)值型數(shù)據(jù),不能用于定類數(shù)據(jù)和定序數(shù)據(jù)眾數(shù)、中位數(shù)和均值的關(guān)系均值中位數(shù)眾數(shù) 均值=中位數(shù)=眾數(shù) 眾數(shù)中位數(shù)均值左偏分布 對稱分布 右偏分布二、離散程度的測度定類數(shù)據(jù):異眾比率定序數(shù)據(jù):四分位差定距和定比數(shù)據(jù):方差及標(biāo)準(zhǔn)差異眾比率離散程度的測度值之一非眾數(shù)組的頻數(shù)占總頻數(shù)的比率僅用于定類數(shù)據(jù)用于衡量眾數(shù)的代表性四分位差離散程度的測度值之一也稱為內(nèi)距或四分間距上四分位數(shù)與下四分位數(shù)之差QD=QU-QL50%數(shù)據(jù)的離散程度不受極端值的影響用于衡量中位數(shù)的代表性方差和標(biāo)準(zhǔn)差〔VarianceandStd。deviation〕離散程度的測度值之一最常用的測度值反映了數(shù)據(jù)的分布反映了各變量值與均值的平均差異為樣本方差或標(biāo)準(zhǔn)差〔kurtosis〕數(shù)據(jù)分布偏斜程度的測度偏態(tài)系數(shù)=0為對稱分布偏態(tài)系數(shù)>0為右偏分布偏態(tài)系數(shù)<0為左偏分布峰度(skewness)數(shù)據(jù)分布扁平程度的測度峰度系數(shù)=3扁平程度適中偏態(tài)系數(shù)<3為扁平分布偏態(tài)系數(shù)>3為尖峰分布三、描述統(tǒng)計量的軟件實現(xiàn)1、Excel即可輸出大局部描述統(tǒng)計量。EXCEL平均122.98標(biāo)準(zhǔn)誤差1.14中值(中位數(shù))123模式(眾數(shù))122標(biāo)準(zhǔn)偏差8.03樣本方差64.43峰值-0.41偏斜度0.00區(qū)域(極差)32最小值107最大值139求和6149計數(shù)50最大(1)139最小(1)107置信度(95.0%)2.282、SPSSSPSSStatistics面的四個過程:Frequencies過程的特色是產(chǎn)生頻數(shù)表;Descriptives過程則進展一般性的統(tǒng)計描述;Explore過程用于對數(shù)據(jù)概況不清時的探究性分析;Crosstabs過程則完成計數(shù)資料和等級資料的統(tǒng)計描述和一般的統(tǒng)計檢驗;X2檢驗也在其中完成。Frequencies此過程可以便利地對數(shù)據(jù)按組進展歸類整理,形成各變量的不同水平的頻數(shù)步分析?!維tatistics按鈕】 位數(shù)(Quartiles)、每隔指定百分位輸出當(dāng)前百分位數(shù)(Cutpointsfor (Percentiles),如直P2.5P97.5; (Mean)、中位數(shù)(Median)、眾數(shù)(Mode)、總和(Sum);Dispersion復(fù)選框組用于定義描述離散趨勢的一組指標(biāo):標(biāo)準(zhǔn)差(Std.deviation)、方差(Variance)(Range)、最小值(Minimum)、最大值(Maximum)、均值標(biāo)準(zhǔn)誤差(S.E.mean);Distribution〔Skewness〕和峰度系數(shù)(Kurtosis); 并且具體數(shù)值是組中值時,選中該復(fù)選框以通知SPSS,免得它犯錯誤?!綜hart按鈕】Charttype〔BarHistogram〕,其中直方圖還可以選擇是否加上正態(tài)曲線〔Withnormalcurve〕;ChartValues〔即影響縱坐標(biāo)刻度〕。例4.1利用房價原始數(shù)據(jù)圖.Sav繪制頻數(shù)表、直方圖,計算均數(shù)、標(biāo)準(zhǔn)差、中M、p2.5p97.5。Analyze==>DescriptiveStatistics==>FrequenciesVariablesPriceStatistics鈕:Mean、Std.deviation、MedianContinueChartsBarchartsContinueOK。priceNMeanMedianStd.Deviation

StatisticsValidMissing

1050220.72213.0047.108Percentiles2.5134.1097.5326.35N1050Mean=220.72Median=213.00,標(biāo)準(zhǔn)差STD=47.108,P2.5=134.10,P97.5=326.35。案例1:利用居民儲蓄調(diào)查表數(shù)據(jù)進展頻數(shù)分析,實現(xiàn):目標(biāo)一:分析儲戶的戶口和職業(yè)的根本狀況;頻數(shù)的降序輸出,戶口按餅圖輸出,職業(yè)按條形圖輸出;〔取〕款金額的分布,并對城鎮(zhèn)儲戶和農(nóng)村儲戶進展比較。提示:由于存〔取〕款金額數(shù)據(jù)為定距型變量,直接承受頻數(shù)分析不利于對〔Transform→Record〕對數(shù)據(jù)分組后再編制頻數(shù)分布表;〔取位數(shù),并通過四分位數(shù)比較兩者分布上的差異。Descriptives過程算術(shù)和、標(biāo)準(zhǔn)差、最大值、最小值等,且可將原始數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)Z分值〔標(biāo)準(zhǔn)正態(tài)評分值〕并存入數(shù)據(jù)庫。選擇菜單Analyze==>descriptive==>Descriptives對話框的界面如下所示:valuesasvariables確定是否將原始數(shù)據(jù)的標(biāo)準(zhǔn)正態(tài)評分存為變量。案例2:利用居民儲蓄調(diào)查表數(shù)據(jù)計算根本描述統(tǒng)計量,實現(xiàn):〔取〕款金額的根本描述統(tǒng)計量,并分別對城鎮(zhèn)儲戶和農(nóng)村儲戶進展比較;提示:首先依據(jù)戶口對數(shù)據(jù)進展拆分;〔取〕款的數(shù)量是否存在不均衡現(xiàn)象。提示:可以從分析金額是否有大量特別值入手;SaveStandardizedAsVariables項,將自動計算存〔取〕Za5;高金額組〕后進展頻數(shù)分析;〔即低特別值組〕和高金額組〔即高特別值組〕的比例,如特別組0.3%,即認(rèn)為存〔取〕款金額存在肯定的不均衡現(xiàn)象。Explore過程1.檢查數(shù)據(jù)是否有錯誤2.數(shù)值的分布特征3.對數(shù)據(jù)的規(guī)律的初步觀看選擇菜單Analyze==>descriptive==>Explore對話框的界面如下所示:【Display用于選擇輸出結(jié)果中是否包含統(tǒng)計描述、統(tǒng)計圖或兩者均包括。【DependentList用于選入需要分析的變量?!綟actorList框】假設(shè)想讓所分析的變量按某種因素取值分組分析,則在這里選入分組變量?!綥abelcasesbyID號的變量?!維tatisticsStatistics M-estimators復(fù)選框:作中心趨勢的粗略最大似然確定,輸出四個不同權(quán)重的最大似然確定數(shù)。OutliersPercentiles5%10%2550%75%9095%位數(shù)?!綪lot彈出Plot對話框,用于選擇所需要的統(tǒng)計圖。有如下選項: (Factorlevelstogether),也可以不分組一起繪制(Depentendstogether),或者不繪制(None)。Descriptive(Stem-and-leaf)和直方圖(Histogram)。 否符合正態(tài)分布的檢驗。Spreadvs.LevelwithLeveneTest組間方差齊性檢驗。【Options某統(tǒng)計量時有缺失值的記錄,或報告缺失值。StatisticStd.ErrorpriceMean95%ConfidenceLowerIntervalforMeanUpperBoundBound220.72211.61229.844.5975%TrimmedMean219.55Median213.00Variance2219.125Std.Deviation47.108Minimum125Maximum345Range220InterquartileRange65Skewness.473.236Kurtosis-.274.467priceStem&Leaf1.2231.Stem&Leaf1.2231.4551.66677777777777771.888888888889999999992.000000000011112.222222222333332.44444444555552.666667772.88999993.01113.223.003.0016.0020.0014.0014.0013.008.007.004.002.001.00 3.4Stemwidth: 100Eachleaf: 1case(s)以上是莖葉圖,整數(shù)位為莖,小數(shù)位為葉。這樣可以格外直觀的看出數(shù)據(jù)的分布范圍及形態(tài),在國外格外流行。350300250200150100price以上是箱線圖,中間的黑粗線為均數(shù),紅框為四分位間距的范圍,上下兩個細(xì)線為最大、最小值。案例3:利用居民儲蓄調(diào)查表數(shù)據(jù)分析儲戶存〔取〕款金額的分布狀況。Crosstabs〔列聯(lián)表分析〕Crosstabs特征,進而分析變量之間的相互影響和關(guān)系。稱列聯(lián)表分析或穿插分組下的頻數(shù)分析。兩大根本任務(wù):依據(jù)收集到的樣本數(shù)據(jù)編制二維或多維穿插列聯(lián)表;。Crosstabs〔單變量頻數(shù)表〕,該功能由Frequencies穿插列聯(lián)表的卡方檢驗:檢驗行變量和列變量是否獨立?列變量獨立;Pearson確定顯著性水平和臨界值;結(jié)論和決策。方法一:假設(shè)卡方的觀測值大于卡方臨界值,可拒絕零假設(shè);α,拒絕零假設(shè)。SPSSSPSSP 策方式進展決策。事實上,全部的假設(shè)檢驗均是這樣進展的。例4.2利用下表格數(shù)據(jù),進展列聯(lián)表分析。處理愈合未愈合合計呋喃硝胺54862甲氰咪胍442064合計9828126量――行變量、列變量和指示每個格子中頻數(shù)的變量,然后用WeightCases對CrosstabsX2R、CW,則數(shù)據(jù)集構(gòu)造和命令如下:RCW1.001.0054.001.002.0044.002.001.008.002.002.0020.00Data==>WeightCasesWeightCasesbyFreqencyVariableWOKAnalyze==>DescriptiveStatistics==>CrosstabsRowsRColumnsCStatisticsChi-squareContinueOK從左到右為:檢驗統(tǒng)計量值(Value)、自由度(df)、雙側(cè)近似概率(Asymp.Sig.2-sided)、雙側(cè)準(zhǔn)確概率(ExactSig.2-sided)、單側(cè)準(zhǔn)確概率(ExactSig.1-sided);Chi-Square〕、連續(xù)性校正的卡方值(ContinuityCorrection)、對數(shù)似然比方法計算的卡方Fisher‘s(Fisher’sExactTest)、線性相LinearAssociation)、有效記錄數(shù)(NofValidCases)。另外,ContinuityCorrectionPearsonab,表格13.78。因此,這里無須校正,直接承受第一行的檢驗結(jié)果,即X2=6.133,P=0.013,如給定顯著性α0.05,由于卡方的頻率pα,因此拒絕零假設(shè),即認(rèn)為兩組方法治療效果有差異。5,則一般不宜使用卡方檢驗。在這種狀況下,可以承受似然率卡方檢驗等方法進展修正。4.3〔職工數(shù)據(jù)〕.savAnalyze==>DescriptiveStatistics==>Crosstabs;〔zc〕Row(s)框,將列變量文化程度(xl)ColumnDisplayclusteredbarcharts選項,指定繪制各變量穿插分tables變量間關(guān)系;CellFormat行變量取值的升序排列;Chi-Square案例4:利用居民儲蓄調(diào)查表數(shù)據(jù)進展計算,實現(xiàn)以下兩個目標(biāo):持一樣的態(tài)度;提示:列聯(lián)表的行變量為戶口〔a13〕,列變量為將來收入狀況〔a3〕,在列全都進展分析;目標(biāo)二:分析城鎮(zhèn)和農(nóng)村儲戶對儲蓄是否合算的認(rèn)同是否全都。提示:該分析中列聯(lián)表的行變量為戶口〔a13〕,列變量為什么合算〔a1〕,在列聯(lián)表的根底上進展卡方檢驗。補充:多項選擇項分析多項選擇項分析是針對問卷調(diào)查中的多項選擇項問題的。SPSSSPSS將多項選擇項問題分解;〔前面已講過〕利用前面講到的頻數(shù)分析或穿插分組下的頻數(shù)分析等方法進展分析。多項選擇項頻數(shù)分析或多項選擇項穿插分組下的頻數(shù)分析1將多項選擇項問題分解并設(shè)置成多個變量后,指定這些變量為一個集合。1Analyze==>MultipleResponse==>Definesets;2Variablesinsetscodedascountedvalue哪組值進展分析。SpsscategoriesRangethrough取值的最小值和最大值。4、為多項選擇項變量集命名,系統(tǒng)會自動

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論