單變量統(tǒng)計(jì)描述_第1頁(yè)
單變量統(tǒng)計(jì)描述_第2頁(yè)
單變量統(tǒng)計(jì)描述_第3頁(yè)
單變量統(tǒng)計(jì)描述_第4頁(yè)
單變量統(tǒng)計(jì)描述_第5頁(yè)
已閱讀5頁(yè),還剩24頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

單變量統(tǒng)計(jì)描述第1頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月單變量的統(tǒng)計(jì)描述一、頻度分布:某變量取值的各種情況或各種取值出現(xiàn)的次數(shù)或頻數(shù)。二、集中趨勢(shì)的量度集中趨勢(shì)的量度反映變量所有觀測(cè)值的某種共同性質(zhì)。這些性質(zhì)是由絕大多數(shù)觀測(cè)值決定的。①平均值:Mean②中位數(shù):Median表示位于數(shù)據(jù)數(shù)列中心位置的那一項(xiàng)的大小。奇?zhèn)€數(shù):第(n+1)/2個(gè)數(shù)的值偶個(gè)數(shù):第n/2與第(n/2)+1兩個(gè)數(shù)的均值③眾數(shù):Mode數(shù)據(jù)中重復(fù)出現(xiàn)次數(shù)最多的數(shù)值。系統(tǒng)只計(jì)算最小的數(shù)值。第2頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月平均值、中位數(shù)和眾數(shù)的應(yīng)用特征:⒈考試后,對(duì)兩個(gè)班級(jí)的考試成績(jī)的對(duì)照分析用什么描述統(tǒng)計(jì)數(shù)據(jù)?⒉對(duì)全體學(xué)生做教學(xué)滿意度(n等級(jí))調(diào)查,最中性的評(píng)價(jià)態(tài)度的描述用什么描述統(tǒng)計(jì)數(shù)據(jù)?⒊其中學(xué)生最集中的評(píng)價(jià)用什么描述統(tǒng)計(jì)數(shù)據(jù)?第3頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月三、離心趨勢(shì)的度量描述數(shù)據(jù)個(gè)性方面的特征,即數(shù)據(jù)的分散程度或差異程度。①跨度(全距)(range):觀測(cè)值中最大值與最小值之差。跨度表現(xiàn)了總體觀測(cè)值分布的最大范圍,跨度大,表現(xiàn)分布范圍大。②方差(Variance):每個(gè)數(shù)據(jù)與該組數(shù)據(jù)平均數(shù)之差乘方后的均值③標(biāo)準(zhǔn)差(Standarddeviation):方差的平方根。方差、標(biāo)準(zhǔn)差值越大,說(shuō)明分布偏離中心的程度越大;其值小說(shuō)明數(shù)據(jù)相對(duì)比較集中。第4頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月④偏(斜)度(Skewness):描述分布偏離正態(tài)分布的程度,即偏離對(duì)稱(chēng)的程度。

Skewness

Skewness>0:正偏離

Skewness<0:負(fù)偏離⑤峰(峭)度(Kurtosis):描述單峰頻度曲線峰形的尖平程度。

KurtosisKurtosis>0分布集中趨勢(shì)強(qiáng)

Kurtosis<0分布離心趨勢(shì)強(qiáng)⑥差異系數(shù):

CV=(S/M)%S:標(biāo)準(zhǔn)差M:平均值第5頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月⑦標(biāo)準(zhǔn)分?jǐn)?shù):Z分?jǐn)?shù)以標(biāo)準(zhǔn)誤為單位表示一個(gè)分?jǐn)?shù)在群體中所處的相對(duì)位置。⑧百分位數(shù)和N等分百分位數(shù)(percetileNtile):百分位數(shù)和N等分百分位數(shù)能夠度量全部觀測(cè)值對(duì)中心位置的平均偏差,從而對(duì)數(shù)據(jù)的離散性做出最綜合的說(shuō)明。百分位數(shù)的數(shù)值是給出對(duì)應(yīng)不同百分比的數(shù)值,例如:50%對(duì)應(yīng)85,表明50%的個(gè)案取值在85及其以下。N等分百分位數(shù)是將總體個(gè)案數(shù)等份成N等份,產(chǎn)生的N-1個(gè)百分比對(duì)應(yīng)N-1個(gè)數(shù)值,分別表示不同比例的個(gè)案取值在給定數(shù)值及其以下。第6頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月特殊統(tǒng)計(jì)圖形一、箱圖(Boxplots圖)箱圖或稱(chēng)箱線圖,可以直觀地描述變量頻度分布特征。箱圖Box主體:由大于25%的百分位數(shù)到小于75%的百分位數(shù)的個(gè)案組成。中間的黑色橫線表示中位數(shù)。箱圖Box本體:由上觸須線和下觸須線包括的范圍組成。其意義是除去奇異值和極端值后的全部個(gè)案觀測(cè)值。第7頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月奇異值:數(shù)據(jù)點(diǎn)到主體邊緣的距離超過(guò)箱高的1.5倍。上奇異值>=(75%百分位數(shù)-25%百分位數(shù))*1.5+75%百分位數(shù)下奇異值<=25%百分位數(shù)-(75%百分位數(shù)-25%百分位數(shù))*1.5極端值:數(shù)據(jù)點(diǎn)到主體邊緣的距離超過(guò)箱高的3倍。上極端值>=(75%百分位數(shù)-25%百分位數(shù))*3+75%百分位數(shù)下極端值<=25%百分位數(shù)-(75%百分位數(shù)-25%百分位數(shù))*3第8頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月第9頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月二、莖葉圖Stem-and-LeafPlot在輸出顯示窗口Viewer中以字符數(shù)字構(gòu)成的圖,用以表達(dá)變量的頻度分布。例如:

FrequencyStem&Leaf.006.1.006.21.006.53.006.6673.006.8897.007.00011117.007.22233339.007.4444555558.007.6666777712.007.88888999999913.008.000000001111111.008.222223333336.008.4444556.008.6667775.008.889993.009.0012.009.231.009.41.009.6

第10頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月1.00Extremes(>=98)Stemwidth:10.00Eachleaf:1case(s)第一列頻數(shù)Frequency:表示個(gè)案的頻數(shù)。第二列莖Stem:表達(dá)整數(shù)第三列葉Leaf:每片葉表示小數(shù)的量級(jí)。Stemwidth表示莖寬,即倍率,例如莖寬=10.00當(dāng)莖stem=9時(shí),表示90Eachleaf表示每片葉表示個(gè)案數(shù),例如當(dāng)Eachleaf=2case(s)時(shí),每片葉子代表的個(gè)案數(shù)為2個(gè)個(gè)案。例如在上述例子中,第六行中的數(shù)據(jù)表示共有七個(gè)個(gè)案,其中70的個(gè)案有三個(gè),而71的個(gè)案有四個(gè)。第七行中的數(shù)據(jù)表示共有七個(gè)個(gè)案,其中72的個(gè)案有三個(gè),而73的個(gè)案有四個(gè)。最后一行中的數(shù)據(jù)表示共有一個(gè)個(gè)案,該個(gè)案為極端值,大于等于98。第11頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月頻度分析一、頻度分布的描述方式:描述某變量取值的情況可以用數(shù)表和圖形。二、操作步驟:[Analyze][DescriptiveStatistics][Frequencies]選擇分析變量:回答變量名(可以多個(gè))選項(xiàng)“Displayfrequencytable”

決定是否顯示頻數(shù)分布表?!癝tatistics”

描述統(tǒng)計(jì)量的計(jì)算:①百分位數(shù)組(PercentileValue):●四等分百分位數(shù)Quartiles●n等分百分位數(shù)Cutpointsnequal●指定的百分位數(shù)Percentile第12頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月②集中趨勢(shì)組(centralTendence):●平均值Mean●中位數(shù)Median●眾數(shù)Mode●求和Sum③離心趨勢(shì)組(dispersion):●標(biāo)準(zhǔn)差Std.deviation●方差Variance●跨度Range●最小值Minimum●最大值Maximum●平均值的標(biāo)準(zhǔn)誤S.E.Mean第13頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月④分布組(distribution):●偏(斜)度Skewness●峰(峭)度Kurtosis“Chart”選擇統(tǒng)計(jì)圖形:●條形圖Barcharts:按照樣本的取值,用條形的長(zhǎng)度來(lái)表達(dá)的圖形?!駡A餅圖Piecharts:按照樣本各類(lèi)取值分組的百分比生成的圓形圖形。●直方圖Histograms:按照樣本的分組取值,用條形的長(zhǎng)度來(lái)表達(dá)各個(gè)組的取值的圖形。只適用于數(shù)值型變量,若選擇了“Withnormalcurve”可附帶一條用于對(duì)照的正態(tài)曲線。對(duì)于圖形的標(biāo)度可以用頻數(shù),也可以用百分比數(shù)。第14頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月“Format”

設(shè)置頻數(shù)表格式①排序方式Orderby:●升序Ascendingvalues按照變量值的升序排列?!窠敌駾escendingvalues按照變量值的降序排列?!耦l數(shù)升序AscendingCounts按照頻數(shù)升序排列?!耦l數(shù)降序DescendingCounts按照頻數(shù)降序排列。②多變量圖形輸出設(shè)置●多變量圖形輸出Comparevariables在同一張圖中可以有多個(gè)變量的輸出結(jié)果?!駟巫兞繄D形輸出Organizeoutputbyvariable在一張圖中只能有一個(gè)變量的輸出結(jié)果。第15頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月③壓縮表格格式Supresstableswithmorethanncategories壓縮表格表示頻數(shù)類(lèi)別將限制在n以內(nèi)。超過(guò)n類(lèi)的將不顯示。壓縮表格式將只顯示變量值、頻度、百分比和累計(jì)百分比。第16頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月描述統(tǒng)計(jì)量的計(jì)算一、基本功能專(zhuān)門(mén)用來(lái)產(chǎn)生單變量描述統(tǒng)計(jì)量的,如:平均值、求和、標(biāo)準(zhǔn)差、最大值、最小值、方差、跨度、平均值的標(biāo)準(zhǔn)誤。二、操作步驟執(zhí)行:[Analyze][DescriptiveStatistics][Descriptives]

選擇變量到“Variables”中。選項(xiàng)

“Savestandardizedvaluesasvariables”表示是否將進(jìn)行統(tǒng)計(jì)描述的變量生成一個(gè)Z分?jǐn)?shù)變量?!癘ptions”

選擇生成的描述統(tǒng)計(jì)量和排序方式●常用的統(tǒng)計(jì)描述量:平均值Mean

求和Sum第17頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月●離心趨勢(shì)(dispersion):標(biāo)準(zhǔn)差Std.deviation方差Variance跨度Range最小值Minimum最大值Maximum平均值的標(biāo)準(zhǔn)誤S.E.Mean●分布(distribution):偏(斜)度Skewness峰(峭)度Kurtosis●顯示排序方式按照變量列表進(jìn)行排序Variablelist按照變量名字母進(jìn)行排序Alphabetic按照變量平均值的升序排序Ascendingmeans按照變量平均值的降序排序Descendingmeans第18頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月數(shù)據(jù)考察分析一、考察內(nèi)容誤差使數(shù)據(jù)偏離正常值。數(shù)據(jù)考察主要有如下三個(gè)方面:①考察數(shù)據(jù)的真實(shí)性偏離數(shù)據(jù)主體分布太遠(yuǎn)的數(shù)據(jù)點(diǎn)有可能是有問(wèn)題的數(shù)據(jù)點(diǎn),在統(tǒng)計(jì)分析過(guò)程是否應(yīng)保留?②考察數(shù)據(jù)的分布特性數(shù)據(jù)的正態(tài)分布特性將可以為下一步的統(tǒng)計(jì)分析提供條件。③考察變量之間數(shù)據(jù)的相互關(guān)系變量與變量之間的相關(guān)性、方差齊性,都將是一些統(tǒng)計(jì)分析過(guò)程所必須事先了解的。第19頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月二、基本功能計(jì)算描述統(tǒng)計(jì)量。莖葉圖描述頻度分布。箱圖描述數(shù)值分布(表現(xiàn)數(shù)據(jù)的奇異性和極端性)。正態(tài)分布檢驗(yàn)的概率圖描述數(shù)據(jù)分布的正態(tài)性。方差齊性檢驗(yàn)的散點(diǎn)分層圖反映變量間的方差齊性?;貧w參數(shù)描述變量之間的相關(guān)性。三、操作步驟執(zhí)行[Analyze][DescriptiveStatistics][Explore]選擇分析變量(因變量)到“Dependentlist”中選擇分組變量(因素或自變量)到“Factorlist”

中選擇標(biāo)識(shí)變量“Labelcaseby”,若不選此項(xiàng),則在輸出過(guò)程中用樣本序號(hào)標(biāo)識(shí)樣本。選擇輸出形式:“Display”,輸出描述統(tǒng)計(jì)量輸出圖形二者都有輸出。第20頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月●選擇描述統(tǒng)計(jì)量“Statistics”Descriptive:

輸出基本統(tǒng)計(jì)量,系統(tǒng)默認(rèn)的置信區(qū):Confidenceintervalfor95%M-estimators:

排除奇異值和極端值后計(jì)算的均值、中位數(shù)。Outlies:

輸出5個(gè)最大值和5個(gè)最小值。Percentile:可以輸出5%、10%、25%、50%、75%、90%、95%的百分位數(shù)?!襁x擇特殊統(tǒng)計(jì)圖形“Plot”生成箱圖BoxplotFactorlevelstogether在同一張圖上只顯示一個(gè)變量,不同水平同時(shí)顯示。Dependenttogether所有變量顯示在同一張圖上。生成莖葉圖Stem-and-leaf莖葉圖顯示在輸出顯示窗口Viewer中。生成的直方圖Histogram將表現(xiàn)頻度分布。第21頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月●

缺失值處理選項(xiàng)“Options”ExcludecasesListwise:對(duì)于選入目標(biāo)變量列表中的有缺失值的變量,無(wú)論其參與不參與當(dāng)前運(yùn)算,相應(yīng)樣本將被排除。ExcludecasesPairwise:對(duì)于選入目標(biāo)變量列表中的有缺失值的變量,如果其參與運(yùn)算,相應(yīng)樣本將被排除。ReportValue:

把分組變量中含缺失值的樣本單獨(dú)分為一組。第22頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月交叉列聯(lián)表利用頻數(shù)或相對(duì)頻數(shù)研究變量與變量之間的關(guān)系。一、交叉列聯(lián)表結(jié)構(gòu)定義:行變量和列變量例如:考試成績(jī)數(shù)據(jù):定義年齡為行變量,分3個(gè)水平,定義成績(jī)?yōu)榱凶兞?,?個(gè)水平,從而產(chǎn)生一個(gè)3×5的交叉列聯(lián)表。每個(gè)單元格中的數(shù)據(jù)可以為頻度、頻率、期望值或殘差等。最后一行和最后一列有本行、本列的頻度求和以及頻率求和。第23頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月f31f12f23第24頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月二、交叉列聯(lián)表中變量的定義:fij:第i行第j列的值,頻數(shù)。f12=3,f23=3,f31=1fi.:第i行累計(jì)行邊緣頻數(shù)。fi.=f1.=5,f3.=6f.j:第j列累計(jì)列邊緣頻數(shù)。f.j=f.3=4,f.2=8Total:總頻數(shù)===ExpectedCount期望值=fi.*f.j/total第25頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月%within行變量行頻率=fij/fi.%within列變量列頻率=fij/f.j

%ofTotal總頻率=fij/totalResidual殘差=fij-ExpectedCountStdResidual標(biāo)準(zhǔn)殘差=Residual/(ExpectedCount)1/2AdjustResidual調(diào)整殘差=Residual/StdErr第26頁(yè),課件共29頁(yè),創(chuàng)作于2023年2月三、操作步驟執(zhí)行[Analyze][DescriptiveStatistics][Crosstabs]

選擇

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論