版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
-.z.spss數(shù)據(jù)正態(tài)分布檢驗(yàn)方法及意義判讀要觀察*一屬性的一組數(shù)據(jù)是否符合正態(tài)分布,可以有兩種方法(目前我知道這兩種,并且這兩種方法只是直觀觀察,不是定量的正態(tài)分布檢驗(yàn)):1:在spss里的基本統(tǒng)計(jì)分析功能里的頻數(shù)統(tǒng)計(jì)功能里有對*個變量各個觀測值的頻數(shù)直方圖中可以選擇繪制正態(tài)曲線。具體如下:Analyze-----DescriptiveStatistics-----Frequencies,打開頻數(shù)統(tǒng)計(jì)對話框,在Statistics里可以選擇獲得各種描述性的統(tǒng)計(jì)量,如:均值、方差、分位數(shù)、峰度、標(biāo)準(zhǔn)差等各種描述性統(tǒng)計(jì)量。在Charts里可以選擇顯示的圖形類型,其中Histograms選項(xiàng)為柱狀圖也就是我們說的直方圖,同時可以選擇是否繪制該組數(shù)據(jù)的正態(tài)曲線(Withnormacurve),這樣我們可以直觀觀察該組數(shù)據(jù)是否大致符合正態(tài)分布。如下圖:從上圖中可以看出,該組數(shù)據(jù)基本符合正態(tài)分布。2:正態(tài)分布的Q-Q圖:在spss里的基本統(tǒng)計(jì)分析功能里的探索性分析里面可以通過觀察數(shù)據(jù)的q-q圖來判斷數(shù)據(jù)是否服從正態(tài)分布。具體步驟如下:Analyze-----DescriptiveStatistics-----E*plore打開對話框,選擇Plots選項(xiàng),選擇Normalityplotswithtests選項(xiàng),可以繪制該組數(shù)據(jù)的q-q圖。圖的橫坐標(biāo)為改變量的觀測值,縱坐標(biāo)為分位數(shù)。若該組數(shù)據(jù)服從正態(tài)分布,則圖中的點(diǎn)應(yīng)該靠近圖中直線??v坐標(biāo)為分位數(shù),是根據(jù)分布函數(shù)公式F(*)=i/n+1得出的.i為把一組數(shù)從小到大排序后第i個數(shù)據(jù)的位置,n為樣本容量。若該數(shù)組服從正態(tài)分布則其q-q圖應(yīng)該與理論的q-q圖(也就是圖中的直線)基本符合。對于理論的標(biāo)準(zhǔn)正態(tài)分布,其q-q圖為y=*直線。非標(biāo)準(zhǔn)正態(tài)分布的斜率為樣本標(biāo)準(zhǔn)差,截距為樣本均值。如下圖:如何在spss中進(jìn)行正態(tài)分布檢驗(yàn)1(轉(zhuǎn))(2009-07-2211:11:57)標(biāo)簽:雜談
一、圖示法1、P-P圖以樣本的累計(jì)頻率作為橫坐標(biāo),以安裝正態(tài)分布計(jì)算的相應(yīng)累計(jì)概率作為縱坐標(biāo),把樣本值表現(xiàn)為直角坐標(biāo)系中的散點(diǎn)。如果資料服從整體分布,則樣本點(diǎn)應(yīng)圍繞第一象限的對角線分布。2、Q-Q圖以樣本的分位數(shù)作為橫坐標(biāo),以按照正態(tài)分布計(jì)算的相應(yīng)分位點(diǎn)作為縱坐標(biāo),把樣本表現(xiàn)為指教坐標(biāo)系的散點(diǎn)。如果資料服從正態(tài)分布,則樣本點(diǎn)應(yīng)該呈一條圍繞第一象限對角線的直線。以上兩種方法以Q-Q圖為佳,效率較高。3、直方圖判斷方法:是否以鐘形分布,同時可以選擇輸出正態(tài)性曲線。4、箱式圖判斷方法:觀測離群值和中位數(shù)。5、莖葉圖類似與直方圖,但實(shí)質(zhì)不同。二、計(jì)算法1、偏度系數(shù)(Skewness)和峰度系數(shù)(Kurtosis)計(jì)算公式:g1表示偏度,g2表示峰度,通過計(jì)算g1和g2及其標(biāo)準(zhǔn)誤σg1及σg2然后作U檢驗(yàn)。兩種檢驗(yàn)同時得出U<U0.05=1.96,即p>0.05的結(jié)論時,才可以認(rèn)為該組資料服從正態(tài)分布。由公式可見,部分文獻(xiàn)中所說的“偏度和峰度都接近0……可以認(rèn)為……近似服從正態(tài)分布”并不嚴(yán)謹(jǐn)。2、非參數(shù)檢驗(yàn)方法非參數(shù)檢驗(yàn)方法包括Kolmogorov-Smirnov檢驗(yàn)(D檢驗(yàn))和Shapiro-Wilk(W檢驗(yàn))。SAS中規(guī)定:當(dāng)樣本含量n≤2000時,結(jié)果以Shapiro–Wilk(W檢驗(yàn))為準(zhǔn),當(dāng)樣本含量n>2000時,結(jié)果以Kolmogorov–Smirnov(D檢驗(yàn))為準(zhǔn)。SPSS中則這樣規(guī)定:(1)如果指定的是非整數(shù)權(quán)重,則在加權(quán)樣本大小位于3和50之間時,計(jì)算Shapiro-Wilk統(tǒng)計(jì)量。對于無權(quán)重或整數(shù)權(quán)重,在加權(quán)樣本大小位于3和5000之間時,計(jì)算該統(tǒng)計(jì)量。由此可見,部分SPSS教材里面關(guān)于“Shapiro–Wilk適用于樣本量3-50之間的數(shù)據(jù)”的說法是在是理解片面,誤人子弟。(2)單樣本Kolmogorov-Smirnov檢驗(yàn)可用于檢驗(yàn)變量(例如ine)是否為正態(tài)分布。對于此兩種檢驗(yàn),如果P值大于0.05,表明資料服從正態(tài)分布。三、SPSS操作示例SPSS中有很多操作可以進(jìn)行正態(tài)檢驗(yàn),在此只介紹最主要和最全面最方便的操作:1、工具欄--分析—描述性統(tǒng)計(jì)—探索性2、選擇要分析的變量,選入因變量框,然后點(diǎn)選圖表,設(shè)置輸出莖葉圖和直方圖,選擇輸出正態(tài)性檢驗(yàn)圖表,注意顯示(Display)要選擇雙項(xiàng)(Both)。3、Output結(jié)果(1)Descriptives:描述中有峰度系數(shù)和偏度系數(shù),根據(jù)上述判斷標(biāo)準(zhǔn),數(shù)據(jù)不符合正態(tài)分布。Sk=0,Ku=0時,分布呈正態(tài),Sk>0時,分布呈正偏態(tài),Sk<0時,分布呈負(fù)偏態(tài),時,Ku>0曲線比較陡峭,Ku<0時曲線比較平坦。由此可判斷本數(shù)據(jù)分布為正偏態(tài)(朝左偏),較陡峭。(2)TestsofNormality:D檢驗(yàn)和W檢驗(yàn)均顯示數(shù)據(jù)不服從正態(tài)分布,當(dāng)然在此,數(shù)據(jù)樣本量為1000,應(yīng)以W檢驗(yàn)為準(zhǔn)。(3)直方圖直方圖驗(yàn)證了上述檢驗(yàn)結(jié)果。(4)此外還有莖葉圖、P-P圖、Q-Q圖、箱式圖等輸出結(jié)果,不再贅述。結(jié)果同樣驗(yàn)證數(shù)據(jù)不符合正態(tài)分布。spss
判斷兩組數(shù)據(jù)的相關(guān)性(已使用)(2009-07-2213:07:34)標(biāo)簽:雜談
兩組體重數(shù)據(jù):先要為數(shù)據(jù)分組使用命令:spss的t檢驗(yàn):
菜單Analyze->pareMeans->Independent-SamplesTTest運(yùn)行結(jié)果:經(jīng)方差齊性檢驗(yàn):F=0.393P=0.532,即兩方差齊。(因?yàn)閜大于0.05)所以選用t檢驗(yàn)的第一行方差齊情況下的t檢驗(yàn)的結(jié)果:就是選用方差假設(shè)奇的結(jié)果所以,t=0.644,p=0.522,沒有顯著性差異。(因?yàn)閜<0.05表示差異有顯著性)。均值相差:113.30159解釋:使用paremeans里的independentsmaplesTtest,檢驗(yàn)結(jié)果里的Levene\'sTestforEqualityofVariances就是對方差齊性的檢驗(yàn),如果P值大于0.05則認(rèn)為是方差齊,統(tǒng)計(jì)量為F=S1^2/S^2~F(n1-1,n2-1),顯著水平一般為0.05,0.01,原假設(shè)H0:方差相等。方差分析(AnaylsisofVariance,ANOVA)要求各組方差整齊,不過一般認(rèn)為,如果各組人數(shù)相若,就算未能通過方差整齊檢驗(yàn),問題也不大。
One-WayANOVA對話方塊中,點(diǎn)擊Options…(選項(xiàng)…)按扭,
勾Homogeneity-of-variance即可。它會產(chǎn)生
Levene、CochranC、Bartlett-Bo*F等檢驗(yàn)值及其顯著性水平P值,
若P值<于0.05,便拒絕方差整齊的假設(shè)。
順帶一提,Cochran和Bartlett檢定對非正態(tài)性相當(dāng)敏感,
若出現(xiàn)「拒絕方差整齊」的檢測結(jié)果,或因這原因而做成。Statistics菜單->pareMeans->Independent-samplesTTest..
再看看結(jié)果中p值的大小是否<.05,若然即達(dá)顯著水平。SPSS學(xué)習(xí)筆記描述樣本數(shù)據(jù)一般的,一組數(shù)據(jù)拿出來,需要先有一個整體認(rèn)識。除了我們平時最常用的集中趨勢外,還需要一些離散趨勢的數(shù)據(jù)。這方面E*CEL就能一次性的給全了數(shù)據(jù),但對于SPSS,就需要用多個工具了,感覺上表格方面不如E*CEL好用。個人感覺,通過描述需要了解整體數(shù)據(jù)的集中趨勢和離散趨勢,再借用各種圖觀察數(shù)據(jù)的分布形態(tài)。對于SPSS提供的OLAPcubes(在線分析處理表),CaseSummary(觀察值摘要分析表),Descriptives(描述統(tǒng)計(jì))不太常用,反喜歡用Frequencies(頻率分析),BasicTable(基本報表),Crosstabs(列聯(lián)表)這三個,另外再配合其它圖來觀察。這個可以根據(jù)個人喜好來選擇。一.使用頻率分析(Frequencies)觀察數(shù)值的分布。頻率分布圖與分析數(shù)據(jù)結(jié)合起來,可以更清楚的看到數(shù)據(jù)分布的整體情況。以自帶文件Trendschapter13.sav為例,選擇Analyze->DescriptiveStatistics->Frequencies,把hstarts選入Variables,取消在DisplayFrequencytable前的勾,在Chart里面histogram,在Statistics選項(xiàng)中如圖1圖1分別選好均數(shù)(Mean),中位數(shù)(Median),眾數(shù)(Mode),總數(shù)(Sum),標(biāo)準(zhǔn)差(Std.deviation),方差(Variance),圍(range),最小值(Minimum),最大值(Ma*imum),偏度系數(shù)(Skewness),峰度系數(shù)(Kutosis),按Continue返回,再按OK,出現(xiàn)結(jié)果如圖2圖2表中,中位數(shù)與平均數(shù)接近,與眾數(shù)相差不大,分布良好。標(biāo)準(zhǔn)差大,即數(shù)據(jù)間的變化差異還還小。峰度和偏度都接近0,則數(shù)據(jù)基本接近于正態(tài)分布。下面圖3的頻率分布圖就更直觀的觀察到這樣的情況圖3二.采用各種圖直觀觀察數(shù)據(jù)分布情況,如采用柱型圖觀察歸類的比例等。同樣以自帶文件Trendschapter13.sav為例,我們可以觀察一下各年的數(shù)據(jù)總和的對比:1.選擇Graph->Bar->Simple,在“Datainchartare”一項(xiàng)選擇Summaryofgroupsofcases,然后按Define,出現(xiàn)圖4,圖42.選擇BarsRepresent->Otherstatistic(e.g.mean),把hstarts一項(xiàng)選入Variable里面,把YEAR,Periodic一項(xiàng)選入CategoryA*is項(xiàng)中,并按ChangeStatistic鍵,出現(xiàn)圖5:圖53.在Statistic選項(xiàng)中選Sumofvalues一項(xiàng),按Continue返回,按OK即可出現(xiàn)圖6:圖6從圖中可以非常直觀的看出1965年-1975年間,每年的總體數(shù)量對比和各數(shù)值多少。三.通過列聯(lián)表來觀察,數(shù)據(jù)的交錯關(guān)系。以軟件自帶的文件UniversityofFloridagraduatesalaries.sav來說明1、選擇Tables->BasicTable,在彈出對話框中,選擇Graduate到Summaries欄,College到Down,Gender到Across欄,如圖7圖72、選擇Statistics按鍵,選取Count和layer%到CellStatistics一欄,并按Continue鍵,如圖8圖8三、選擇Layout按鍵,選擇SummaryVariableLabels->Inseparatelabels(匯總的標(biāo)簽,如本例的Graduate,放在表外),StatisticsLabels->Acrosstop(數(shù)據(jù)的標(biāo)簽橫放在頂部,如本例的Count和Layer%),并在Labelgroupswithvaluelabelsonly前選擇打勾(表示只需要具體的標(biāo)簽名就可以,不需要匯總名,如本例Gender和College),如圖9圖9四、選擇Total按鍵,在Totalsovereachgroupvariable一項(xiàng)前選勾,則輸出表會有增加匯總一欄,如圖10圖10提示,需要什么表格形式可以根據(jù)要求來調(diào)整,但對輸出按鍵都需要熟悉,多嘗試幾次就可以看出不同的區(qū)別。圖11為輸出的表格圖11重要提示:如果結(jié)果變成變量的匯總(SUM),則先選擇Data->WeightCases,把Graduate的選項(xiàng)先選入WeightCasesby,再選回DonotweightCases,按OK即可。對于其他帶有編號的一項(xiàng)都可以這樣做。這一點(diǎn)不知為何,本人屢次試過總需要這樣調(diào)整。參考圖12圖12幾種常用的統(tǒng)計(jì)方法應(yīng)用一般來說,最最常用的統(tǒng)計(jì)分析有假設(shè)檢驗(yàn)和回歸分析,在SPSS中也有很好的對應(yīng)工具來做這些分析,但對其基本思路和要求都必須了解,這樣才能更靈活的發(fā)揮。下面抄錄《E*CEL在市場調(diào)查中的應(yīng)用》一書中關(guān)于這方面的容:1.假設(shè)檢驗(yàn)?zāi)康模菏怯脕砼袛鄻颖九c樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計(jì)推斷方法。基本思想:小概率反證法思想。即P<0.01或P<0.05在一次試驗(yàn)中基本不會生發(fā)。反證法思想是先提出假設(shè)(檢驗(yàn)假設(shè)H0),再用適當(dāng)?shù)慕y(tǒng)計(jì)方法確定假設(shè)成立的可能性大小,如果可能性小,則認(rèn)為假設(shè)不成立,否則,還不能認(rèn)為假設(shè)不成立。方法:t檢驗(yàn),u檢驗(yàn),秩和檢驗(yàn),卡方檢驗(yàn)應(yīng)用條件:A、各組資料具有可比性B、具正態(tài)分布C、方差齊性(即先作F檢驗(yàn),如F<F0.05,則P>0.1,具方差齊性)2.方差分析目的:又稱為變異系數(shù)分析或F檢驗(yàn)。用于推斷兩組或多組資料的總體平均數(shù)是否相同,檢驗(yàn)兩個或多個樣本平均數(shù)的差異是否具有統(tǒng)計(jì)意義(也可認(rèn)為是檢驗(yàn)多個總體均值是否有顯著性差異注1,這樣可能更簡單一點(diǎn))?;舅枷耄河媒M均方去除組間均方的商,即F值,與1比較,若F值接近1,則說明各驗(yàn)均數(shù)間的差異沒有統(tǒng)計(jì)學(xué)意義,否則表示有統(tǒng)計(jì)學(xué)意義。應(yīng)用條件:A、各組資料具有可比性B、具正態(tài)分布C、方差齊性(即F檢驗(yàn))提示,在應(yīng)用SPSS中,只要死死的記住一個顯著系數(shù)0.05就可以應(yīng)用(如果是雙尾系數(shù)需要除以2),一般的大于0.05接受原假設(shè),小于0.05則拒絕。簡單的說,一般結(jié)果拒絕就是說樣本有差異,樣本相對獨(dú)立,都是表示同一種意思,讀這方面書的時候,希望不要讓這些名詞混亂了思路。SPSS的方差檢驗(yàn)中,需要注意下面問題:方差檢驗(yàn)中,PostHoc鍵有LSD的選項(xiàng):當(dāng)方差分析F檢驗(yàn)否定了原假設(shè),即認(rèn)為至少有兩個總體的均值存在顯著性差異時,須進(jìn)一步確定是哪兩個或哪幾個均值顯著地不同,則需要進(jìn)行多重比較來檢驗(yàn)。LSD即是一種多因變量的三個或三個以上水平下均值之間進(jìn)行的兩兩比較檢驗(yàn)。2IndependentSamples檢驗(yàn)中的Mann-WhitneyU檢驗(yàn)與KIndependentSamples中的Kruskal-Walllis(克魯斯卡爾—瓦里斯)H檢驗(yàn)法思想類似,常用來作為非參數(shù)檢驗(yàn)。2RelatedSamples非參數(shù)檢驗(yàn)中,一般有Sign普通符號檢驗(yàn)法和Wilco*on威爾科克森符號秩檢驗(yàn)法。前者用于研究的問題只有兩個可能的結(jié)果:“是”或“非”,并且二者遵從二項(xiàng)分布;后者是普通符號檢驗(yàn)法的改進(jìn),除了可以檢驗(yàn)是非外,還可以了解差異的大小。KRelatedSamples非參數(shù)檢驗(yàn)中,主要有Friedman秩和檢驗(yàn)與CochranQ檢驗(yàn)二種選擇,前者是對多個樣本是否來自同一總體的檢驗(yàn),而后者是用于只分為“成功”和“失敗”兩種結(jié)果的定類尺度測量的數(shù)據(jù)。附錄:SPSS假設(shè)檢驗(yàn)方法使用對照表圖13其中相關(guān)、配對或有交互作用可以理解為E*CEL的重復(fù),獨(dú)立或無交互作用可以理解為E*CEL中的無重復(fù)。圖13表大部分參考《數(shù)據(jù)分析與SPSS應(yīng)用》一書,特別說明3.回歸分析目的:研究一個變量Y與其它若干變量*之間的一種數(shù)學(xué)工具。它是一組試驗(yàn)或觀測數(shù)據(jù)的基礎(chǔ)上,尋找被隨機(jī)性掩蓋的變量之間的依存關(guān)系。A.直線回歸方程Yc=ab*B.回歸關(guān)系的檢驗(yàn):求回歸方程在總體中是否成立,即是否樣本代表的總體也有直線回歸關(guān)系。a.方差分析:基本思想是將總變異分解為SS回歸和SS乘余,然后利用F檢驗(yàn)來判斷方程是否成立。b.t檢驗(yàn):基本思想是利用樣本回歸系數(shù)b與總體平均數(shù)回歸系數(shù)進(jìn)行比較來判斷回歸方程是否成立。下面摘錄《數(shù)據(jù)分析與SPSS應(yīng)用》一書關(guān)于相關(guān)回歸和時間序列分析一些概念解釋。數(shù)據(jù)變量間主要存在二類關(guān)系:一類是函數(shù)關(guān)系,一類是相關(guān)關(guān)系。前者是變量間有確定關(guān)系,即一個變量的值能夠在其他變量取值確定的情況下,按*種函數(shù)關(guān)系唯一確定;后者是變量間雖然具有的聯(lián)系,并非確定關(guān)系,如價格與銷量量,價格高了,銷售量可能會上去,但無法確定銷售量是多少。通過散點(diǎn)圖來觀察,如果點(diǎn)都集中在一條直線附近,是線性相關(guān),如果在一條曲線附近,則為非線性相關(guān)。如果一個變量因另一個變量的增加而增加,減少而減少,則二個變量間存在正相關(guān)關(guān)系,反之則為負(fù)相關(guān)關(guān)系。極端的相關(guān)是完全相關(guān)和零相關(guān)。如*地區(qū)購買自行車多少與購買大蒜多少無關(guān),是為零相關(guān)。按我的理解,相關(guān)分析就是推斷變量與變量之間關(guān)系的密切程度,回歸就是在相關(guān)的基礎(chǔ)上,找出變量間的擬合模型,從而進(jìn)一步推測出未來的趨勢和變量。而時間序列則是以時間的作為觀察的序列,來推斷變量間的關(guān)系的一種模型。以自帶文件Trendschapter13.sav為例,說明一下如何應(yīng)用這三種分析工具。1.相關(guān)打開Trendschapter13.sav文件,可以看到,這個文件的數(shù)據(jù)是以時間來排序的,在每個值前增加一行序列號變量,如圖14圖14一個時間序列的影響因素有四種變動:A長期趨勢(SecularTrend),B季節(jié)變動(SeasonalVariation),C循環(huán)變動(CyclicalVariation),D不規(guī)則變動(IrregularVariation)。我們可以觀察一下這些數(shù)據(jù)是否存在*種關(guān)系,打開Graphs->Sequence,如圖15圖15把hstarts選入Variables項(xiàng),把No.選入TimeA*isLables,然后按OK,出現(xiàn)圖16:圖16從圖可以看出,數(shù)據(jù)總是在一個周期反復(fù)在上下波動,雖然高低的位置不一樣,但這種波動顯然是隨著時間的不同而變化。因此可以察看,因變量與時間的關(guān)系如何。選擇Data->DefineDates,出現(xiàn)圖17圖17在Year一欄填入1965,Month一欄填入1,表示數(shù)據(jù)從1965年1月開始計(jì)算。選擇Analyze->Correlate->Bivariate,出現(xiàn)圖18圖18把hstarts,Year和Month都選入Varibales選項(xiàng),CorrelationCoefficients選擇Pearson和Spearman(其實(shí)只需要選Spearman就可以,這里只是試一下,作為比較)。注:相關(guān)檢驗(yàn)中有Pearson(皮爾森)相關(guān)系數(shù)和Spearman(斯皮爾曼)等級相關(guān),前者也稱皮爾森相關(guān)系數(shù),是對兩個定距變量關(guān)系的刻畫;后者是用來考察兩個變量中至少有一個定序變量時的相關(guān)關(guān)系。Zero-orderCorrelations(零階偏聽偏相關(guān)系數(shù))是按Pearson簡單相關(guān)系數(shù)公式計(jì)算得到的相關(guān)系數(shù)。在皮爾森系數(shù)r是對兩個定距變量關(guān)系的刻畫:若-1≤r≤1,|r|越大,表明兩個變量之間的相關(guān)程度越強(qiáng)。若0<r≤1,表明兩個變量之間存在正相關(guān)。若r=1,則表明變量之間存在著完全正相關(guān)的關(guān)系。若-1≤r<0,表明兩個變量之間存在負(fù)相關(guān)。若r=-1,則變量間的關(guān)系為完全負(fù)相關(guān)。若r=0,表示兩個變量之間無線性相關(guān),即零相關(guān)。按Option按鍵,如圖19圖19在Statistics選擇MeansandstandarddeviationsCross-productdeviationsandcovariances,注意,這二個選擇是Pearson才有的,如果開始只選擇Spearman,則此二項(xiàng)不能選。返回后,按OK如圖20:圖20從圖20看到Y(jié)ear的Pearson系數(shù)為0.219,Sig值為0.012,小于P值0.05,與Hstarts顯著相關(guān),Month的Pearson系數(shù)為0.058,Sig值為0.506,大于P值0.05,則與Hstarts不顯著相關(guān)。從下圖21的Spearman也同樣得到相同的結(jié)論。圖212.回歸試建立回歸模型,看能否形成各變量間的關(guān)系式。選擇Analyze->Regression->CurveEstimation,出現(xiàn)圖22圖22把hatarts選入Dependents選項(xiàng),Independent選擇Time,Models選擇(Linear)線性回歸,(Quadratic)二次曲線回歸,(Cubic)三次曲線回歸,(E*ponential)指數(shù)回歸,選擇Includeconstantinequation表示方程式有常數(shù)項(xiàng),Plotmodels則表示用圖表示,然后按OK,出現(xiàn)圖23圖23線性方程:Y=70.430.135*二次曲線方程:Y=64.1710.415*-0.02*2三次曲線方程:Y=87.68-1.667*0.037*2(0*3)指數(shù)曲線方程:Y=68.229*e0.002從Sig值判斷,都小于0.05,都接受回歸成立,這樣,只能從R擬合度和F值較大來判斷三次曲線方程的擬合程度比較高。注意,如果方程成立的話,想要增加預(yù)測,則可以在Save選項(xiàng)中選擇PredictedValues一項(xiàng),如果還想預(yù)測未來的數(shù)值,則可以在原表上增加若干行(如1行),然后選擇PredictCases下面Predictthrough,在Year填入1976,在Month填入1,這樣就表示預(yù)測值到1976年的一月。如圖24所示。圖24注意,在Independent選擇Time和把ID選入結(jié)果一樣,則因?yàn)镮D是以時間為序來排,所以結(jié)果一樣。3.時間序列因?yàn)镽的似合度分別為0.05,0.064,0.199和0.039,都比較低,方程的效果不太好,如果要預(yù)測數(shù)值還是選擇時間序列比較合適,因?yàn)閺膭偛臩equence的圖也可以觀察到,數(shù)據(jù)是以后的時間來波動的變化關(guān)系。選擇Analyze->TimeSeries->E*ponentialSmoothing,出現(xiàn)圖25圖25把hstarts選入Variables選項(xiàng),并在Model選擇Winters(注意,三種不同的模型的選擇:簡單指數(shù)平滑適用于不包含長期趨勢和季節(jié)成分的數(shù)據(jù);Holt方法適合于包含長期趨勢但不包含季節(jié)成分的數(shù)據(jù);Winters方法適合于包含季節(jié)成分(以及長期趨勢)的數(shù)據(jù)。E*CEL中只有簡單的指數(shù)回歸,與這里的絕不相同,從這里也可以看到專業(yè)分析軟件的優(yōu)勢更具體更仔細(xì)),又按Save鍵,如圖26圖26PredictCase選項(xiàng)中選擇Predictthrough,并在Year欄填入1976,month填入6,這樣就可以得到1976年1-6月份的預(yù)測值(注意,此處與上面的回歸不同,不需要增加6個ID,不然結(jié)果會顯示有缺失值)。返回,按Parameters鍵,如圖27圖27分別把Alpha(截距項(xiàng)的平滑系數(shù)),Gamma(趨勢項(xiàng)的平滑系數(shù))和Delta(季節(jié)指數(shù)的平滑系數(shù)),設(shè)為從0到1之間以步長0.05搜索最優(yōu)的參數(shù)值,其它選項(xiàng)采用默認(rèn)值。返回按OK,出現(xiàn)結(jié)果如圖28:圖28從圖可看到平滑指數(shù)分別是Alpha=0.75,Gamma=0,Delta=0,而更重要的是,可以直接得到預(yù)測值,如圖29:圖29除了Fit一項(xiàng)的預(yù)測外,可以得到1976年1-6月的預(yù)測結(jié)果。同時,可以通過FIT1的預(yù)測情況與上面三次曲線回歸方程比較,采用平均絕對誤差、均方根誤差和平均絕對百分誤差的結(jié)果選擇更佳的答案。與E*CEL表現(xiàn)的比較和補(bǔ)充這一點(diǎn)是針對像我這樣開始只懂得用E*CEL的人來說。從個人的體會來說,二種軟件有一定相似,操作都簡便,同時又有一些可以互補(bǔ)的地方。一、圖型的表現(xiàn)力是SPSS的主要優(yōu)點(diǎn)之一應(yīng)該說,E*CEL的圖型表現(xiàn)主要是簡便,對許多的人來說基本夠用,但對于科學(xué)的表現(xiàn),SPSS就更為詳細(xì)和準(zhǔn)確,這一點(diǎn)據(jù)說在所有統(tǒng)計(jì)軟件中都突出。因?yàn)榇蠖嗟臅锩娑颊劦?,這里從略。二、通過SPSS檢驗(yàn)方差齊性和數(shù)據(jù)分布假設(shè)檢驗(yàn)中,采用的t檢驗(yàn)和方差檢驗(yàn)都需要滿足二個要求,即1.樣本方差齊性2.樣本總體呈正態(tài)分布在E*CEL中,提供了F檢驗(yàn)來檢驗(yàn)方差齊性問題。也就是可以先通過F檢驗(yàn)確定方差齊性與否來選擇下一步用哪個T檢驗(yàn)或方差檢驗(yàn)分析工具。但只要數(shù)據(jù)多于二組則無從下手;通過描述統(tǒng)計(jì)大約能從峰度和偏度來了解樣本的分布(實(shí)際工作中,只要分布單峰且近似對稱分布,也可應(yīng)用注2),但要具體確定樣本的分布也有難度。這二個問題在SPSS就可以解決。A、用SPSS檢驗(yàn)方差齊性同樣以UniversityofFloridagraduatesalaries.sav文件作為例子來檢驗(yàn)性別數(shù)據(jù)是否方差齊性a.選擇Analyze->DescriptiveStatistics->E*plore,再選擇DependentList->Graduate,F(xiàn)actorList->Gender,Display->Both,如圖30圖30b.點(diǎn)擊P
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025學(xué)年高中政治第3單元思想方法與創(chuàng)新意識課時作業(yè)18用對立統(tǒng)一的觀點(diǎn)看問題含解析新人教版必修4
- 2024-2025學(xué)年新教材高中歷史第三單元遼宋夏金多民族政權(quán)的并立與元朝的統(tǒng)一單元評估課后作業(yè)含解析新人教版必修中外歷史綱要上
- 2025年度盤扣建筑構(gòu)件質(zhì)量控制檢測合同4篇
- 2025年度汽車制造企業(yè)總經(jīng)理聘請及智能制造合同范本4篇
- 二零二五年度智慧社區(qū)安防系統(tǒng)安裝施工合同范本3篇
- 二零二五年度窗簾產(chǎn)業(yè)園區(qū)建設(shè)與管理合同3篇
- 二零二五年度四人合伙企業(yè)股權(quán)投資合同3篇
- 2025年度餐飲多人合伙經(jīng)營營銷推廣合同范本3篇
- 二手房購買補(bǔ)充合同:2024年定制版版B版
- 二零二五年度2025版二手設(shè)備存量買賣服務(wù)協(xié)議2篇
- 產(chǎn)品共同研發(fā)合作協(xié)議范本5篇
- 風(fēng)水學(xué)的基礎(chǔ)知識培訓(xùn)
- 吸入療法在呼吸康復(fù)應(yīng)用中的中國專家共識2022版
- 1-35kV電纜技術(shù)參數(shù)表
- 信息科技課程標(biāo)準(zhǔn)測(2022版)考試題庫及答案
- 施工組織設(shè)計(jì)方案針對性、完整性
- 2002版干部履歷表(貴州省)
- DL∕T 1909-2018 -48V電力通信直流電源系統(tǒng)技術(shù)規(guī)范
- 2024年服裝制版師(高級)職業(yè)鑒定考試復(fù)習(xí)題庫(含答案)
- 門診部縮短就診等候時間PDCA案例-課件
評論
0/150
提交評論