SPSS主成分分析和因子分析課件_第1頁
SPSS主成分分析和因子分析課件_第2頁
SPSS主成分分析和因子分析課件_第3頁
SPSS主成分分析和因子分析課件_第4頁
SPSS主成分分析和因子分析課件_第5頁
已閱讀5頁,還剩64頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社1第十章主成分分析和因子分析SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社2主要內(nèi)容主要內(nèi)容10.1 主成分分析和因子分析簡介主成分分析和因子分析簡介10.2 主成分分析主成分分析10.3 因子分析因子分析SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社310.1主成分分析和因子分析簡介主成分分析和因子分析簡介10.1.1 基本概念和主要用途基本概念和主要用途(1 1) 基本概念基本概念 主成分分析就是考慮各指標(biāo)之間的相互關(guān)系,利用降維的方法將多個指標(biāo)轉(zhuǎn)換為少數(shù)幾個互不相關(guān)的指標(biāo),從而使進(jìn)一步研究變得簡單的一種統(tǒng)計方法。

2、主成分分析是由Hotelling于1933年首先提出的,是利用“降維”的思想,在損失很少信息的前提下把多個指標(biāo)轉(zhuǎn)化為幾個綜合指標(biāo),稱為主成分。每個主成分均是原始變量的線性組合,且各個主成分之間互不相關(guān),這就使得主成分比原始變量具有某些更優(yōu)越的性能。 因子分析是一種通過顯在變量測評潛在變量,通過具體指標(biāo)測評抽象因子的分析方法,最早是由心理學(xué)家Chales Spearman在1904年提出的,它的基本思想是將實測的多個指標(biāo),用少數(shù)幾個潛在指標(biāo)(因子)的線性組合表示。SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社410.1主成分分析和因子分析簡介主成分分析和因子分析簡介(2 2)主要用途)

3、主要用途解決共線性問題; 評估問卷的結(jié)構(gòu)效度;尋找變量之間的潛在結(jié)構(gòu); 內(nèi)在結(jié)構(gòu)證實。(3 3)常用術(shù)語)常用術(shù)語因子載荷變量共同度公共因子的方差貢獻(xiàn)SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社510.1主成分分析和因子分析簡介主成分分析和因子分析簡介3 3 常用術(shù)語常用術(shù)語(1)因子載荷(2)變量共同度(3)公共因子的方差貢獻(xiàn) SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社610.1主成分分析和因子分析簡介主成分分析和因子分析簡介10.1.2主成分和公因子數(shù)量的確定主成分和公因子數(shù)量的確定(1 1) 確定時遵循幾個原則確定時遵循幾個原則主成分的累積貢獻(xiàn)率:主成分的累積貢

4、獻(xiàn)率:一般來說,提取主成分的累積貢獻(xiàn)率達(dá)到80%85%以上就比較滿意了,可以由此確定需要提取多少個主成分。 特征值:特征值:特征值在某種程度上可以看成表示主成分影響力度大小的指標(biāo),如果特征值小于1,說明該主成分的解釋力度還不如直接引入原變量的平均解釋力度大。因此一般可以用特征值大于1作為納入標(biāo)準(zhǔn)。 綜合判斷:綜合判斷:大量的實際情況表明,如果根據(jù)累積貢獻(xiàn)率來確定主成分?jǐn)?shù)往往較多,而用特征值來確定又往往較少,很多時候應(yīng)當(dāng)將兩者結(jié)合起來,以綜合確定合適的數(shù)量。SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社710.1主成分分析和因子分析簡介主成分分析和因子分析簡介10.1.3 兩者兩者的區(qū)

5、別與聯(lián)系的區(qū)別與聯(lián)系(1)兩者都是在多個原始變量中通過它們之間的內(nèi)部相關(guān)性來獲得新的變量(主成分變量或因子變量),達(dá)到既能減少分析指標(biāo)個數(shù),又能概括原始指標(biāo)主要信息的目的。 (2)提取公因子主要有主成分分析法和公因子法,若采用主成分法,則主成分分析和因子分析基本等價。(3)因子分析提取的公因子比主成分分析提取的主成分更具有解釋性。 (4)兩者分析的實質(zhì)和重點不同。 (5)兩者的SPSS操作都是通過“分析降維因子分析”過程實現(xiàn)的,主成分分析不需要因子旋轉(zhuǎn),而因子分析需要經(jīng)過旋轉(zhuǎn)。SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社8主要內(nèi)容主要內(nèi)容10.1 主成分分析和因子分析簡介主成分分析

6、和因子分析簡介10.2 主成分分析主成分分析10.3 因子分析因子分析SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社910.2 主成分分析主成分分析10.2.1 統(tǒng)計原理與分析步驟統(tǒng)計原理與分析步驟(1)(1)統(tǒng)計原理統(tǒng)計原理 SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社1010.2 主成分分析主成分分析(1)(1)統(tǒng)計原理統(tǒng)計原理 111 11221221 122221 122mmmmppppmmye xe xe xye xe xexye xexexSPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社1110.2 主成分分析主成分分析10.2.1 統(tǒng)計原理與分析步驟

7、統(tǒng)計原理與分析步驟(2 2)分析步驟)分析步驟 第1步 原始數(shù)據(jù)的標(biāo)準(zhǔn)化處理。 第2步 計算相關(guān)系數(shù)矩陣。第3步 計算特征值及單位特征向量。第4步 計算主成分的方差貢獻(xiàn)率和累積方差貢獻(xiàn)率。第5步 計算主成分。 SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社1210.2 主成分分析主成分分析10.2.2 SPSS實例分析實例分析【例10-1】 為了從總體上反映世界經(jīng)濟全球化的狀況,現(xiàn)選擇了具有代表性的16個國家的數(shù)據(jù),這些國家參與經(jīng)濟全球化的程度指標(biāo)值如下表所示。試分析一個國家參與經(jīng)濟全球化的程度主要受哪些因素的影響。編號國家x1x2x3x4x5x6x7x8x9x10 x11x12x1

8、3x14x151中國3.20554.528.530.8781.4090.89411.62.3050.5472.9324.8189.0032.73.9141.4722印度1.44931.10.2790.3390.2720.12.70.1280.1930.8252.3185.1270.640.2183日本14.07952.30.65310.25411.7691.09701.9671.36.17814.74627.29730.957.73415.1254韓國1.318136.31.0111.60.421.8381.30.770.782.26723.3242.8759.112.1290.4525新加坡

9、0.275739.53.57227.8410.88413.31428.60.6220.1431.885169.772 319.90754.2917.3280.7186美國29.64146.13.6826.42920.5634.8085.424.25329.94115.63810.78424.55513.624.49521.2747加拿大2.056101.50.8988.2762.3135.36910.52.4445.1453.85434.69167.04715.121.831.3628巴西2.43427.11.5842.3270.9622.9056.81.9532.30.8574.71610.

10、1016.75.4981.1049墨西哥1.567151.41.6572.8370.7971.47110.90.670.2122.18618.48537.9864.54.8870.46810英國4.67118.40.49726.15112.45622.13711.216.55219.6425.54228.43458.766.1278.96811.28911法國4.639120.61.849.2424.49210.8488.58.2825.8415.2128.4654.05229.256.4538.88912德國6.84132.92.2529.5586.6467.7472.28.5898.971

11、8.84332.12163.1743651.51412.1813意大利3.792104.50.3218.1533.7241.0592.50.771.9134.03222.86943.9242717.7765.67814俄羅斯1.358.61.5331.4990.5520.4992.50.310.2980.9877.7712.5811.12.0010.46915澳大利亞1.30994.50.5025.7730.9411.98718.90.5271.3711.13115.74533.79513.224.1170.797SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社1310.2 主成分分析

12、主成分分析第第1步步 分析:分析:從數(shù)據(jù)來看,一共有15個因素,但有些因素是存在相關(guān)性的,同時各因素對全球化影響的程度也是不一樣的,故可采用主成分分析。 第第2步步 數(shù)據(jù)組織:數(shù)據(jù)組織:按如教材所示的“指標(biāo)”一列定義變量,輸入數(shù)據(jù)并保存。第第3步步 主成分分析的設(shè)置:主成分分析的設(shè)置:按“分析降維因子分析”順序打開“因子分析”對話框,將x1x15這15個變量移入“變量”對話框中,并按如下所示的圖形進(jìn)行設(shè)置。 SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社1410.2 主成分分析主成分分析SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社1510.2 主成分分析主成分分析 由于在

13、SPSS中并沒有完整的主成分分析過程,其主成分分析過程是集成在“因子分析”過程中的,但并不完善。由于主成分的得分需要對因子得分情況進(jìn)行進(jìn)一步計算,故不需設(shè)置“得分”子對話框,即不需保存因子得分情況,即使保存了,因子得分也不是各主成分得分的結(jié)果。 對于提取因子的個數(shù)問題,一般遵循兩個標(biāo)準(zhǔn),其一是累計方差貢獻(xiàn)率在80%以上,其二是其特征值大于1。本例之所以設(shè)置為3,是因為通過預(yù)先分析,發(fā)現(xiàn)前3個主成分可以解釋總體信息的86.7%。 SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社1610.2 主成分分析主成分分析第四步第四步 因子分析的結(jié)果:因子分析的結(jié)果:特征值和方差貢獻(xiàn)表成分初始特征值

14、提取平方和載入合計方差的%累積%合計方差的%累積%16.04940.32540.3256.04940.32540.32525.81338.75579.0805.81338.75579.08031.1427.61686.6961.1427.61686.6964.8765.84292.5385.5993.99696.5346.3262.17498.7097.119.79699.5058.041.27299.7769.018.12199.89710.010.06399.96111.004.02799.98812.001.00999.99713.000.00299.99914.000.001100.0

15、00154.080E-72.720E-6100.000提取方法:主成分分析。從表中可以看出前3個主成分已經(jīng)解釋了總方差的近86.7%,故可以選擇前3個主成分進(jìn)行分析。 SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社1710.2 主成分分析主成分分析第四步第四步 因子分析的結(jié)果:因子分析的結(jié)果:主成分的碎石圖 該圖從另一個側(cè)面說明了取前三個主成分為宜。SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社1810.2 主成分分析主成分分析第四步第四步 因子分析的結(jié)果:因子分析的結(jié)果:旋轉(zhuǎn)前的因子載荷矩陣 成分123x1.407.805.268x2.596-.727.209x3-.14

16、7.016.821x4.895-.333-.181x5.614.763.028x6.826-.124-.281x7.273-.627.184x8.636.703.041x9.619.703.008x10.552.766.196x11.654-.691.172x12.666-.685.166x13.863-.191-.297x14.728-.632.144x15.579.760.005提取方法 :主成分。a. 已提取了 3 個成分。教材中公式10.7中的 是標(biāo)準(zhǔn)化正交向量,并不是SPSS輸出“因子載荷矩陣”中的系數(shù)。而“因子載荷矩陣”中各分量的系數(shù)為單位特征向量乘以相應(yīng)的特征值的平方根的結(jié)果,其

17、公式為 。故需進(jìn)一步利用因子分析的結(jié)果進(jìn)行主成分分析。12(,)iiipieeee /ijijieaSPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社1910.2 主成分分析主成分分析第五步第五步 利用因子分析的結(jié)果進(jìn)行主成分分析。利用因子分析的結(jié)果進(jìn)行主成分分析。SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社2010.2 主成分分析主成分分析第六步第六步 主要結(jié)果:主要結(jié)果:y綜編號國家y1y2y31中國-2.190.073.01-0.632印度-2.56-0.11-0.46-1.113日本0.451.85-0.270.884韓國-1.69-0.46-0.27-0.885新加

18、坡5.28-6.261.19-0.206美國3.306.071.463.807加拿大-0.43-0.47-0.31-0.388巴西-1.91-0.06-0.43-0.839墨西哥-1.68-0.680.03-0.9410英國4.460.98-1.752.0511法國0.870.46-0.520.4912德國1.401.34-0.261.0613意大利-0.610.10-0.54-0.2514俄羅斯-2.35-0.20-0.30-1.0515澳大利亞-1.36-0.92-0.30-0.9316新西蘭-0.99-1.73-0.28-1.09過綜合得分的高低可知各國參與國際化水平的高低,其中美國最高

19、,印度最低。SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社21主要內(nèi)容主要內(nèi)容10.1 主成分分析和因子分析簡介主成分分析和因子分析簡介10.2 主成分分析主成分分析10.3 因子分析因子分析SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社2210.3 因子分析因子分析10.3.1 統(tǒng)計原理與分析步驟統(tǒng)計原理與分析步驟(1)統(tǒng)計原理)統(tǒng)計原理111 11221221 122221 122mmmmppppmmxa Fa Fa Fxa Fa FaFxa FaFaFXAFa其中x1,x2, ,xp為p個原有變量,是均值為零,標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)化變量,F(xiàn)1,F(xiàn)2,F(xiàn)m為m個因子變量,m

20、小于p,表示成矩陣形式為:SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社2310.3 因子分析因子分析10.3.1 統(tǒng)計原理與分析步驟統(tǒng)計原理與分析步驟(2)分析步驟)分析步驟第1步 將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化;第2步 確定待分析的原有若干變量是否適合于因子分析;第3步 構(gòu)造因子變量;第4步 利用旋轉(zhuǎn)使得因子變量更具有可解釋性;第5步 計算因子變量的得分。計算因子得分和模型為:11jjjppFXXj=1,2,m SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社2410.3 因子分析因子分析10.3.2 SPSS實例分析實例分析【例10-2】 為了研究幾個省市的科技創(chuàng)新力問題,現(xiàn)取了

21、2005年8個省市的15個科技指標(biāo)數(shù)據(jù),試分析一個省的科技創(chuàng)新能力主要受哪些潛在因素的影響?省市x1x2x3x4x5x6x7x8x9x10 x11x12x13x14x15北京 229 80.2648.524.49 3.55 5.55 10.23 44774.45 25.0224.1 779.24 226.01 34.42 3183.29 2.12天冿8767.48 36.82 14.08 2.62 1.964.49 35451.77 33.59 21.38 410.34 73.15 25.06 495.78 1.82遼寧4465.69 35.948.342.32 1.562.4518974.2

22、 11.295.57 263.35 22.32 15.21 204.98 1.78上海 104 74.06 35.98 17.84 4.78 2.284.851485.83 39.72 19.08 654.31 112.32 15.85 1303.322江蘇5060.79 34.076.82.13 1.473.17 24489.18 43.13 17.99 206.6816.69.14134.89 1.41浙江5363.48 31.085.423.95 1.221.83 27435.38 7.947.63 257.65 22.665.8279.011.72山東3064.59 33.224.44

23、1.81 1.051.59 20022.57 9.175.69 117.739.768.41106.36 1.34廣東3569.64 37.275.813.66 1.092.18 24327.32 35.67 24.99 117.5120.45.08122.33 1.47SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社2510.3 因子分析因子分析第第1步步 分析:分析:如題所述,要分析一個省的科技創(chuàng)新能力受哪些潛在因素的影響,可用因子分析法進(jìn)行分析。第第2步步 數(shù)據(jù)組織:數(shù)據(jù)組織:建立x1x15共15個數(shù)據(jù)變量和一個“省市”字符型變量,將北京、天津等8個省市作為個案數(shù)據(jù)輸入并保存。第

24、第3步步 因子分析設(shè)置:因子分析設(shè)置:按“分析降維因子分析”打開“因子分析”對話框,將x1x15這15個變量移入“變量”對話框中,表示對這15個變量數(shù)據(jù)進(jìn)行因子分析。SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社2610.3 因子分析因子分析“得分”對話框的設(shè)置:單擊“得分(S)”按鈕,彈出此子對話框,選擇“保存為變量”,即將因子得分保存下來。第第4步主要結(jié)果及分析:步主要結(jié)果及分析:特征值與方差貢獻(xiàn)表可以看出前3個特征值大于1,同時這3個公共因子的方差貢獻(xiàn)率占了93.924%,說明提取這3個公共因子可以解釋原變量的絕大部分信息。SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版

25、社2710.3 因子分析因子分析旋轉(zhuǎn)前的因子載荷矩陣 表的底部表明使用的是主成分分析法,3個主成分被抽取出來。成分123x1.973-.158.052x2.919.036-.090 x3.883-.161.334x4.985-.004-.022x5.482.497-.664x6.947-.242.131x7.972-.108.178x8.849.340-.301x9.300.834.386x10.611.637.399x11.955-.001-.211x12.992-.091-.001x13.876-.282.205x14.968-.156.032x15.859-.092-.385提取方法 :

26、主成分。a. 已提取了3個成分。SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社2810.3 因子分析因子分析旋轉(zhuǎn)后的因子載荷矩陣 是按照前面設(shè)定的“方差極大法”對因子載荷矩陣旋轉(zhuǎn)的結(jié)果。在表10.10所示未經(jīng)旋轉(zhuǎn)的載荷矩陣中,因子變量在許多變量上均有較高的載荷,從旋轉(zhuǎn)后的因子載荷矩陣可以看出,因子1在1、3、4、6、7、12、13、14上有較大載荷 ,反映科技投入與產(chǎn)出情況,可以命名為創(chuàng)新水平因子;因子2在指標(biāo)5、8、15上有較大載荷,反映地區(qū)經(jīng)濟發(fā)展及財政科教投入水平,可以命名為創(chuàng)新環(huán)境因子;因子3在指標(biāo)9和指標(biāo)10上有較大載荷,可以命名為高技術(shù)產(chǎn)業(yè)發(fā)展因子。成分123x1.936

27、.286.130 x2.776.459.202x3.924.016.251x4.867.413.221x5.068.940.180 x6.966.177.095x7.944.202.235x8.541.726.327x9.018.137.956x10.377.172.876x11.794.558.118x12.913.365.161x13.937.071.084x14.926.301.119x15.705.626-.069提取方法:主成分。旋轉(zhuǎn)法:具有Kaiser標(biāo)準(zhǔn)化的正交旋轉(zhuǎn)法。a. 旋轉(zhuǎn)在 5 次迭代后收斂。SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社2910.3 因子分析因

28、子分析因子轉(zhuǎn)換矩陣表 表明因子提取的方法是主成分分析,旋轉(zhuǎn)的方法是方差極大法。成分1231.884.403.2392-.405.400.8223.236-.823.517提取方法:主成分。旋轉(zhuǎn)法:具有Kaiser標(biāo)準(zhǔn)化的正交旋轉(zhuǎn)法。因子得分及綜合因子得分情況 省市F1F2F3F綜合排序山東-0.344-1.001-0.945-0.5368浙江-0.7910.905-1.223-0.4737江蘇-0.488-1.0241.073-0.3426廣東-0.791-0.1041.202-0.3275遼寧-0.002-0.500-1.206-0.2694天冿0.248-0.2750.5720.1773上

29、海-0.1361.9470.4810.3662北京2.3050.0530.0451.40611230.60280.195070.14137FFFFSPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社30The EndSPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社31第十一章時間序列分析SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社32主要內(nèi)容主要內(nèi)容11.1 時間序列的建立和平穩(wěn)化時間序列的建立和平穩(wěn)化11.2 指數(shù)平滑法指數(shù)平滑法11.3 ARIMA模型模型11.4 時序序列的季節(jié)性分解時序序列的季節(jié)性分解SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社331

30、1.1 時間序列的建立和平穩(wěn)化時間序列的建立和平穩(wěn)化11.1.1 填補缺失值填補缺失值 時間序列分析中的缺失值不能采用通常刪除的辦法來解決,因為這樣會導(dǎo)致原有時間序列周期性的破壞,而無法得到正確的分析結(jié)果。 按“轉(zhuǎn)換替換缺失值”打開“替換缺失值”對話框缺失值替換示例SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社3411.1 時間序列的建立和平穩(wěn)化時間序列的建立和平穩(wěn)化11.1.2 定義日期變量定義日期變量 定義日期模塊可以產(chǎn)生周期性的時間序列日期變量。使用“定義日期”對話框定義日期變量,需要在數(shù)據(jù)窗口讀入一個按某種時間順序排列的數(shù)據(jù)文件,數(shù)據(jù)文件中的變量名不能與系統(tǒng)默認(rèn)的時間變量名重

31、復(fù),否則系統(tǒng)建立的日期變量會覆蓋同名變量。系統(tǒng)默認(rèn)的變量名有:年份,年份、季度,年份、月份,年份、季度、月份,日,星期、日,日、小時等。 按“數(shù)據(jù)定義日期”順序打開“定義日期”對話框 定義日期變量示例SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社3511.1 時間序列的建立和平穩(wěn)化時間序列的建立和平穩(wěn)化11.1.3 創(chuàng)建時間序列創(chuàng)建時間序列 時間序列分析建立在序列平穩(wěn)的條件上,判斷序列是否平穩(wěn)可以看它的均數(shù)方差是否不再隨時間的變化而變化,自相關(guān)系數(shù)是否只與時間間隔有關(guān)而與所處時間無關(guān)。在時間序列分析中,為檢驗時間序列的平穩(wěn)性,經(jīng)常要用一階差分、二階差分,有時為選擇一個合適的時間序列模

32、型還要對原時間序列數(shù)據(jù)進(jìn)行對數(shù)轉(zhuǎn)換或平方轉(zhuǎn)換等。這就需要在已經(jīng)建立的時間序列數(shù)據(jù)文件中,再建立一個新的時間序列變量。 按“轉(zhuǎn)換創(chuàng)建時間序列”順序打開“創(chuàng)建時間序列”對話框創(chuàng)建時間序列示例SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社3611.1 時間序列的建立和平穩(wěn)化時間序列的建立和平穩(wěn)化11.1.3 創(chuàng)建時間序列創(chuàng)建時間序列 時序圖舉例,按“分析預(yù)測序列圖”順序打開“序列圖”對話框 時序圖示例SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社37主要內(nèi)容主要內(nèi)容11.1 時間序列的建立和平穩(wěn)化時間序列的建立和平穩(wěn)化11.2 指數(shù)平滑法指數(shù)平滑法11.3 ARIMA模型模型11

33、.4 時序序列的季節(jié)性分解時序序列的季節(jié)性分解SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社3811.2 指數(shù)平滑法指數(shù)平滑法11.2.1 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理(1)基本概念)基本概念 指數(shù)平滑法的思想來源于對移動平均預(yù)測法的改進(jìn)。指數(shù)平滑法的思想是以無窮大為寬度,各歷史值的權(quán)重隨時間的推移呈指數(shù)衰減,這樣就解決了移動平均的兩個難題。(2)統(tǒng)計原理)統(tǒng)計原理 0100(1)jtjjjttjjjjzzz-SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社3911.2 指數(shù)平滑法指數(shù)平滑法11.2.1 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理(2)統(tǒng)計原理)統(tǒng)計原理 簡

34、單模型211121(1)(1)(1)Nttttt Nzzzzz-Holt線性趨勢模型 1111(1)(), , 01ttttzzzbzz-111()(1) 0, 01ttttbzzbb-,t mttzzbmSPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社4011.2 指數(shù)平滑法指數(shù)平滑法11.2.2 SPSS實例分析實例分析【例11-4】 為了研究上海市的人口情況,某研究小組提取了19782004年上海市的人口數(shù)據(jù),其中有3個統(tǒng)計指標(biāo),即x1:年末人口數(shù)(萬人),x2:非農(nóng)業(yè)人口數(shù)(萬人),x3:人口密度(人/平方千米),具體數(shù)據(jù)如下表所示。試用指數(shù)平滑法對上海市的“年末人口數(shù)”進(jìn)行預(yù)

35、測分析。年份x1x2x3年份x1x2x319781098.28645.23177619921289.37875.55203419791132.14687.38183019931294.74893.46204219801146.52702.43185419941298.81910.49204819811162.84715.08188019951301.37921.7205219821180.51731.31190819961304.43932.14205719831194.01745.86193019971305.46943.03205919841204.78760.75194819981306

36、.58953.65206119851216.69776.37196719991313.12969.63207119861232.33802.56194420001321.63986.16208419871249.51822.31197120011327.14999.07209319881262.42838.93199120021334.231018.81210419891276.45855.84201320031341.771041.39211619901283.35864.46202420041352.391097.62133SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社4111.

37、2 指數(shù)平滑法指數(shù)平滑法第第1步步 數(shù)據(jù)組織:數(shù)據(jù)組織:將數(shù)據(jù)組織成4列,一列是“年份”,另外3列是3個人口數(shù)據(jù)的變量,輸入數(shù)據(jù)并保存。第第2步步 分析:分析:看用指數(shù)平滑法處理是否恰當(dāng)。按11.1.3節(jié)所述創(chuàng)建年末人口數(shù)的時序圖,如下圖所示。從此圖可以看出,年末人口數(shù)呈逐年增加趨勢,開始增長較快,然后變慢,近似線性趨勢,也可以說呈衰減的線性趨勢,或者用指數(shù)趨勢描述更準(zhǔn)確。所以選用指數(shù)平滑法進(jìn)行處理。SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社4211.2 指數(shù)平滑法指數(shù)平滑法第第3步步 定義日期變量:定義日期變量:按11.1.2節(jié)所述將“年份”定義為日期變量。第第4步步 指數(shù)平滑

38、法設(shè)置:指數(shù)平滑法設(shè)置:按“分析預(yù)測創(chuàng)建模型”順序打開“時間序列建模器”對話框。具體設(shè)置如幾下幾張圖所示:SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社4311.2 指數(shù)平滑法指數(shù)平滑法SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社4411.2 指數(shù)平滑法指數(shù)平滑法第第5步步 主要結(jié)果及分析:主要結(jié)果及分析:模型的描述表模型類型模型 ID年末人口數(shù)模型_1Holt表示對“年末人口數(shù)”變量進(jìn)行指數(shù)平滑法處理,使用的是“Holt”模型。模型的擬合情況表 擬合統(tǒng)計量均值SE最小值最大值百分位5102550759095平穩(wěn)的R方-.005.-.005-.005-.005-.005-

39、.005-.005-.005-.005-.005R方.995.995.995.995.995.995.995.995.995.995RMSE4.811.4.8114.8114.8114.8114.8114.8114.8114.8114.811MAPE.243.243.243.243.243.243.243.243.243.243MaxAPE1.632.1.6321.6321.6321.6321.6321.6321.6321.6321.632MAE3.001.3.0013.0013.0013.0013.0013.0013.0013.0013.001MaxAE18.707.18.70718.707

40、18.70718.70718.70718.70718.70718.70718.707正態(tài)化的BIC3.386.3.3863.3863.3863.3863.3863.3863.3863.3863.386包含了8個擬合情況度量指標(biāo),其中“平穩(wěn)的R方”值為0.005,“R方”值為0.995,并給出了每個度量模型的百分位數(shù)。SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社4511.2 指數(shù)平滑法指數(shù)平滑法模型統(tǒng)計量表從中可以看出模型的決定系數(shù)為0.995,說明擬合模型可以解釋原序列99.5%的信息量,正態(tài)化的BIC值也比較小,說明模型的擬合效果是很好的,另外還給出了擬合統(tǒng)計量及Ljung-Bo

41、x統(tǒng)計情況。此外,所有數(shù)據(jù)中沒有離群值(孤立點)。指數(shù)平滑法擬合的模型參數(shù)表模型預(yù)測變量數(shù)模型擬合統(tǒng)計量Ljung-Box Q(18)離群值數(shù)R方正態(tài)化的 BIC統(tǒng)計量DFSig.年末人口數(shù)-模型_10.9953.3865.87116.9890模型估計SEtSig.年末人口數(shù)-模型_1無轉(zhuǎn)換 Alpha(水平)1.000.1576.351.000Gamma(趨勢).799.3002.659.013SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社4611.2 指數(shù)平滑法指數(shù)平滑法預(yù)測表表中給出了20052009年“年末人口”變量的預(yù)測值、上區(qū)間和下區(qū)間值。模型20052006200720

42、082009年末人口數(shù)-模型_1預(yù)測1362.361372.341382.311392.281402.26UCL1372.271392.731415.151439.301465.02LCL1352.451351.941349.471345.261339.49對于每個模型,預(yù)測都在請求的預(yù)測時間段范圍內(nèi)的最后一個非缺失值之后開始,在所有預(yù)測值的非缺失值都可用的最后一個時間段或請求預(yù)測時間段的結(jié)束日期(以較早者為準(zhǔn))結(jié)束。觀測值與預(yù)測值的時序圖SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社4711.2 指數(shù)平滑法指數(shù)平滑法數(shù)據(jù)文件中保存情況SPSS 19(中文版)統(tǒng)計分析實用教程 電子工

43、業(yè)出版社48主要內(nèi)容主要內(nèi)容11.1 時間序列的建立和平穩(wěn)化時間序列的建立和平穩(wěn)化11.2 指數(shù)平滑法指數(shù)平滑法11.3 ARIMA模型模型11.4 時序序列的季節(jié)性分解時序序列的季節(jié)性分解SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社4911.3 ARIMA模型模型11.3.1 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理(1)基本概念)基本概念 在預(yù)測中,對于平穩(wěn)的時間序列,可用自回歸移動平均(AutoRegres- sive Moving Average, ARMA)模型及特殊情況的自回歸(AutoRegressive, AR)模型、移動平均(Moving Average, MA)模型

44、等來擬合,預(yù)測該時間序列的未來值,但在實際的經(jīng)濟預(yù)測中,隨機數(shù)據(jù)序列往往都是非平穩(wěn)的,此時就需要對該隨機數(shù)據(jù)序列進(jìn)行差分運算,進(jìn)而得到ARMA模型的推廣ARIMA模型。 ARIMA模型全稱綜合自回歸移動平均(AutoRegressive Integrated Moving Average)模型,簡記為ARIMA(p, d, q)模型,其中AR是自回歸,p為自回歸階數(shù);MA為移動平均,q為移動平均階數(shù);d為時間序列成為平穩(wěn)時間序列時所做的差分次數(shù)。ARIMA(p, d, q)模型的實質(zhì)就是差分運算與ARMA(p, q)模型的組合,即ARMA(p, q)模型經(jīng)d次差分后,便為ARIMA(p, d,

45、 q)。 SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社5011.3 ARIMA模型模型11.3.1 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理(2)統(tǒng)計原理)統(tǒng)計原理 ARMA過程 11221122tttptptttqt qxxxxaaaa-1122ttttqt qxaaaa-1122tttptptxxxxa-212( )1ppBBBB -212( )1qqBBBB -則ARMA(p, q)模型簡記為( )( )ttB xB a1( ) ( )ttxBB a-或 SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社5111.3 ARIMA模型模型11.3.1 基本概念及統(tǒng)計原理基本概

46、念及統(tǒng)計原理(2)統(tǒng)計原理)統(tǒng)計原理 ARMA模型的識別 設(shè)ACF代表xt的自相關(guān)函數(shù),PACF代表xt的偏自相關(guān)函數(shù)。根據(jù)Box-Jenkins提出的方法,用樣本的自相關(guān)函數(shù)(ACF)和偏自相關(guān)函數(shù)(PACF)的截尾性來初步識別ARMA模型的階數(shù)。具體如下表所示。 模 型自相關(guān)函數(shù)(ACF)偏自相關(guān)函數(shù)(PACF)AR(p)拖尾p階截尾MA(q)q階截尾拖尾ARMA(p, q)拖尾拖尾SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社5211.3 ARIMA模型模型11.3.1 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理 所謂拖尾是自相關(guān)系數(shù)或偏相關(guān)系數(shù)逐步趨向于0,這個趨向過程有不同的表現(xiàn)

47、形式,有幾何型的衰減,有正弦波式的衰減;而所謂截尾是指從某階后自相關(guān)或偏相關(guān)系數(shù)為0。SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社5311.3 ARIMA模型模型11.3.1 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理(2)統(tǒng)計原理)統(tǒng)計原理 非平穩(wěn)時間序列ARIMA過程 SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社5411.3 ARIMA模型模型11.3.1 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理(2)統(tǒng)計原理)統(tǒng)計原理 季節(jié)ARIMA模型 時間序列常呈周期性變化,或稱為季節(jié)性趨勢。用變通的ARIMA模型處理這種季節(jié)性趨勢會導(dǎo)致參數(shù)過多,模型復(fù)雜。季節(jié)性乘積模型可以得到參數(shù)簡

48、約的模型。季節(jié)性乘積模型表示為ARIMA(p, d, q, sp, sd, sq)(或ARIMA(p, d, q) (sp, sd, sq)k)。其中,sp表示季節(jié)模型的自回歸系數(shù);sd表示季節(jié)差分的階數(shù),通常為一階季節(jié)差分;sq表示季節(jié)模型的移動平均參數(shù)。如是月度資料,要描述年度特征,則sd = 12;如是日志資料,要描述每周特征,則sd = 7。SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社5511.3 ARIMA模型模型11.3.1 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理(3)ARIMA建模步驟建模步驟 ARIMA建模實際上包括3個階段,即模型識別階段、參數(shù)估計和檢驗階段、預(yù)測應(yīng)

49、用階段。其中前兩個階段可能需要反復(fù)進(jìn)行。 ARIMA模型的識別就是判斷p,d,q,sp,sd,sq的階,主要依靠自相關(guān)函數(shù)(ACF)和偏自相關(guān)函數(shù)(PACF)圖來初步判斷和估計。一個識別良好的模型應(yīng)該有兩個要素:一是模型的殘差為白噪聲序列,需要通過殘差白噪聲檢驗,二是模型參數(shù)的簡約性和擬合優(yōu)度指標(biāo)的優(yōu)良性(如對數(shù)似然值較大,AIC和BIC較?。┓矫嫒〉闷胶?,還有一點需要注意的是,模型的形式應(yīng)該易于理解。SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社5611.3 ARIMA模型模型11.3.2 SPSS實例分析實例分析【例11-5】表是某加油站55天的燃油剩余數(shù)據(jù),其中正值表示燃油有剩

50、余,負(fù)值表示燃油不足,要求對此序列擬合時間序列模型并進(jìn)行分析。天12345678910111213141516171819燃油數(shù)據(jù) 92-858012103-1-20-90 100 -40-22078-98-97565天20212223242526272829303132333435363738燃油數(shù)據(jù) 80-20 -8501150 -100 135 -70 -60 -5030-103-65108-10 10天3940414243444546474849505152535455燃油數(shù)據(jù) -2590-30 -32 1520159015-10-88025 -12070-10SPSS 19(中文版)

51、統(tǒng)計分析實用教程 電子工業(yè)出版社5711.3 ARIMA模型模型第第1步步 數(shù)據(jù)組織:數(shù)據(jù)組織:將數(shù)據(jù)組織成兩列,一列是“天數(shù)”,另一列是“燃油量”,輸入數(shù)據(jù)并保存,并以“天數(shù)”定義日期變量。第第2步步 觀察數(shù)據(jù)序列的性質(zhì):觀察數(shù)據(jù)序列的性質(zhì): 先作時序圖,觀察數(shù)據(jù)序列的特點。按“分析預(yù)測序列圖”的順序打開“序列圖”對話框,將“油料量”設(shè)置為變量,并將所生成的日期新變量“DATE_”設(shè)為時間標(biāo)簽軸,生成如下圖所示的時序圖。可以看出數(shù)據(jù)序列在0上下振蕩,且無規(guī)律,可能是平穩(wěn)的時間序列。SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社5811.3 ARIMA模型模型再做自相關(guān)圖和偏自相關(guān)圖

52、進(jìn)一步分析。按“分析預(yù)測自相關(guān)”順序打開“自相關(guān)”對話框,并在“輸出”選項組中將“自相關(guān)”和“偏自相關(guān)”同時選上,輸出結(jié)果如下面兩圖所示。從上左圖可以看出,自相關(guān)函數(shù)呈現(xiàn)出比較典型的拖尾性,說明數(shù)據(jù)自相關(guān)性隨時間間隔下降。從上右圖可以看出,除了延遲1階的偏自相關(guān)系數(shù)在2倍標(biāo)準(zhǔn)差范圍之外,其他除數(shù)的偏自相關(guān)系數(shù)都在2倍標(biāo)準(zhǔn)差范圍內(nèi)波動。根據(jù)這個特點可以判斷該序列具有短期相關(guān)性,進(jìn)一步確定序列平穩(wěn)。同時,可以認(rèn)為該序列偏自相關(guān)函數(shù)1階截尾。綜合該序列自相關(guān)函數(shù)和偏自相關(guān)函數(shù)的性質(zhì),根據(jù)前表的模型識別規(guī)則,可以擬合模型為AR(1),即ARIMA(1, 0, 0)。SPSS 19(中文版)統(tǒng)計分析實用

53、教程 電子工業(yè)出版社5911.3 ARIMA模型模型第第3步步 模型擬合:模型擬合: 按“分析預(yù)測創(chuàng)建模型”順序打開“時間序列建模器”對話框,將“燃油量”選入“因變量”框。設(shè)置過程與圖11-7類似,并選擇“方法”下的“ARIMA”模型?!皸l件”對話框設(shè)置。單擊“方法”右邊的“條件(C)”按鈕,打開“時間序列建模器:ARIMA條件”對話框,并按如下圖所示進(jìn)行設(shè)置。在“ARIMA階數(shù)”框中需設(shè)置“非季節(jié)性”參數(shù):自回歸的階p、差分的階d和移動平均數(shù)q。如果時間序列有季節(jié)性因素,還需設(shè)置“季節(jié)性”參數(shù)sp,sd和sq。由于經(jīng)過前面的分析,此例是ARIMA(1, 0, 0)模型,且無季節(jié)性影響,則只需

54、將自回歸的階數(shù)設(shè)為1,其余均為0。SPSS 19(中文版)統(tǒng)計分析實用教程 電子工業(yè)出版社6011.3 ARIMA模型模型 “統(tǒng)計量”選項卡的設(shè)置:“統(tǒng)計量”選項卡如圖11-9所示,將“按模型顯示擬合度量、Ljung-Box統(tǒng)計量和離群值的數(shù)量”、“R方”、“標(biāo)準(zhǔn)化的BIC”、“擬合優(yōu)度”、“參數(shù)估計”勾上?!皥D表”選項卡的設(shè)置:在其中將“序列”、“殘差自相關(guān)函數(shù)”、“殘差偏自相關(guān)函數(shù)”、“觀測值”和“預(yù)測值”這些選項選上。其他選項卡的設(shè)置讀者可參照例11-4進(jìn)行。第第4步步 主要結(jié)果及分析:主要結(jié)果及分析:模型的統(tǒng)計量表模型預(yù)測變量數(shù)模型擬合統(tǒng)計量Ljung-Box Q(18)離群值數(shù)R方正態(tài)化的 BIC統(tǒng)計量DFSig.燃油量-模型_10.1398.17014.68817.6180列出了模型擬合的一些統(tǒng)計量,包括決定系數(shù)(R方)、標(biāo)準(zhǔn)化

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論