多元統(tǒng)計(jì)分析及實(shí)現(xiàn)_第1頁(yè)
多元統(tǒng)計(jì)分析及實(shí)現(xiàn)_第2頁(yè)
多元統(tǒng)計(jì)分析及實(shí)現(xiàn)_第3頁(yè)
多元統(tǒng)計(jì)分析及實(shí)現(xiàn)_第4頁(yè)
多元統(tǒng)計(jì)分析及實(shí)現(xiàn)_第5頁(yè)
已閱讀5頁(yè),還剩129頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、多元統(tǒng)計(jì)分析及實(shí)現(xiàn)第1頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二 多元統(tǒng)計(jì)分析方法從研究問(wèn)題的角度可以分為不同的類,相應(yīng)有具體解決問(wèn)題的方法。問(wèn)題 內(nèi)容 方法 數(shù)據(jù)或結(jié)構(gòu)性化簡(jiǎn) 盡可能簡(jiǎn)單地表示所研究的現(xiàn)象,但不損失很多有用的信息,并希望這種表示能夠很容易的解釋。 多元回歸分析、聚類分析、主成分分析、因子分析、相應(yīng)分析、多維標(biāo)度法、可視化分析 分類和組合 基于所測(cè)量到的一些特征,給出好的分組方法,對(duì)相似的對(duì)象或變量分組。 判別分析、聚類分析、主成分分析、可視化分析 變量之間的相關(guān)關(guān)系 變量之間是否存在相關(guān)關(guān)系,相關(guān)關(guān)系又是怎樣體現(xiàn)。 多元回歸、典型相關(guān)、主成分分析、因子分析、相

2、應(yīng)分析、多維標(biāo)度法、可視化分析 預(yù)測(cè)與決策 通過(guò)統(tǒng)計(jì)模型或最優(yōu)準(zhǔn)則,對(duì)未來(lái)進(jìn)行預(yù)見(jiàn)或判斷。 多元回歸、判別分析、聚類分析、可視化分析 假設(shè)的提出及檢驗(yàn)檢驗(yàn)由多元總體參數(shù)表示的某種統(tǒng)計(jì)假設(shè),能夠證實(shí)某種假設(shè)條件的合理性。 多元總體參數(shù)估計(jì)、假設(shè)檢驗(yàn) 第2頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二多元統(tǒng)計(jì)分析是運(yùn)用數(shù)理統(tǒng)計(jì)方法來(lái)研究解決多指標(biāo)問(wèn)題的理論和方法。本講重點(diǎn)介紹常用的統(tǒng)計(jì)方法。這些方法包括聚類分析、主成分分析、因子分析、判別分析、對(duì)應(yīng)分析、典型相關(guān)分析、方差分析、回歸分析等。典型統(tǒng)計(jì)賽題:葡萄酒評(píng)價(jià)(2012年A題)第3頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,

3、星期二葡萄酒評(píng)價(jià)(2012年A題)第4頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二內(nèi)容提綱1、數(shù)據(jù)處理2、描述性統(tǒng)計(jì)3、聚類分析4、主成分分析5、因子分析6、判別分析7、方差分析8、回歸分析第5頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二一、數(shù)據(jù)處理SPSS界面介紹建立數(shù)據(jù)文件制圖第6頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二一、數(shù)據(jù)處理SPSS界面介紹數(shù)據(jù)編輯窗口第7頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二一、數(shù)據(jù)處理SPSS界面介紹結(jié)果編輯窗口第8頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二一、數(shù)據(jù)處理建立數(shù)據(jù)文件

4、定義變量數(shù)據(jù)錄入數(shù)據(jù)文件的保存數(shù)據(jù)編輯調(diào)用其它數(shù)據(jù)文件第9頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二一、數(shù)據(jù)處理建立數(shù)據(jù)文件:定義變量 單擊數(shù)據(jù)編輯窗口左下方的“Variable View”標(biāo)簽或雙擊題頭(Var),進(jìn)入變量定義窗口。可定義: 變量名(Name) 變量類型(Type) 變量長(zhǎng)度(Width) 小數(shù)點(diǎn)位數(shù)(Decimal) 變量標(biāo)簽(Label) 變量值標(biāo)簽(Values) 缺失值的定義方式(Missing) 變量的顯示寬度(Columns) 變量顯示的對(duì)齊方式(Align) 變量的測(cè)量尺度(Measure)第10頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分

5、,星期二一、數(shù)據(jù)處理建立數(shù)據(jù)文件:定義變量 定義變量名(Name)時(shí),應(yīng)注意:(1)變量名可為漢字或英文,英文的第一個(gè)字符必須為字母,后面可跟任意字母、數(shù)字、句點(diǎn)或、#、_、$等;(2)變量名不能以句點(diǎn)結(jié)尾;(3)定義時(shí)應(yīng)避免最后一個(gè)字符為下劃線“_”(因?yàn)槟承┻^(guò)程運(yùn)行時(shí)自動(dòng)創(chuàng)建的變量名的最后一個(gè)字符有可能為下劃線);(4)變量的長(zhǎng)度一般不能超過(guò)8個(gè)字符;(5)每個(gè)變量名必須保證是唯一的,不區(qū)分大小寫(xiě)。常用的變量類型(Type)包括:數(shù)值型、字符串型、日期格式變量等。第11頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二一、數(shù)據(jù)處理建立數(shù)據(jù)文件:數(shù)據(jù)錄入直接錄入調(diào)入數(shù)據(jù):excel、

6、記事本等第12頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二一、數(shù)據(jù)處理建立數(shù)據(jù)文件:保存選擇“File”菜單的“Save”命令,可直接保存為SPSS默認(rèn)的數(shù)據(jù)文件格式(*.sav)。選擇“File”菜單的“Save As”命令,彈出“Save Data As”對(duì)話框,可選擇保存為Excel(*.xls)等文件格式。第13頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二一、數(shù)據(jù)處理建立數(shù)據(jù)文件:數(shù)據(jù)編輯(1)數(shù)據(jù)的排序: 數(shù)據(jù)排序個(gè)案 數(shù)據(jù)排列變量 (2)數(shù)據(jù)的轉(zhuǎn)置: 數(shù)據(jù)轉(zhuǎn)置 分割文件、重組、選擇個(gè)案等第14頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二一、

7、數(shù)據(jù)處理制圖主要通過(guò)“Graph”菜單中的選項(xiàng)來(lái)創(chuàng)建圖形第15頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二二、描述性統(tǒng)計(jì) 例2.1:數(shù)據(jù)2.1給出了員工代碼、性別、起始薪金、當(dāng)前薪金等信息:1.利用頻率計(jì)算當(dāng)前薪金的描述性統(tǒng)計(jì)量,并繪制帶正態(tài)檢驗(yàn)的直方圖;2.利用探索性分析不同性別員工當(dāng)前薪金情況;3.用比率分析比較不同性別員工的薪金增長(zhǎng)率是否有較大差異;4.用P-P圖和Q-Q圖檢驗(yàn)當(dāng)前薪金是否符合正態(tài)分布第16頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二二、描述性統(tǒng)計(jì)1.利用頻率計(jì)算當(dāng)前薪金的描述性統(tǒng)計(jì)量,并繪制帶正態(tài)檢驗(yàn)的直方圖第17頁(yè),共134頁(yè),2022年,

8、5月20日,23點(diǎn)1分,星期二二、描述性統(tǒng)計(jì)1.利用頻率計(jì)算當(dāng)前薪金的描述性統(tǒng)計(jì)量,并繪制帶正態(tài)檢驗(yàn)的直方圖第18頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二二、描述性統(tǒng)計(jì) 2.利用探索性分析不同性別員工當(dāng)前薪金情況 單擊“分割文件”按鈕,將“性別”指定為分組方式,選中“比較組”,單擊“確定”分析描述統(tǒng)計(jì)描述,將“當(dāng)前薪金”指定為變量,單擊“選項(xiàng)”按鈕,選中所需統(tǒng)計(jì)量,單擊“繼續(xù)”,單擊“確定”分析描述統(tǒng)計(jì)探索,將“當(dāng)前薪金”指定為因變量,將“性別”指定為因子,單擊“繪制”,選定“直方圖”,單擊“繼續(xù)”,單擊“確定”第19頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二

9、二、描述性統(tǒng)計(jì) 2.利用探索性分析不同性別員工當(dāng)前薪金情況p值小于0.05,通過(guò)正態(tài)性檢驗(yàn),即認(rèn)為當(dāng)前薪金分布服從正態(tài)分布第20頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二二、描述性統(tǒng)計(jì)3.用比率分析比較不同性別員工的薪金增長(zhǎng)率是否有較大差異分析描述統(tǒng)計(jì)比率,將“當(dāng)前薪金”指定為分子,將“起始薪金”指定為分母,將“性別”指定為組變量,單擊“統(tǒng)計(jì)量”,選中:均值、置信區(qū)間、AAD、PRD、COD,單擊“繼續(xù)”,單擊“確定”第21頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二二、描述性統(tǒng)計(jì)3.用比率分析比較不同性別員工的薪金增長(zhǎng)率是否有較大差異第22頁(yè),共134頁(yè),202

10、2年,5月20日,23點(diǎn)1分,星期二二、描述性統(tǒng)計(jì) 4.用P-P圖和Q-Q圖檢驗(yàn)當(dāng)前薪金是否符合正態(tài)分布 Q-Q圖是一種散點(diǎn)圖,對(duì)應(yīng)于正態(tài)分布的QQ圖,就是由標(biāo)準(zhǔn)正態(tài)分布的分位數(shù)為橫坐標(biāo),樣本值為縱坐標(biāo)的散點(diǎn)圖. 要利用QQ圖鑒別樣本數(shù)據(jù)是否近似于正態(tài)分布,只需看QQ圖上的點(diǎn)是否近似地在一條直線附近,而且該直線的斜率為標(biāo)準(zhǔn)差,截距為均值. 用QQ圖還可獲得樣本偏度和峰度的粗略信息. P-P圖是根據(jù)變量的累積比例與指定分布的累積比例之間的關(guān)系所繪制的圖形。通過(guò)P-P圖可以檢驗(yàn)數(shù)據(jù)是否符合指定的分布。當(dāng)數(shù)據(jù)符合指定分布時(shí),P-P圖中各點(diǎn)近似呈一條直線。如果P-P圖中各點(diǎn)不呈直線,但有一定規(guī)律,可以

11、對(duì)變量數(shù)據(jù)進(jìn)行轉(zhuǎn)換,使轉(zhuǎn)換后的數(shù)據(jù)更接近指定分布。 P-P圖和Q-Q圖的用途完全相同,只是檢驗(yàn)方法存在差異第23頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二聚類分析就是分析如何對(duì)樣品(或變量)進(jìn)行量化分類的問(wèn)題。 通常聚類分析分為Q型聚類和R型聚類。Q型聚類是對(duì)樣品進(jìn)行分類處理;R型聚類是對(duì)變量進(jìn)行分類處理。三、聚類分析聚類分析的概念及分類第24頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二 在聚類之前,要首先分析樣品(變量)間的相似性。樣品相似性度量(距離):即兩個(gè)樣品間相似程度就可用p維空間中的兩點(diǎn)距離公式來(lái)度量。變量相似性度量(夾角余弦、相關(guān)系數(shù))相對(duì)于數(shù)據(jù)的大

12、小,我們更關(guān)心變量的方向及相關(guān)性三、聚類分析相似性度量第25頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二三、聚類分析相似性度量幾種距離第26頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二三、聚類分析相似性度量第27頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二三、聚類分析相似性度量3距離選擇的原則 一般說(shuō)來(lái),同一批數(shù)據(jù)采用不同的距離公式,會(huì)得到不同的分類結(jié)果。產(chǎn)生不同結(jié)果的原因,主要是由于不同的距離公式的側(cè)重點(diǎn)和實(shí)際意義都有不同。因此我們?cè)谶M(jìn)行聚類分析時(shí),應(yīng)注意距離公式的選擇。通常選擇距離公式應(yīng)注意遵循以下的基本原則:(1)要考慮所選擇的距離公式在實(shí)際應(yīng)用

13、中有明確的意義。如歐氏距離就有非常明確的空間距離概念。馬氏距離有消除量綱影響的作用。(2)要綜合考慮對(duì)樣本觀測(cè)數(shù)據(jù)的預(yù)處理和將要采用的聚類分析方法。如在進(jìn)行聚類分析之前已經(jīng)對(duì)變量作了標(biāo)準(zhǔn)化處理,則通常就可采用歐氏距離。(3)要考慮研究對(duì)象的特點(diǎn)和計(jì)算量的大小。樣品間距離公式的選擇是一個(gè)比較復(fù)雜且?guī)в幸欢ㄖ饔^性的問(wèn)題,我們應(yīng)根據(jù)研究對(duì)象的特點(diǎn)不同做出具體分折。實(shí)際中,聚類分析前不妨試探性地多選擇幾個(gè)距離公式分別進(jìn)行聚類,然后對(duì)聚類分析的結(jié)果進(jìn)行對(duì)比分析,以確定最合適的距離測(cè)度方法。第28頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二三、聚類分析相似性度量第29頁(yè),共134頁(yè),2022

14、年,5月20日,23點(diǎn)1分,星期二 無(wú)論是夾角余弦還是相關(guān)系數(shù),它們的絕對(duì)值都小于1,作為變量近似性的度量工具,我們把它們統(tǒng)記為cij。當(dāng)cij= 1時(shí),說(shuō)明變量Xi與Xj完全相似;當(dāng)cij近似于1時(shí),說(shuō)明變量Xi與Xj非常密切;當(dāng)cij = 0時(shí),說(shuō)明變量Xi與Xj完全不一樣;當(dāng)cij近似于0時(shí),說(shuō)明變量Xi與Xj差別很大。 據(jù)此,我們把比較相似的變量聚為一類,把不太相似的變量歸到不同的類內(nèi)。在實(shí)際聚類過(guò)程中,為了計(jì)算方便,我們把變量間相似性的度量公式作一個(gè)變換為 dij = 1 cij 或者 dij2 = 1 cij2 來(lái)表示變量間的距離遠(yuǎn)近,小則先聚成一類,這比較符合人們的一般思維習(xí)慣。

15、三、聚類分析相似性度量第30頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二 A)系統(tǒng)聚類法 B)K均值聚類法三、聚類分析常見(jiàn)聚類方法第31頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二A)系統(tǒng)聚類法系統(tǒng)聚類的基本思想是:距離相近的樣品(或變量)先聚成類,距離相遠(yuǎn)的后聚成類,過(guò)程一直進(jìn)行下去,每個(gè)樣品(或變量)總能聚到合適的類中。系統(tǒng)聚類過(guò)程是:假設(shè)總共有n個(gè)樣品(或變量),第一步將每個(gè)樣品(或變量)獨(dú)自聚成一類,共有n類;第二步根據(jù)所確定的樣品(或變量)“距離”公式,把距離較近的兩個(gè)樣品(或變量)聚合為一類,其它的樣品(或變量)仍各自聚為一類,共聚成n 1類;第三步將“

16、距離”最近的兩個(gè)類進(jìn)一步聚成一類,共聚成n 2類;,以上步驟一直進(jìn)行下去,最后將所有的樣品(或變量)全聚成一類。為了直觀地反映以上的系統(tǒng)聚類過(guò)程,可以把整個(gè)分類系統(tǒng)畫(huà)成一張譜系圖。所以有時(shí)系統(tǒng)聚類也稱為譜系分析。三、聚類分析常見(jiàn)聚類方法第32頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二系統(tǒng)聚類法與聚類步驟流程圖初始分類:若 與 距離最小,合并為一類no輸出分類結(jié)果第33頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二B)K均值聚類系統(tǒng)聚類法需要計(jì)算出不同樣品或變量的距離,還要在聚類的每一步都要計(jì)算“類間距離”,相應(yīng)的計(jì)算量自然比較大;特別是當(dāng)樣本的容量很大時(shí),需要占據(jù)非

17、常大的計(jì)算機(jī)內(nèi)存空間,這給應(yīng)用帶來(lái)一定的困難。而K均值法是一種快速聚類法,采用該方法得到的結(jié)果比較簡(jiǎn)單易懂,對(duì)計(jì)算機(jī)的性能要求不高,因此應(yīng)用也比較廣泛。K均值法是麥奎因(MacQueen,1967)提出的,這種算法的基本思想是將每一個(gè)樣品分配給最近中心(均值)的類中,具體的算法至少包括以下三個(gè)步驟:1將所有的樣品分成K個(gè)初始類;2通過(guò)歐氏距離將某個(gè)樣品劃入離中心最近的類中,并對(duì)獲得樣品與失去樣品的類,重新計(jì)算中心坐標(biāo);3重復(fù)步驟2,直到所有的樣品都不能再分配時(shí)為止。三、聚類分析常見(jiàn)聚類方法第34頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二K-均值聚類法步驟流程圖尋找k個(gè)凝聚點(diǎn):若

18、 則 ;得計(jì)算各類的重心:若 則 ;得計(jì)算各類的重心:重心改變輸出分類結(jié)果yesno第35頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二Matlab聚類分析工具箱:cluster三、聚類分析Matlab聚類分析工具箱第36頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二三、聚類分析SPSS實(shí)現(xiàn)例3.1:(數(shù)據(jù)3.1)已知全國(guó)31個(gè)省市的城市小康水平衡量指標(biāo)值,現(xiàn)要分析各省市城市水平情況及相似程度,采用聚類分析法將31個(gè)省市分為3類,并用判別分析法分析城市水平劃分所依據(jù)的主要變量,并驗(yàn)證聚類分析所劃分類別是否合理。第37頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星

19、期二三、聚類分析SPSS實(shí)現(xiàn)第38頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二三、聚類分析SPSS實(shí)現(xiàn)第39頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二三、聚類分析SPSS實(shí)現(xiàn)第40頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二四、主成分分析主要目的多元統(tǒng)計(jì)分析處理的是多變量(多指標(biāo))問(wèn)題。由于變量較多,增加了分析問(wèn)題的復(fù)雜性。但在實(shí)際問(wèn)題中,變量之間可能存在一定的相關(guān)性,因此,多變量中可能存在信息的重疊。人們自然希望通過(guò)克服相關(guān)性、重疊性,用較少的變量來(lái)代替原來(lái)較多的變量,而這種代替可以反映原來(lái)多個(gè)變量的大部分信息,這實(shí)際上是一種“降維”的思想。第41

20、頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二主成分分析的數(shù)學(xué)模型是,設(shè)p個(gè)變量構(gòu)成的p維隨機(jī)向量為X = (X1,Xp)。對(duì)X作正交變換,令Y = TX,其中T為正交陣,要求Y的各分量是不相關(guān)的,并且Y的第一個(gè)分量的方差是最大的,第二個(gè)分量的方差次之,等等。為了保持信息不丟失,Y的各分量方差和與X的各分量方差和相等。四、主成分分析數(shù)學(xué)模型第42頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二四、主成分分析主成分的性質(zhì)第43頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二四、主成分分析累計(jì)貢獻(xiàn)率第44頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二四、

21、主成分分析具體步驟第45頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二四、主成分分析綜合評(píng)價(jià)第46頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二四、主成分分析SPSS實(shí)現(xiàn)例4.1:(數(shù)據(jù)4.1)汽車參數(shù),用主成分分析和因子分析方法處理該數(shù)據(jù)。第47頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二四、主成分分析SPSS實(shí)現(xiàn)第48頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二四、主成分分析SPSS實(shí)現(xiàn)該表給出了主成分分析從每個(gè)變量提取的信息,可以看出,所有變量都提取了70%以上的信息。第49頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二四、

22、主成分分析SPSS實(shí)現(xiàn) 該表為各主成分解釋原始變量總方差的情況,默認(rèn)保留了特征值大于1的主成分,前兩個(gè)主成分累積解釋了82.057%的方差,效果比較好。第50頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二四、主成分分析SPSS實(shí)現(xiàn)該表為成分矩陣,即主成分與標(biāo)準(zhǔn)化原始變量之間相關(guān)系數(shù)矩陣;標(biāo)準(zhǔn)化原始變量可用所得主成分近似線性表示,同時(shí)0.8642+(-0.351)2=0.869即第一個(gè)變量被提取的信息的比例。第一列數(shù)據(jù)的平方和為第1主成分的特征值。第51頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二四、主成分分析SPSS實(shí)現(xiàn)本例分析從相關(guān)矩陣出發(fā)求主成分,該表中的系數(shù)為將

23、原始變量標(biāo)準(zhǔn)化后表示主成分的系數(shù)。標(biāo)準(zhǔn)化主成分1=0.158X引擎+0.131X馬力+(-0.154)X油耗第52頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二五、因子分析因子分析(factor analysis)也是一種降維、簡(jiǎn)化數(shù)據(jù)的技術(shù)。它通過(guò)研究眾多變量之間的內(nèi)部依賴關(guān)系,探求觀測(cè)數(shù)據(jù)中的基本結(jié)構(gòu),并用少數(shù)幾個(gè)“抽象”的變量來(lái)表示其基本的數(shù)據(jù)結(jié)構(gòu)。這幾個(gè)抽象的變量被稱作“因子”,能反映原來(lái)眾多變量的主要信息。原始的變量是可觀測(cè)的顯在變量,而因子一般是不可觀測(cè)的潛在變量。 例如,在商業(yè)企業(yè)的形象評(píng)價(jià)中,消費(fèi)者可以通過(guò)一系列指標(biāo)構(gòu)成的一個(gè)評(píng)價(jià)指標(biāo)體系,評(píng)價(jià)百貨商場(chǎng)的各個(gè)方面的優(yōu)

24、劣。但消費(fèi)者真正關(guān)心的只是三個(gè)方面:商店的環(huán)境、商店的服務(wù)和商品的價(jià)格。這三個(gè)方面除了價(jià)格外,商店的環(huán)境和服務(wù)質(zhì)量,都是客觀存在的、抽象的影響因素,都不便于直接測(cè)量,只能通過(guò)其它具體指標(biāo)進(jìn)行間接反映。因子分析就是一種通過(guò)顯在變量測(cè)評(píng)潛在變量,通過(guò)具體指標(biāo)測(cè)評(píng)抽象因子的統(tǒng)計(jì)分析方法。第53頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二五、因子分析 因子分析的內(nèi)容非常豐富,常用的因子分析類型是 Q型因子分析和R型因子分析。Q型因子分析是對(duì)樣品作因子分析,R型的因子分析是對(duì)變量作因子分析。側(cè)重討論R型因子分析。第54頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二五、因子分析第

25、55頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二五、因子分析第56頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二五、因子分析第57頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二五、因子分析第58頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二五、因子分析前面的因子分析模型中出現(xiàn)了一個(gè)概念叫因子載荷矩陣,實(shí)際上因子載荷矩陣存在明顯的統(tǒng)計(jì)意義。為了對(duì)因子分析過(guò)程和計(jì)算結(jié)果做詳細(xì)的解釋,我們對(duì)因子載荷矩陣的統(tǒng)計(jì)意義加以說(shuō)明。 第59頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二五、因子分析第60頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)

26、1分,星期二五、因子分析第61頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二五、因子分析第62頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二五、因子分析第63頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二五、因子分析第64頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二五、因子分析具體步驟在實(shí)際應(yīng)用中,因子分析的具體步驟可以歸納為:1、將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理;2、建立變量的相關(guān)系數(shù)矩陣R;3、計(jì)算初等載荷矩陣 ,其中相關(guān)系數(shù)矩陣R的特征值 ; 和對(duì)應(yīng)的特征向量 ;4、選擇 個(gè)主因子。根據(jù)初等載荷矩陣計(jì)算各個(gè)公共因子的貢獻(xiàn)率,并選擇m個(gè)主因子5、因

27、子旋轉(zhuǎn)(正交變換法) ,其中T為正交陣;6、計(jì)算因子得分(因子得分估算公式 )。 第65頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二五、因子分析SPSS實(shí)現(xiàn) 可以看出,除馬力和軸距兩個(gè)變量的相關(guān)系數(shù)較小外,其余各變量的相關(guān)系數(shù)都大于0.3,各變量相關(guān)性較強(qiáng)。第66頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二五、因子分析SPSS實(shí)現(xiàn)KMO=0.873,該值越接近1,意味著變量間的相關(guān)性越強(qiáng),適合于因子分析:0.9,非常適合;(0.8,0.9)內(nèi),適合:(0.7,0.8)內(nèi),一般;(0.6,0.7)內(nèi),適合度較低,0.6,適合度很低。Bartlett的球形度檢驗(yàn),小于0

28、.01,即變量間存在相關(guān)慣性系,適合做因子分析。第67頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二五、因子分析SPSS實(shí)現(xiàn)第68頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二五、因子分析SPSS實(shí)現(xiàn)第一個(gè)因子主要由引擎、馬力、油耗3個(gè)變量決定,這3個(gè)變量在第一個(gè)主因子上的載荷均在0.8以上,該因子代表汽車的動(dòng)力情況,與汽車所能達(dá)到的最大行駛速度有關(guān)。第二個(gè)因子主要由軸距、長(zhǎng)度兩個(gè)變量決定,這兩個(gè)變量在該因子上的載荷均在0.9以上,表明該因子代表汽車的外形特征。第69頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二五、因子分析SPSS實(shí)現(xiàn)表5.1是研究消費(fèi)者對(duì)

29、購(gòu)買牙膏偏好的調(diào)查數(shù)據(jù)。通過(guò)市場(chǎng)的攔截訪問(wèn),用7級(jí)量表詢問(wèn)受訪者對(duì)以下陳述的認(rèn)同程度(1表示非常不同意,7表示非常同意)。V1:購(gòu)買預(yù)防蛀牙的牙膏是重要的;V2:我喜歡使牙齒亮澤的牙膏;V3:牙膏應(yīng)當(dāng)保護(hù)牙齦;V4:我喜歡使口氣清新的牙膏;V5:預(yù)防壞牙不是牙膏提供的一項(xiàng)重要利益;V6:購(gòu)買牙膏時(shí)最重要的考慮是富有魅力的牙齒。 第70頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二五、因子分析SPSS實(shí)現(xiàn)表5.1 牙膏屬性評(píng)分得分表第71頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二五、因子分析SPSS實(shí)現(xiàn)第72頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二五

30、、因子分析SPSS實(shí)現(xiàn)將表5.1中的數(shù)據(jù)通過(guò)SPSS進(jìn)行因子分析,得到相關(guān)結(jié)果是:1. 特征根和累計(jì)貢獻(xiàn)率 表5.2 方差貢獻(xiàn)率表 第73頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二五、因子分析SPSS實(shí)現(xiàn)從表5.2可以看出,提取兩個(gè)因子累計(jì)方差貢獻(xiàn)率就達(dá)到82%,第三個(gè)特征根相比下降較快,因此我們選取兩個(gè)公共因子。2.因子的含義為了得到意義明確的因子含義,我們將因子載荷陣進(jìn)行方差最大法旋轉(zhuǎn),得到旋轉(zhuǎn)后的因子載荷矩陣如下表5.3。 表5.73 旋轉(zhuǎn)后因子載荷矩陣 第74頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二五、因子分析SPSS實(shí)現(xiàn) 從因子載荷陣可以看出:因子1

31、與V1(預(yù)防蛀牙),V3(保護(hù)牙齦),V5(預(yù)防壞牙)相關(guān)性強(qiáng),其中V5的載荷是負(fù)數(shù),是由于這個(gè)陳述是反向詢問(wèn)的;因子2與V2(牙齒亮澤),V4(口氣清新),V6(富有魅力)的相關(guān)系數(shù)相對(duì)較高;因此,我們命名因子1為“護(hù)牙因子”,是人們對(duì)牙齒的保健態(tài)度;因子2是“美牙因子”,說(shuō)明人們“通過(guò)牙膏美化牙齒影響社交活動(dòng)”的重視。從這兩方面分析,對(duì)牙膏生產(chǎn)企業(yè)開(kāi)發(fā)新產(chǎn)品都富有啟發(fā)意義。第75頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二判別分析問(wèn)題,即根據(jù)歷史上劃分類別的有關(guān)資料和某種最優(yōu)準(zhǔn)則,確定一種判別方法,判定一個(gè)新的樣本歸屬哪一類。這類問(wèn)題用數(shù)學(xué)語(yǔ)言來(lái)表達(dá),可以敘述如下:設(shè)有n個(gè)樣

32、本,對(duì)每個(gè)樣本測(cè)得p項(xiàng)指標(biāo)(變量)的數(shù)據(jù),已知每個(gè)樣本屬于k個(gè)類別(或總體)G1,G2, ,Gk中的某一類,且它們的分布函數(shù)分別為F1(x),F(xiàn)2(x), ,F(xiàn)k(x)。我們希望利用這些數(shù)據(jù),找出一種判別函數(shù),使得這一函數(shù)具有某種最優(yōu)性質(zhì),能把屬于不同類別的樣本點(diǎn)盡可能地區(qū)別開(kāi)來(lái),并對(duì)測(cè)得同樣p項(xiàng)指標(biāo)(變量)數(shù)據(jù)的一個(gè)新樣本,能判定這個(gè)樣本歸屬于哪一類。六、判別分析第76頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二判別分析內(nèi)容很豐富,方法很多。判別分析按判別的總體數(shù)來(lái)區(qū)分:兩個(gè)總體判別分析、多總體判別分析;按區(qū)分不同總體所用的數(shù)學(xué)模型來(lái)分:有線性判別、非線性判別;按判別時(shí)所處理的

33、變量方法不同:逐步判別、序貫判別;判別分析可以從不同角度提出問(wèn)題,因此有不同的判別準(zhǔn)則,如馬氏距離最小準(zhǔn)則、Fisher準(zhǔn)則、平均損失最小準(zhǔn)則、最小平方準(zhǔn)則、最大似然準(zhǔn)則、最大概率準(zhǔn)則等等,按判別準(zhǔn)則的不同又提出多種判別方法。本章僅介紹距離判別法六、判別分析分類第77頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二距離判別法的基本思想方法:將新樣品判別給與其距離最近的總體六、判別分析距離判別法馬氏距離(馬哈拉諾比斯Mahalanobis, 1936)第78頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二六、判別分析距離判別法第79頁(yè),共134頁(yè),2022年,5月20日,23

34、點(diǎn)1分,星期二六、判別分析距離判別法第80頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二從上節(jié)看距離判別法雖然簡(jiǎn)單,便于使用。但是該方法也有它明顯的不足之處。第一,判別方法與總體各自出現(xiàn)的概率的大小無(wú)關(guān);第二,判別方法與錯(cuò)判之后所造成的損失無(wú)關(guān)。六、判別分析距離判別法第81頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二Matlab判別分析工具箱:classify六、判別分析Matlab判別分析工具箱第82頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方差分析單因素方差分析多因素方差分析第83頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方

35、差分析單因素方差分析 例7.1:(數(shù)據(jù)7.1)為檢驗(yàn)3家工廠生產(chǎn)的機(jī)器加工一批原料所需的平均時(shí)間是否相同,某化學(xué)公司得到了關(guān)于加工原料所需時(shí)間的數(shù)據(jù),利用這些數(shù)據(jù)檢驗(yàn)3家工廠加工一批原料所需平均時(shí)間是否相同。工廠123加工時(shí)間202820262619243123222722232821222920各廠的加工效率是否存在差異?哪個(gè)廠的加工時(shí)間最短?第84頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方差分析單因素方差分析方差分析就是通過(guò)對(duì)水平之間的方差(組間方差)和水平內(nèi)部的方差(組內(nèi)方差)進(jìn)行比較,做出拒絕還是不能拒絕原假設(shè)的判斷。方差分析通常要有以下兩個(gè)假定: 1.各樣本的獨(dú)

36、立性,即各組觀察數(shù)據(jù)是從相互獨(dú)立的總體中抽取的。 2.要求所有觀察值都是從正態(tài)總體中抽取的,且方差相等。第85頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方差分析單因素方差分析因素A的水平觀察值數(shù)據(jù)類型第86頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方差分析單因素方差分析步驟:提出假設(shè)構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量 顯著性檢驗(yàn)得到結(jié)論第87頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方差分析單因素方差分析提出假設(shè): 在單因素方差分析中,要檢驗(yàn)因素A的k個(gè)水平(總體)的均值是否相等,因此提出假設(shè)的一般形式為:原假設(shè): 對(duì)立假設(shè):第88頁(yè),共134頁(yè),20

37、22年,5月20日,23點(diǎn)1分,星期二七、方差分析單因素方差分析 由于樣本均值 可以作為總體均值 的估計(jì),所以可以借助樣本均值粗略估計(jì)一下總體均值的情況。符號(hào)說(shuō)明:總樣本容量第i水平的樣本均值總樣本均值 第89頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方差分析單因素方差分析 當(dāng) 時(shí),有 , 三組的樣本均值各不相等,能否說(shuō)明三組的總體均值有明顯差異?為什么觀察值之間存在差異?這些差異是由哪些原因造成的?如何來(lái)衡量各組之間的差異大小呢?第90頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方差分析單因素方差分析 所有觀察值幾乎各不相等,它們的分散程度可以用總平方和

38、來(lái)度量。觀察值之間的差異越大,ST 越大。 在單因素實(shí)驗(yàn)中,造成觀察值差異的原因有兩個(gè):一個(gè)是由隨機(jī)誤差引起的,不可避免;另一個(gè)就是由因素的不同水平造成的。 第91頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方差分析單因素方差分析 我們定義組間平方和來(lái)度量各組之間的差異。 定義組內(nèi)平方和來(lái)度量組內(nèi)隨機(jī)誤差引起的偏差。可以證明:第92頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方差分析單因素方差分析按照構(gòu)造統(tǒng)計(jì)量的基本原則:統(tǒng)計(jì)量具有一定的實(shí)際意義統(tǒng)計(jì)量要服從某已知分布可以構(gòu)造單因素方差分析的統(tǒng)計(jì)量:服從自由度為 的F分布。第93頁(yè),共134頁(yè),2022年,5

39、月20日,23點(diǎn)1分,星期二七、方差分析單因素方差分析 對(duì)給定的顯著性水平 ,當(dāng)時(shí),應(yīng)拒絕原假設(shè)H0,即認(rèn)為各水平之間有明顯差異;否則應(yīng)接受原假設(shè)H0,即認(rèn)為各水平之間無(wú)明顯差異。第94頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方差分析單因素方差分析第95頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方差分析單因素方差分析p值為0.836,在顯著性水平0.05的前期下,通過(guò)了方差齊性檢驗(yàn),即不同廠的加工時(shí)間被認(rèn)為是來(lái)自于相同方差的不同總體,滿足方差分析的前提。第96頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方差分析單因素方差分析表中的“*

40、”表示在顯著性水平0.05的情況下,相應(yīng)的兩組均值之間存在顯著差異。第97頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方差分析單因素方差分析p值近似為0,遠(yuǎn)小于顯著性水平0.05,因此有理由拒絕原假設(shè),認(rèn)為不同工廠對(duì)加工時(shí)間產(chǎn)生了顯著影響。第98頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方差分析多因素方差分析 例7.2:(數(shù)據(jù)7.2)某電器公司想知道某產(chǎn)品銷售量與銷售方式及銷售地點(diǎn)是否有關(guān),隨機(jī)抽樣得到以下資料,以0.05的顯著性水平進(jìn)行檢驗(yàn)。 地點(diǎn)一地點(diǎn)二地點(diǎn)三地點(diǎn)四地點(diǎn)五方式一7786818883方式二9592789689方式三7176688174方式

41、四8084797082第99頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方差分析多因素方差分析 以下根據(jù)平方和分解的思想來(lái)給出檢驗(yàn)用的統(tǒng)計(jì)量的計(jì)算公式。先引入下述記號(hào): 其中 i=1,2,r ;j=1,2,s ; 總樣本容量 n=r s m 第100頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方差分析多因素方差分析 總偏差平方和ST、因素A的效應(yīng)平方和SA、因素B的效應(yīng)平方和SB、交互效應(yīng)平方和SAB以及誤差平方和SE的計(jì)算公式如下:第101頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方差分析多因素方差分析第102頁(yè),共134頁(yè),2022年

42、,5月20日,23點(diǎn)1分,星期二七、方差分析多因素方差分析第103頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方差分析多因素方差分析 例7.2:某電器公司想知道某產(chǎn)品銷售量與銷售方式及銷售地點(diǎn)是否有關(guān),隨機(jī)抽樣得到以下資料,以0.05的顯著性水平進(jìn)行檢驗(yàn)。 地點(diǎn)一地點(diǎn)二地點(diǎn)三地點(diǎn)四地點(diǎn)五方式一7786818883方式二9592789689方式三7176688174方式四8084797082第104頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方差分析多因素方差分析第105頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方差分析多因素方差分析第10

43、6頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方差分析多因素方差分析銷售方式的p值為0.003,表明對(duì)銷售量的影響存在顯著差異,銷售地點(diǎn)不存在顯著差異。第107頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二七、方差分析多因素方差分析該均衡子集表中,第一均衡子集包含方式3和方式4,兩均值比較的概率p值為0.162,表明銷售方式3和銷售方式4的銷售量均值之間無(wú)明顯差異。第108頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二八、回歸分析變量與變量的關(guān)系:確定性關(guān)系函數(shù)關(guān)系U=IRv=gt變量與變量的關(guān)系:非確定性關(guān)系統(tǒng)計(jì)相關(guān)(具有統(tǒng)計(jì)規(guī)律)Y=f(x1, x

44、2, , xn)+回歸分析方法第109頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二八、回歸分析第110頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二八、回歸分析一元線性回歸回歸分析中的兩類主要變量解釋變量(因變量Dependent variable)記為Y被解釋變量(自變量Independent )記為X1,X2,Xn?;貧w分析 一元回歸分析被解釋變量只有一個(gè)多元回歸分析被解釋變量有一個(gè)以上第111頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二八、回歸分析一元線性回歸可以用相關(guān)分析或非線性回歸分析畫(huà)出兩個(gè)變量X和Y的散點(diǎn)圖由X的變化引起的Y的線性變化部分a

45、+bX Y=a+bX+由于其他隨機(jī)因素引起的Y的變化部分,N(0,2) 觀察散點(diǎn)是否呈直線趨勢(shì)是否建立一元線性回歸模型:Y=a+bX+如何建立方程?最小二乘法根據(jù)距離觀測(cè)值的各點(diǎn)平方和最小原則確定參數(shù)的方法稱為最小二乘法 第112頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二八、回歸分析一元線性回歸:最小二乘法最小二乘法就是使實(shí)際觀測(cè)值的參數(shù)的最小二乘估計(jì)與之間的差的平方和取最小值,即要選擇的參數(shù)應(yīng)滿足使殘差平方和 取最小值。令第113頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二整理得方程組: 正規(guī)方程組解此正規(guī)方程組得 八、回歸分析一元線性回歸:最小二乘法第114頁(yè)

46、,共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二總離差平方和回歸平方和剩余平方和離差平方和的分解八、回歸分析一元線性回歸:最小二乘法第115頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二八、回歸分析一元線性回歸:統(tǒng)計(jì)檢驗(yàn)F對(duì)回歸模型的顯著性檢驗(yàn)t對(duì)回歸系數(shù)的顯著性檢驗(yàn)樣本決定系數(shù)R2模型擬合優(yōu)度檢驗(yàn)對(duì)一元線性回歸來(lái)說(shuō),三種檢驗(yàn)的等價(jià)的,但對(duì)多元的則不同。第116頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二八、回歸分析一元線性回歸:統(tǒng)計(jì)檢驗(yàn)1、回歸方程的擬合優(yōu)度檢驗(yàn) 檢驗(yàn)R2越接近于1,回歸方程對(duì)實(shí)際觀測(cè)值的擬合優(yōu)度越高;R2越接近于0,回歸方程對(duì)實(shí)際觀測(cè)值的擬

47、合優(yōu)度越低。 第117頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二八、回歸分析一元線性回歸:統(tǒng)計(jì)檢驗(yàn)2、回歸方程的顯著性檢驗(yàn)F檢驗(yàn)H0:線性關(guān)系不顯著 H1:線性關(guān)系顯著當(dāng)H0為真時(shí),檢驗(yàn)統(tǒng)計(jì)量 F(1,n-2) 給定顯著性水平,查表確定臨界點(diǎn)確定拒絕域:,列出方差分析表 第118頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二八、回歸分析一元線性回歸:統(tǒng)計(jì)檢驗(yàn)方差來(lái)源平方和自由度均方差F值回歸平方和剩余平方和SSRSSE1n-2VR=SSRVE=SSE/n-2F=VR/VE總平方和SSTn-1方差分析表第119頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二八、回歸分析一元線性回歸:統(tǒng)計(jì)檢驗(yàn)3、回歸系數(shù)的顯著性檢驗(yàn)t檢驗(yàn) 回歸系數(shù)的顯著性檢驗(yàn)是檢驗(yàn)自變量X對(duì)因變量Y的影響是否顯著。 如果回歸系數(shù)b=0,總體回歸直線是一條水平線,表明自變量X的變化對(duì)因變量Y沒(méi)有影響。因此,回歸系數(shù)的顯著性檢驗(yàn)就是檢驗(yàn)回歸系數(shù)b與0之間是否有顯著差異。第120頁(yè),共134頁(yè),2022年,5月20日,23點(diǎn)1分,星期二八、回歸分析一元線性回歸:統(tǒng)計(jì)檢驗(yàn)(1) 提出假設(shè)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論