判別分析方法與SPSS分析課件_第1頁(yè)
判別分析方法與SPSS分析課件_第2頁(yè)
判別分析方法與SPSS分析課件_第3頁(yè)
判別分析方法與SPSS分析課件_第4頁(yè)
判別分析方法與SPSS分析課件_第5頁(yè)
已閱讀5頁(yè),還剩25頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

判別分析方法基于SPSS應(yīng)用軟件判別分析方法基于SPSS應(yīng)用軟件1一、判別分析意義判別分析是根據(jù)表明事物特點(diǎn)的變量值和它們所屬的類,求出判別函數(shù)。根據(jù)判別函數(shù)對(duì)未知所屬類別的事物進(jìn)行分類的一種分析方法。在自然科學(xué)和社會(huì)科學(xué)的各個(gè)領(lǐng)域經(jīng)常遇到需要對(duì)某個(gè)個(gè)體屬于哪一類進(jìn)行判斷。如動(dòng)物學(xué)家對(duì)動(dòng)物如何分類的研究和某個(gè)動(dòng)物屬于哪一類、目、綱的判斷。不同:判別分析和聚類分析不同的在于判別分析要求已知一系列反映事物特征的數(shù)值變量的值,并且已知各個(gè)體的分類(訓(xùn)練樣本)。一、判別分析意義判別分析是根據(jù)表明事物特點(diǎn)2方法有

距離判別——根據(jù)個(gè)案與總體均值間的距離大小的原則,進(jìn)行判別。

貝葉斯判別——根據(jù)后驗(yàn)概率最大的原則。

典型判別——求原始變量的線性組合,使產(chǎn)生的新變量之更能將類分開。

逐步判別——有逐步篩選的辦法,將對(duì)判別有貢獻(xiàn)的變量選出。

方法有距離判別——根據(jù)個(gè)案與總體均值間的距離大小3

例中小企業(yè)的破產(chǎn)模型為了研究中小企業(yè)的破產(chǎn)模型,選定4個(gè)經(jīng)濟(jì)指標(biāo):X1總負(fù)債率(現(xiàn)金收益/總負(fù)債)X2收益性指標(biāo)(純收入/總財(cái)產(chǎn))X3短期支付能力(流動(dòng)資產(chǎn)/流動(dòng)負(fù)債)X4生產(chǎn)效率性指標(biāo)(流動(dòng)資產(chǎn)/純銷售額)對(duì)17個(gè)破產(chǎn)企業(yè)(1類)和21個(gè)正常運(yùn)行企業(yè)(2類)進(jìn)行了調(diào)查,得如下資料:例中小企業(yè)的破產(chǎn)模型4總負(fù)債率收益性指標(biāo)短期支付能力生產(chǎn)效率指標(biāo)類別-.45-.411.09.451-.56-.311.51.161.06.021.01.401-.07-.091.45.261-.10-.091.56.671-.14-.07.71.281-.23-.30.22.181.07.021.31.251.01.002.15.701-.28-.231.19.661.15.051.88.271.37.111.99.381-.08-.081.51.421.05.031.68.951.01.001.26.601.12.111.14.171-.28-.271.27.511.51.102.49.542.08.022.01.532總負(fù)債率收益性指標(biāo)短期支付能力生產(chǎn)效率指標(biāo)類別-.45-.45.38.113.27.552.19.052.25.332.32.074.24.632.31.054.45.692.12.052.52.692-.02.022.05.352.22.082.35.402.17.071.80.522.15.052.17.552-.10-1.012.50.582.14-.03.46.262.14.072.61.522-.33-.093.01.472.48.091.24.182.56.114.29.452.20.081.99.302.47.142.92.452.17.042.45.142.58.045.06.132.04.011.50.71待判-.06-.061.37.40待判.38.113.27.552.19.052.25.332.36.07-.011.37.34待判-.13-.141.42.44待判.15.062.23.56待判.16.052.31.20待判.29.061.84.38待判.54.112.33.48待判.07-.011.37.34待判-.13-.141.42.47判別分析方法與SPSS分析課件8距離的判別由于已經(jīng)知道所有點(diǎn)的類別了,所以可以求得每個(gè)類型的中心。這樣只要定義了如何計(jì)算距離,就可以得到任何給定的點(diǎn)(企業(yè))到這三個(gè)中心的三個(gè)距離。顯然,最簡(jiǎn)單的辦法就是離哪個(gè)中心距離最近,就屬于哪一類。通常使用的距離是所謂的Mahalanobis距離(馬氏距離)。用來(lái)比較到各個(gè)中心距離的數(shù)學(xué)函數(shù)稱為判別函數(shù)(discriminantfunction).這種根據(jù)遠(yuǎn)近判別的方法,原理簡(jiǎn)單,直觀易懂。距離的判別由于已經(jīng)知道所有點(diǎn)9貝葉斯判別根據(jù)后驗(yàn)概率最大的原則,在企業(yè)的財(cái)務(wù)狀況下,利用貝葉斯公式計(jì)算其判給各類的后驗(yàn)概率,哪個(gè)概率越大,則判給哪類。貝葉斯判別根據(jù)后驗(yàn)概率最大的10典型判別法(先計(jì)算新變量的線性組合)考慮只有兩個(gè)(預(yù)測(cè))變量的判別分析問(wèn)題。假定這里只有兩類。數(shù)據(jù)中的每個(gè)觀測(cè)值是二維空間的一個(gè)點(diǎn)。見圖(下一張幻燈片)。這里只有兩種已知類型的訓(xùn)練樣本。其中一類有38個(gè)點(diǎn)(用“o”表示),另一類有44個(gè)點(diǎn)(用“*”表示)。按照原來(lái)的變量(橫坐標(biāo)和縱坐標(biāo)),很難將這兩種點(diǎn)分開。于是就尋找一個(gè)方向,也就是圖上的虛線方向,沿著這個(gè)方向朝和這個(gè)虛線垂直的一條直線進(jìn)行投影會(huì)使得這兩類分得最清楚??梢钥闯?,如果向其他方向投影,判別效果不會(huì)比這個(gè)好。有了投影之后,再用前面講到的距離遠(yuǎn)近的方法來(lái)得到判別準(zhǔn)則。這種首先進(jìn)行投影的判別方法就是典型判別法。典型判別法(先計(jì)算新變量的線性組合)11判別分析方法與SPSS分析課件12逐步判別法(僅僅是在前面的方法中加入變量選擇的功能)有時(shí),一些變量對(duì)于判別并沒有什么作用,為了得到對(duì)判別最合適的變量,可以使用逐步判別。也就是,一邊判別,一邊引進(jìn)判別能力最強(qiáng)的變量,這個(gè)過(guò)程可以有進(jìn)有出。一個(gè)變量的判別能力的判斷方法有很多種,主要利用各種檢驗(yàn),例如Wilks’Lambda、Rao’sV、TheSquaredMahalanobisDistance、SmallestFratio或TheSumofUnexplainedVariations等檢驗(yàn)。其細(xì)節(jié)這里就不贅述了;這些不同方法可由統(tǒng)計(jì)軟件的各種選項(xiàng)來(lái)實(shí)現(xiàn)。逐步判別的其他方面和前面的無(wú)異。逐步判別法(僅僅是在前面的方法中加入變量選擇的功能13第一步:打開判別分析的窗口。變量全部選入。變量逐步選入全部選入。第一步:打開判別分析的窗口。變量全部選入。變量逐步選入全部選14第二步:定義類的代碼。第二步:定義類的代碼。15第三步:將變量放入獨(dú)立變量框。第三步:將變量放入獨(dú)立變量框。16Means-計(jì)算平均數(shù);UnivariateANOVAs—討論單變量的方差分析,看哪些本來(lái)在組間有差異;Box’sM統(tǒng)計(jì)量—總體的協(xié)方差相等的檢驗(yàn)。Fisher’s-判別函數(shù)的系數(shù);Unstandardized沒有標(biāo)準(zhǔn)化的判別函數(shù)的系數(shù);關(guān)于協(xié)方差矩陣的要求。第四步:選擇統(tǒng)計(jì)量。Fisher’s-判別函數(shù)的系數(shù);關(guān)于協(xié)方差矩陣的要求。第四17Prior—對(duì)先驗(yàn)概率的要求,上一個(gè)選項(xiàng)是先驗(yàn)概率相等,后一個(gè)是以樣本的頻率為先驗(yàn)概率;Display-對(duì)輸出數(shù)據(jù)的要求。Casewiseresult——所有個(gè)案的結(jié)果;Summarytable——判別結(jié)果的表格;Leave-out-classification——交叉核實(shí)。UseCovariance—利用什么矩陣計(jì)算判別函數(shù)。組內(nèi)的協(xié)方差矩陣,還是分組協(xié)方差矩陣;Plot—對(duì)典型變量進(jìn)行分組,畫直方圖。分類區(qū)域散點(diǎn)圖。

第五步:選擇判類的一些前提條件和輸出。第五步:選擇判類的一些前提條件和輸出。18關(guān)于逐步判別的選項(xiàng)。關(guān)于逐步判別的選項(xiàng)。19下面來(lái)觀察輸出結(jié)果一、首先做全模型要求:所有本來(lái)均進(jìn)入;先驗(yàn)概率相等;輸出判別函數(shù);做交叉核實(shí);畫分類散點(diǎn)地圖;保存后驗(yàn)概率,判類結(jié)果和判別函數(shù)得分。下面來(lái)觀察輸出結(jié)果一、首先做全模型20標(biāo)準(zhǔn)化的典型變量的函數(shù)標(biāo)準(zhǔn)化的典型變量的函數(shù)21典型判別函數(shù)和原始變量的相關(guān)系數(shù)。典型判別函數(shù)和原始變量的相關(guān)系數(shù)。22典型判別函數(shù)的系數(shù),判別函數(shù)的得分由此計(jì)算。典型判別函數(shù)的系數(shù),判別函數(shù)的得分由此計(jì)算。23典型變量在兩類的均值。典型變量在兩類的均值。24距離判別法的判別函數(shù)。在正態(tài)假定下,它與貝葉斯判別等價(jià)。距離判別法的判別函數(shù)。在正態(tài)假定下,它與貝葉斯25錯(cuò)判和正判的結(jié)果。標(biāo)志處是回代核實(shí)和交叉核實(shí)的正判率。錯(cuò)判和正判的結(jié)果。標(biāo)志處是回代核實(shí)和交叉核26誤判和正確判別率從這個(gè)表來(lái)看,我們的分類能夠100%地把訓(xùn)練數(shù)據(jù)的每一個(gè)觀測(cè)值分到其本來(lái)的類。該表分成兩部分;上面一半(Original)是用從全部數(shù)據(jù)得到的判別函數(shù)來(lái)判斷每一個(gè)點(diǎn)的結(jié)果(前面三行為判斷結(jié)果的數(shù)目,而后三行為相應(yīng)的百分比)。下面一半(Crossvalidated)是對(duì)每一個(gè)觀測(cè)值,都用缺少該觀測(cè)的全部數(shù)據(jù)得到的判別函數(shù)來(lái)判斷的結(jié)果。這里的判別結(jié)果是100%判別正確,但一般并不一定。

誤判和正確判別率從這個(gè)表來(lái)看,我們的分類能夠100%地把訓(xùn)練27二、利用SPSS軟件的逐步判別法的結(jié)果

選擇了兩個(gè)變量。二、利用SPSS軟件的逐步判別法的結(jié)果28判別分析要注意什么?訓(xùn)練樣本中必須有所有要判別的類型,分類必須清楚,不能有混雜。

要選擇好可能由于判別的預(yù)測(cè)變量。這是最重要的一步。當(dāng)然,在應(yīng)用中,選擇的余地不見得有多大。

要注意數(shù)據(jù)是否有不尋常的點(diǎn)或者模式存在。還要看預(yù)測(cè)變量中是否有些不適宜的;這可以用單變量方差分析(ANOVA)和相關(guān)分析來(lái)驗(yàn)證。判別分析是為了正確地分類,但同時(shí)也要注意使用盡可能少的預(yù)測(cè)變量來(lái)達(dá)到這個(gè)目的。使用較少的變量意味著節(jié)省資源和易于對(duì)結(jié)果進(jìn)行解釋。

判別分析要注意什么?訓(xùn)練樣本中必須有所有要判別的類型,分類必29判別分析要注意什么?在計(jì)算中需要看關(guān)于各個(gè)類的有關(guān)變量的均值是否顯著不同的檢驗(yàn)結(jié)果(在SPSS選項(xiàng)中選擇Wilks’Lambda、Rao’sV、TheSquaredMahalanobisDistance或TheSumofUnexplainedVariations等檢驗(yàn)的計(jì)算機(jī)輸出),以確定是否分類結(jié)果是僅僅由于隨機(jī)因素。此外成員的權(quán)數(shù)(SPSS用priorprobability,即“先驗(yàn)概率”,和貝葉斯統(tǒng)計(jì)的先驗(yàn)概率有區(qū)別)需要考慮;一般來(lái)說(shuō),加權(quán)要按照各類觀測(cè)值的多少,觀測(cè)值少的就要按照比例多加權(quán)。對(duì)于多個(gè)判別函數(shù),要弄清各自的重要性。注意訓(xùn)練樣本的正確和錯(cuò)誤分類率。研究被誤分類的觀測(cè)值,看是否可以找出原因。

判別分析要注意什么?在計(jì)算中需要看關(guān)于各個(gè)類的有關(guān)變量的均值30SPSS選項(xiàng)打開.sav數(shù)據(jù)。然后點(diǎn)擊Analyze-Classify-Discriminant,把group放入GroupingVariable,再定義范圍,即在DefineRange輸入1-3的范圍。然后在Independents輸入所有想用的變量;但如果要用逐步判別,則不選Enterindependentstogether,而選擇Usestepwisemethod,在方法(Method)中選挑選變量的準(zhǔn)則(檢驗(yàn)方法;默認(rèn)值為Wilks’Lambda)。SPSS選項(xiàng)打開.sav數(shù)據(jù)。然后點(diǎn)擊Anal31為了輸出Fisher分類函數(shù)的結(jié)果可以在Statistics中的FunctionCoefficient選Fisher和UnStandardized(點(diǎn)則判別函數(shù)系數(shù))

,在Matrices中選擇輸出所需要的相關(guān)陣;為了輸出Fishe

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論