




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第十章鑒別分析知識(shí)鏈接SPSS之判別分析/article/ed15cb1b72e7061be36981a1.html知識(shí)鏈接spss進(jìn)行判別分析步驟/s/blog_613316c00101duen.html一、簡(jiǎn)介鑒別分析是一種進(jìn)行統(tǒng)計(jì)鑒別和分組的技術(shù)方法。它可以就一定數(shù)量案例已知的一個(gè)分類變量和相應(yīng)的其他多元變量的信息,檢查和定量描述分組與其他多元變量之間的關(guān)系,建立鑒別函數(shù)。然后便可以利用這些函數(shù)關(guān)系對(duì)其他已知多元變量信息但未知類別信息的案例進(jìn)行鑒別分組。鑒別分析又稱“分辨法”,是在分類確定的條件下,根據(jù)某一研究對(duì)象的各種特征值判別其類型歸屬問(wèn)題的一種多變量統(tǒng)計(jì)分析方法。其基本原理是按照一定的判別準(zhǔn)則,建立一個(gè)或多個(gè)判別函數(shù),用研究對(duì)象的大量資料確定判別函數(shù)中的待定系數(shù),并計(jì)算判別指標(biāo)。據(jù)此即可確定某一樣本屬于何類。當(dāng)?shù)玫揭粋€(gè)新的樣品數(shù)據(jù),要確定該樣品屬于已知類型中哪一類,這類問(wèn)題屬于鑒別分析問(wèn)題。總的來(lái)說(shuō),鑒別分析包括兩個(gè)階段的工作:第一階段是分析和解釋各組的鑒別變量值特征之間存在的差異,并建立鑒別函數(shù)。第二階段所要處理的是那些未知類別屬性的其他案例,以第一階段的鑒別函數(shù)為根據(jù)將這些“新”案例進(jìn)行鑒別分類。二、鑒別分析的假定條件和基本模型(一)鑒別分析的假定條件鑒別分析最基本的要求是:分組類別(group,用表示)在兩種以上,g≥2;在第一階段工作時(shí)每組案例的規(guī)模必須至少在一個(gè)以上,即n>1(下標(biāo)j表示所在類型組);各鑒別變量均為間距測(cè)度等級(jí);各分組的案例在各鑒別變量的數(shù)值上能夠體現(xiàn)出差別。在這種情況下,鑒別分析能夠幫助我們分析各類別反映在鑒別變量上的差別,并提供一套鑒別統(tǒng)計(jì)指標(biāo)。(二)鑒別分析的基本模型鑒別分析的基本模型就是鑒別函數(shù),它是鑒別分析中的擔(dān)綱模型表達(dá)式,鑒別分析中眾多統(tǒng)計(jì)指標(biāo)和統(tǒng)計(jì)檢驗(yàn)都與鑒別函數(shù)有關(guān)。如前所述,盡管鑒別分析本質(zhì)上要反映一個(gè)分組變量與一套鑒別變量之間的關(guān)系,但是這種關(guān)系的數(shù)學(xué)模型表達(dá)式卻并沒(méi)有直接將分組變量表示為鑒別變量(即自變量)的線性函數(shù),而是采取了迂回的途徑。鑒別分析首先結(jié)合案例分類信息與其鑒別變量信息優(yōu)化地構(gòu)造了一套間距測(cè)度等級(jí)變量——鑒別值,在這套鑒別值上可以最有效地反映出各組之間差異。所構(gòu)造的鑒別值實(shí)際上是按獲得各組案例最大區(qū)分度的原則對(duì)原鑒別變量的數(shù)據(jù)空間進(jìn)行坐標(biāo)轉(zhuǎn)換的結(jié)果,其原理和證明不屬本書(shū)內(nèi)容范圍。這一過(guò)程的具體計(jì)算均由SPSS軟件去完成,而我們只需要知道,鑒別函數(shù)的因變量就是這樣推導(dǎo)出來(lái)的鑒別值。三、例題數(shù)據(jù)說(shuō)明本章例題是在第三章因子分析的示例數(shù)據(jù)的基礎(chǔ)上加上了一個(gè)分組變量構(gòu)成的。該數(shù)據(jù)文件名為discriminant.sav,在本書(shū)所附光盤(pán)中提供。該數(shù)據(jù)有全國(guó)30個(gè)省市自治區(qū)的案例,包括有5個(gè)狓變量,分別為多孩率、綜合節(jié)育率、初中及以上受教育程度的人口比例、人均國(guó)民收入、城鎮(zhèn)人口比例。將這些變量作為鑒別變量來(lái)對(duì)各地區(qū)類型進(jìn)行鑒別分組,以便更好地進(jìn)行分類指導(dǎo)。假設(shè)有理由可以將其中一些地區(qū)分別歸為一類、二類和三類地區(qū),但是同時(shí)還有一些地區(qū)則很難進(jìn)行類型歸屬,于是我們虛構(gòu)了一個(gè)分組變量type來(lái)反映每個(gè)案例的分組屬性。其中,編碼1、2、3分別表示一類、二類和三類地區(qū),“.”則表示案例的這個(gè)變量值缺失,即不知道該案例屬于哪一類地區(qū)。下面我們先對(duì)SPSS軟件根據(jù)已知分組類型的案例建立鑒別方程,對(duì)計(jì)算輸出各種鑒別分析統(tǒng)計(jì)指標(biāo)的意義加以說(shuō)明。然后,我們?cè)偈痉度〉眠@些統(tǒng)計(jì)指標(biāo)的SPSS操作,最后在此基礎(chǔ)上完成對(duì)未知分組屬性的那些案例的鑒別分組工作。四、鑒別分析模型的各參數(shù)指標(biāo)及統(tǒng)計(jì)檢驗(yàn)個(gè)鑒別分析不光要有基本模型,還需要多個(gè)不同指標(biāo)來(lái)表示模型的不同方面。有的用于表示數(shù)量聯(lián)系關(guān)系,有的用于評(píng)價(jià)和比較。下面分別對(duì)鑒別模型中所涉及的主要指標(biāo)加以介紹。為了避免有的參數(shù)計(jì)算過(guò)程所必須涉及的矩陣代數(shù)形式或其他復(fù)雜的數(shù)學(xué)公式,這里將不對(duì)每個(gè)參數(shù)的來(lái)龍去脈加以詳細(xì)討論。由于本章在介紹鑒別分析時(shí)將與SPSS統(tǒng)計(jì)軟件的應(yīng)用相結(jié)合,讀者不用在估計(jì)過(guò)程的原理和細(xì)節(jié)上花費(fèi)許多功夫,因?yàn)橹灰覀冋_地輸入數(shù)據(jù)和設(shè)置好鑒別分析的程序命令,計(jì)算機(jī)便能夠提供全部統(tǒng)計(jì)結(jié)果。本節(jié)先討論本例鑒別分析中SPSS輸出的各種指標(biāo)的意義和用途。有關(guān)SPSS的操作步驟在第五節(jié)中介紹。(一)非標(biāo)準(zhǔn)化鑒別系數(shù)鑒別系數(shù)又稱函數(shù)系數(shù),其中還進(jìn)一步分為兩種:非標(biāo)準(zhǔn)化的和標(biāo)準(zhǔn)化的。(二)標(biāo)準(zhǔn)化鑒別系數(shù)通過(guò)對(duì)于非標(biāo)準(zhǔn)化系數(shù)加以特定形式的調(diào)整,就得到標(biāo)準(zhǔn)化鑒別系數(shù)。以標(biāo)準(zhǔn)化系數(shù)表達(dá)的鑒別函數(shù)不再有常數(shù)項(xiàng),并且函數(shù)中出現(xiàn)的自變量不再是原始變量,而是標(biāo)準(zhǔn)化的變量。也就是說(shuō),如果將經(jīng)過(guò)標(biāo)準(zhǔn)化的鑒別變量輸入鑒別模型,那么可以直接得到標(biāo)準(zhǔn)化的回歸系數(shù)。(三)結(jié)構(gòu)系數(shù)鑒別分析中的結(jié)構(gòu)系數(shù)又被稱為鑒別負(fù)載。它實(shí)際上是某個(gè)鑒別變量x與鑒別值y之間的相關(guān)系數(shù),用于表達(dá)兩者之間的擬合水平。當(dāng)結(jié)構(gòu)系數(shù)的絕對(duì)值很大(接近+1或-1)時(shí),這個(gè)鑒別函數(shù)(值)表達(dá)的信息與這個(gè)鑒別變量的信息幾乎相同。當(dāng)這個(gè)系數(shù)接近于0時(shí),兩者之間就沒(méi)有什么共同之處。類似在因子分析中的做法,如果鑒別分析中一些鑒別變量與一個(gè)鑒別函數(shù)之間有很大的結(jié)構(gòu)系數(shù)值,我們就可以用這些變量的名字來(lái)命名這個(gè)函數(shù)。如果這些變量似乎有類似方面的特征,我們也可以用這種共同的特征來(lái)命名這個(gè)函數(shù)。(四)分組的矩心分組的矩心描述在鑒別空間中每一組案例的中心位置。它是通過(guò)計(jì)算各組案例鑒別值的平均值來(lái)確定各組中心坐標(biāo)的。其結(jié)果,每個(gè)分組在各維鑒別值上的平均值便是該組在鑒別空間中該維上的矩心坐標(biāo)值??疾煸阼b別空間中每個(gè)案例點(diǎn)與各組的矩心之間的距離,便于分析具體案例分組屬性的傾向。(五)鑒別力指數(shù)鑒別力指數(shù)就是這樣一個(gè)評(píng)價(jià)各鑒別函數(shù)的指標(biāo),有時(shí)它也被更直接地稱為方差百分比。鑒別分析通過(guò)一個(gè)鑒別函數(shù)所能代表的所有原始數(shù)據(jù)中組間總差異的百分比來(lái)表示每個(gè)鑒別函數(shù)的鑒別力。在鑒別分析中,一個(gè)鑒別函數(shù)所代表的組間總差異的相對(duì)數(shù)量用特征值來(lái)表示。這個(gè)特征值其實(shí)就是該維函數(shù)的組間差異量相對(duì)于組內(nèi)差異量的倍數(shù)。換句話說(shuō),它是以組內(nèi)差異量為基準(zhǔn)單位計(jì)量的組間差異量。而組內(nèi)差異指是數(shù)據(jù)中與分組類別毫無(wú)關(guān)系的那些差異,即所有鑒別函數(shù)都不能解釋的差異,那么根據(jù)上述分析假定,可認(rèn)為各組的組內(nèi)差異相等。(六)殘余鑒別力的檢驗(yàn)就此,我們已經(jīng)討論的前五個(gè)指標(biāo)都不用考慮數(shù)據(jù)的抽樣及推斷性質(zhì)。它們對(duì)于總體資料和任何類型的樣本都同樣適宜。但殘余鑒別力有所不同。(七)Fisher鑒別系數(shù)Fisher鑒別系數(shù)可以用來(lái)對(duì)一個(gè)案例原始鑒別變量直接進(jìn)行鑒別分組。也就是說(shuō),如果有這套系數(shù),再有一個(gè)新案例的數(shù)據(jù),就可以通過(guò)這套Fisher鑒別系數(shù)直接進(jìn)行手工計(jì)算的鑒別。因此,Fisher鑒別系數(shù)主要服務(wù)于在沒(méi)有計(jì)算機(jī)及統(tǒng)計(jì)軟件的情況下對(duì)新案例的鑒別。五、用SPSS對(duì)例題做鑒別分析的操作在SPSS中進(jìn)行鑒別分析時(shí),所有鑒別變量的格式與一般情況毫無(wú)二致,只是對(duì)于分組變量有一定要求。分組變量的案例有兩種情況:第一種是已知所屬分組類型,鑒別分析根據(jù)它們來(lái)建立鑒別函數(shù);第二種是未知所屬分組類型,需要通過(guò)分析進(jìn)行鑒別。(二)spss鑒別分析設(shè)置的操作(三)犛犘犛犛鑒別分類結(jié)果的輸出格式關(guān)于鑒別分析各項(xiàng)主要統(tǒng)計(jì)指標(biāo)的意義及輸出格式已經(jīng)在前面介紹過(guò)了,這里主要討論的是關(guān)于案例鑒別結(jié)果和概要鑒別結(jié)果的輸出指標(biāo)及格式。1.每個(gè)案例的鑒別結(jié)果鑒別分析的主要目的是通過(guò)已知分組案例信息建立鑒別函數(shù),再利用鑒別函數(shù)對(duì)所有案例進(jìn)行重新鑒別分組。SPSS鑒別分析可以輸出所有案例的鑒別分類結(jié)果,既包括原來(lái)分組變量中已知類別的案例,也包括其他類別未知的案例。研究人員可以從前一種案例重新鑒別結(jié)果來(lái)考查鑒別函數(shù)的效果,又可以取得對(duì)后一種案例的鑒別分類估計(jì)。2.鑒別分析的概要結(jié)果SPSS鑒別分析輸出鑒別的概要結(jié)果可以提供按原始分組類別與預(yù)測(cè)分組類別型的案例數(shù)交互表,并提供相應(yīng)的所占比例。這種信息提供了對(duì)鑒別函數(shù)效果的評(píng)價(jià)。表10-9是SPSS輸出的本例鑒別的概要結(jié)果。3.圖形輸出SPSS鑒別分析所輸出的本例所有各組合并的鑒別圖展示在圖10-1中。為了便于查看,我們利用SPSS圖形編輯器將其中原來(lái)分屬第一、二、三組的案例用分別三角、圓圈和方塊符號(hào)表示,而原來(lái)未分組的案例則用交叉符號(hào)表示。原鑒別圖中還自動(dòng)提供各組矩心的位置,我們將其改用十字符號(hào)表示。從統(tǒng)計(jì)方法論角度而言,并不能用已知分組的案例建立的鑒別函數(shù)反過(guò)來(lái)的再次鑒別(即我們沿用SPSS軟件所說(shuō)的“預(yù)測(cè)”)的正確率來(lái)證明這套鑒別函數(shù)一定適合于那些尚未分組的案例,而對(duì)其進(jìn)行分類的結(jié)果又無(wú)法證明自身的鑒別是否正確。其他統(tǒng)計(jì)評(píng)價(jià)指標(biāo)所說(shuō)明的是已知分組屬性的那些案例在鑒別變量方面的差異是否被鑒別函數(shù)所表達(dá),因而也只是一個(gè)參考。為了實(shí)證一個(gè)鑒別方案的效力,可以考慮另一種做法。即先將已知分類的案例先隨機(jī)地分成兩半,用其中的一半建立鑒別函數(shù),計(jì)算各統(tǒng)計(jì)指標(biāo)。而將另一半權(quán)且當(dāng)作未知分類的案例來(lái)進(jìn)行鑒別。最后再將這一半的鑒別結(jié)果與原來(lái)的已知分組進(jìn)行比較,以證明鑒別方案的實(shí)際效力。如果鑒別效果同樣很好,這一鑒別方案便可以在實(shí)際中應(yīng)用了。當(dāng)然,這就要求已知分組的案例數(shù)量相對(duì)較多才能實(shí)施?;靖拍罘纸M變量鑒別變量維空間鑒別函數(shù)多元共線性問(wèn)題協(xié)方差矩陣相等假定多元正態(tài)分布假定非標(biāo)準(zhǔn)化鑒別系數(shù)鑒別值標(biāo)準(zhǔn)化鑒別系數(shù)結(jié)構(gòu)系數(shù)總結(jié)構(gòu)系數(shù)組內(nèi)結(jié)構(gòu)系數(shù)分組的矩心鑒別力指數(shù)方差百分比典型相關(guān)系數(shù)殘余鑒別力wilks檢驗(yàn)fisher鑒別系數(shù)案例鑒別結(jié)果最大可能組預(yù)測(cè)組別條件概率后驗(yàn)概率馬氏距離的平方鑒別概要表鑒別圖本章要點(diǎn)1.鑒別分析是根據(jù)以往經(jīng)驗(yàn)歸納對(duì)案例進(jìn)行統(tǒng)計(jì)鑒別和分類的方法。2.鑒別分析的第一階段以一部分已知類型的觀測(cè)案例的多元變量觀測(cè)值作為鑒別變量,建立不同類型的鑒別函數(shù),即用純統(tǒng)計(jì)的手段對(duì)不同類型與鑒別變量之間的數(shù)量關(guān)系進(jìn)行歸納。雖然從數(shù)學(xué)上可能得
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 呼倫貝爾學(xué)院《室安全與管理(含生物安全管理)》2023-2024學(xué)年第二學(xué)期期末試卷
- 農(nóng)業(yè)機(jī)械購(gòu)置與使用服務(wù)合同書(shū)
- 學(xué)校服裝購(gòu)銷合同
- 加盟羅森便利店合同
- 口腔科診所承包合同
- 外墻保溫勞務(wù)承包合同
- 情感婚戀咨詢服務(wù)合同
- 門(mén)面房屋裝修合同
- 售后服務(wù)技術(shù)合同
- 【53天天天練】小學(xué)數(shù)學(xué)二年級(jí)下冊(cè)有余數(shù)的除法第四課時(shí)同步練習(xí)(含答案)
- (畢業(yè)設(shè)計(jì)方案)福田輕型貨車(chē)制動(dòng)系統(tǒng)設(shè)計(jì)方案
- 2024年九年級(jí)中考語(yǔ)文課外文言文閱讀題匯集(一)附答案解析
- 砂石路維修工程施工方案
- 小組工作中的角色分工
- 站臺(tái)保潔服務(wù)方案
- DL-T5190.1-2022電力建設(shè)施工技術(shù)規(guī)范第1部分:土建結(jié)構(gòu)工程
- 2024-2030年中國(guó)高端半導(dǎo)體激光芯片行業(yè)市場(chǎng)全景調(diào)研及發(fā)展前景研判報(bào)告
- TD/T 1044-2014 生產(chǎn)項(xiàng)目土地復(fù)墾驗(yàn)收規(guī)程(正式版)
- 腦膠質(zhì)瘤診療指南2022年版
- 兒童通信知識(shí)科普
評(píng)論
0/150
提交評(píng)論