判別分析明明_第1頁(yè)
判別分析明明_第2頁(yè)
判別分析明明_第3頁(yè)
判別分析明明_第4頁(yè)
判別分析明明_第5頁(yè)
已閱讀5頁(yè),還剩20頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組判別分析判別分析 discriminant 報(bào)告人:解明明報(bào)告人:解明明指導(dǎo)教師指導(dǎo)教師:謝邦昌謝邦昌日期:日期:2007年年11月月統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組主要內(nèi)容主要內(nèi)容判別分析介紹判別分析介紹fisher判別判別bayes判別判別逐步判別逐步判別案例分析案例分析統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組判別分析介紹判別分析介紹 判別分析是指對(duì)分類因變量的建模,依據(jù)是因變量與一個(gè)或多個(gè)解釋變量的關(guān)系。 主要目的是識(shí)別一

2、個(gè)個(gè)體所屬的類別。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組模型的假設(shè)模型的假設(shè) 判別分析模型有如下的假設(shè): l如果假設(shè)滿足,尤其是在樣本量比較小的情況下,clementine能給出更好的結(jié)果。 解釋變量間不存在多重共線性。解釋變量間不存在多重共線性。 對(duì)于一個(gè)解釋變量其均值和方差不相關(guān)。對(duì)于一個(gè)解釋變量其均值和方差不相關(guān)。 在不同組間兩個(gè)變量的相關(guān)系數(shù)是不變的。在不同組間兩個(gè)變量的相關(guān)系數(shù)是不變的。 每一個(gè)解釋變量的值服從正態(tài)分布。每一個(gè)解釋變量的值服從正態(tài)分布。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組fisher

3、判別-4-20246-4-3-2-10123fisher判別的思想是投影,將k組p維數(shù)投影到某一個(gè)方向,使得他們的投影組與組之間盡可能的分開。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組bayes判別bayes判別的統(tǒng)計(jì)思想是:假定對(duì)研究的對(duì)象已有一定的認(rèn)識(shí),常用先驗(yàn)概率分布來(lái)描述這種認(rèn)識(shí),然后我們?nèi)〉靡粋€(gè)樣本,用樣本來(lái)修正已有的知識(shí)(先驗(yàn)概率分布),得到后驗(yàn)概率分布,各種統(tǒng)計(jì)推斷都通過(guò)后驗(yàn)概率分布來(lái)進(jìn)行。將這種思想用于判別分析,就得到貝頁(yè)斯判別。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組案例分析 假設(shè)有一個(gè)電信供應(yīng)商已

4、經(jīng)根據(jù)客戶業(yè)假設(shè)有一個(gè)電信供應(yīng)商已經(jīng)根據(jù)客戶業(yè)務(wù)的使用情況將他們分為了四個(gè)組別。務(wù)的使用情況將他們分為了四個(gè)組別。如果人口統(tǒng)計(jì)學(xué)數(shù)據(jù)可以用來(lái)預(yù)測(cè)客戶如果人口統(tǒng)計(jì)學(xué)數(shù)據(jù)可以用來(lái)預(yù)測(cè)客戶的組別的話,我們就可以為潛在的客戶的組別的話,我們就可以為潛在的客戶定制用戶化的服務(wù)。定制用戶化的服務(wù)。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 這四個(gè)組別分別為這四個(gè)組別分別為:統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 雙擊來(lái)源選項(xiàng)板(雙擊來(lái)源選項(xiàng)板(sourcessources)中的)中的spssspss節(jié)節(jié)點(diǎn),數(shù)據(jù)流區(qū)域即可出現(xiàn)點(diǎn)

5、,數(shù)據(jù)流區(qū)域即可出現(xiàn)spssspss節(jié)點(diǎn)節(jié)點(diǎn)。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 數(shù)據(jù)流區(qū)域(數(shù)據(jù)流區(qū)域(stream canvasstream canvas)中雙擊)中雙擊spssspss節(jié)點(diǎn),在節(jié)點(diǎn),在import file import file 中選擇我們中選擇我們所要分析的數(shù)據(jù)。所要分析的數(shù)據(jù)。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 在收藏夾(favorites)選項(xiàng)板或字段操作選項(xiàng)板(field ops)中雙擊類型(type)節(jié)點(diǎn),來(lái)檢查是否所有的變量的類型都被正確的定義。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商

6、業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 由于由于custcatcustcat是我們要預(yù)測(cè)的變量,在方是我們要預(yù)測(cè)的變量,在方向(向(directiondirection)里我們選為輸出()里我們選為輸出(outout)統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 由于本案例關(guān)注的是人口統(tǒng)計(jì)學(xué)變量,所以我們?cè)黾右粋€(gè)過(guò)濾(filter)節(jié)點(diǎn),單擊annotations將其重命名。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 根據(jù)分析目的,我們只選擇region, age, marital, address,

7、 income, ed, employ, retire, gender, reside和 custcat這幾個(gè)變量。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 從模型選項(xiàng)(modeling)加入判別分析(dicriminant)的節(jié)點(diǎn)。并在annotations中改名為“判別分析”。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 在判別分析中點(diǎn)模型鍵(model),并在方法(method)中選逐步判別(stepwise)。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 在專家(expert

8、)鍵中,選擇expert,單擊輸出(output),選擇如左圖所示的選項(xiàng)。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 選擇執(zhí)行(選擇執(zhí)行(executeexecute)后,在右上角點(diǎn))后,在右上角點(diǎn)models,models,雙擊雙擊custatcustat,在數(shù)據(jù)流區(qū)域變出,在數(shù)據(jù)流區(qū)域變出現(xiàn)改節(jié)點(diǎn),雙擊改節(jié)點(diǎn)便可以查看結(jié)果?,F(xiàn)改節(jié)點(diǎn),雙擊改節(jié)點(diǎn)便可以查看結(jié)果。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 這張表格展示了逐步判別中每次進(jìn)入分析的變量,可見最后模型只選擇了3個(gè)變量。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組

9、統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 逐步判別可以自動(dòng)幫我們選擇變量。但逐步判別可以自動(dòng)幫我們選擇變量。但是如果我們對(duì)于數(shù)據(jù)有一定的經(jīng)驗(yàn)知道是如果我們對(duì)于數(shù)據(jù)有一定的經(jīng)驗(yàn)知道哪些變量是重要的,選擇逐步判別就是哪些變量是重要的,選擇逐步判別就是很不明智的,因?yàn)檫@樣選出來(lái)的變量可很不明智的,因?yàn)檫@樣選出來(lái)的變量可能除了統(tǒng)計(jì)意義外,沒(méi)有任何的實(shí)際意能除了統(tǒng)計(jì)意義外,沒(méi)有任何的實(shí)際意義。義。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組由右邊第一張表可見前兩個(gè)線性判別函數(shù)可以解釋大部分的變異第二張表是四個(gè)組標(biāo)準(zhǔn)化后均值的位置。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 右表為標(biāo)右表為標(biāo)準(zhǔn)化的典準(zhǔn)化的典型判別函型判別函數(shù)的系數(shù)。數(shù)的系數(shù)。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 右圖是右圖是輸出的輸出的領(lǐng)域圖。領(lǐng)域圖。它給出它給出了預(yù)測(cè)了預(yù)測(cè)變量和變量和組別間組別間的關(guān)系。的關(guān)系。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論