




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組判別分析判別分析 discriminant 報(bào)告人:解明明報(bào)告人:解明明指導(dǎo)教師指導(dǎo)教師:謝邦昌謝邦昌日期:日期:2007年年11月月統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組主要內(nèi)容主要內(nèi)容判別分析介紹判別分析介紹fisher判別判別bayes判別判別逐步判別逐步判別案例分析案例分析統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組判別分析介紹判別分析介紹 判別分析是指對(duì)分類因變量的建模,依據(jù)是因變量與一個(gè)或多個(gè)解釋變量的關(guān)系。 主要目的是識(shí)別一
2、個(gè)個(gè)體所屬的類別。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組模型的假設(shè)模型的假設(shè) 判別分析模型有如下的假設(shè): l如果假設(shè)滿足,尤其是在樣本量比較小的情況下,clementine能給出更好的結(jié)果。 解釋變量間不存在多重共線性。解釋變量間不存在多重共線性。 對(duì)于一個(gè)解釋變量其均值和方差不相關(guān)。對(duì)于一個(gè)解釋變量其均值和方差不相關(guān)。 在不同組間兩個(gè)變量的相關(guān)系數(shù)是不變的。在不同組間兩個(gè)變量的相關(guān)系數(shù)是不變的。 每一個(gè)解釋變量的值服從正態(tài)分布。每一個(gè)解釋變量的值服從正態(tài)分布。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組fisher
3、判別-4-20246-4-3-2-10123fisher判別的思想是投影,將k組p維數(shù)投影到某一個(gè)方向,使得他們的投影組與組之間盡可能的分開。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組bayes判別bayes判別的統(tǒng)計(jì)思想是:假定對(duì)研究的對(duì)象已有一定的認(rèn)識(shí),常用先驗(yàn)概率分布來(lái)描述這種認(rèn)識(shí),然后我們?nèi)〉靡粋€(gè)樣本,用樣本來(lái)修正已有的知識(shí)(先驗(yàn)概率分布),得到后驗(yàn)概率分布,各種統(tǒng)計(jì)推斷都通過(guò)后驗(yàn)概率分布來(lái)進(jìn)行。將這種思想用于判別分析,就得到貝頁(yè)斯判別。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組案例分析 假設(shè)有一個(gè)電信供應(yīng)商已
4、經(jīng)根據(jù)客戶業(yè)假設(shè)有一個(gè)電信供應(yīng)商已經(jīng)根據(jù)客戶業(yè)務(wù)的使用情況將他們分為了四個(gè)組別。務(wù)的使用情況將他們分為了四個(gè)組別。如果人口統(tǒng)計(jì)學(xué)數(shù)據(jù)可以用來(lái)預(yù)測(cè)客戶如果人口統(tǒng)計(jì)學(xué)數(shù)據(jù)可以用來(lái)預(yù)測(cè)客戶的組別的話,我們就可以為潛在的客戶的組別的話,我們就可以為潛在的客戶定制用戶化的服務(wù)。定制用戶化的服務(wù)。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 這四個(gè)組別分別為這四個(gè)組別分別為:統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 雙擊來(lái)源選項(xiàng)板(雙擊來(lái)源選項(xiàng)板(sourcessources)中的)中的spssspss節(jié)節(jié)點(diǎn),數(shù)據(jù)流區(qū)域即可出現(xiàn)點(diǎn)
5、,數(shù)據(jù)流區(qū)域即可出現(xiàn)spssspss節(jié)點(diǎn)節(jié)點(diǎn)。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 數(shù)據(jù)流區(qū)域(數(shù)據(jù)流區(qū)域(stream canvasstream canvas)中雙擊)中雙擊spssspss節(jié)點(diǎn),在節(jié)點(diǎn),在import file import file 中選擇我們中選擇我們所要分析的數(shù)據(jù)。所要分析的數(shù)據(jù)。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 在收藏夾(favorites)選項(xiàng)板或字段操作選項(xiàng)板(field ops)中雙擊類型(type)節(jié)點(diǎn),來(lái)檢查是否所有的變量的類型都被正確的定義。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商
6、業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 由于由于custcatcustcat是我們要預(yù)測(cè)的變量,在方是我們要預(yù)測(cè)的變量,在方向(向(directiondirection)里我們選為輸出()里我們選為輸出(outout)統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 由于本案例關(guān)注的是人口統(tǒng)計(jì)學(xué)變量,所以我們?cè)黾右粋€(gè)過(guò)濾(filter)節(jié)點(diǎn),單擊annotations將其重命名。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 根據(jù)分析目的,我們只選擇region, age, marital, address,
7、 income, ed, employ, retire, gender, reside和 custcat這幾個(gè)變量。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 從模型選項(xiàng)(modeling)加入判別分析(dicriminant)的節(jié)點(diǎn)。并在annotations中改名為“判別分析”。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 在判別分析中點(diǎn)模型鍵(model),并在方法(method)中選逐步判別(stepwise)。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 在專家(expert
8、)鍵中,選擇expert,單擊輸出(output),選擇如左圖所示的選項(xiàng)。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 選擇執(zhí)行(選擇執(zhí)行(executeexecute)后,在右上角點(diǎn))后,在右上角點(diǎn)models,models,雙擊雙擊custatcustat,在數(shù)據(jù)流區(qū)域變出,在數(shù)據(jù)流區(qū)域變出現(xiàn)改節(jié)點(diǎn),雙擊改節(jié)點(diǎn)便可以查看結(jié)果?,F(xiàn)改節(jié)點(diǎn),雙擊改節(jié)點(diǎn)便可以查看結(jié)果。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 這張表格展示了逐步判別中每次進(jìn)入分析的變量,可見最后模型只選擇了3個(gè)變量。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組
9、統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 逐步判別可以自動(dòng)幫我們選擇變量。但逐步判別可以自動(dòng)幫我們選擇變量。但是如果我們對(duì)于數(shù)據(jù)有一定的經(jīng)驗(yàn)知道是如果我們對(duì)于數(shù)據(jù)有一定的經(jīng)驗(yàn)知道哪些變量是重要的,選擇逐步判別就是哪些變量是重要的,選擇逐步判別就是很不明智的,因?yàn)檫@樣選出來(lái)的變量可很不明智的,因?yàn)檫@樣選出來(lái)的變量可能除了統(tǒng)計(jì)意義外,沒(méi)有任何的實(shí)際意能除了統(tǒng)計(jì)意義外,沒(méi)有任何的實(shí)際意義。義。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組由右邊第一張表可見前兩個(gè)線性判別函數(shù)可以解釋大部分的變異第二張表是四個(gè)組標(biāo)準(zhǔn)化后均值的位置。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 右表為標(biāo)右表為標(biāo)準(zhǔn)化的典準(zhǔn)化的典型判別函型判別函數(shù)的系數(shù)。數(shù)的系數(shù)。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組 右圖是右圖是輸出的輸出的領(lǐng)域圖。領(lǐng)域圖。它給出它給出了預(yù)測(cè)了預(yù)測(cè)變量和變量和組別間組別間的關(guān)系。的關(guān)系。統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能應(yīng)用研究小組統(tǒng)計(jì)分析、數(shù)據(jù)挖掘與商業(yè)智能
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)學(xué)資料 早產(chǎn)兒護(hù)理查房文稿 學(xué)習(xí)課件
- 計(jì)算機(jī)二級(jí)復(fù)習(xí)資料及試題及答案
- 山東省海洋知識(shí)競(jìng)賽(小學(xué)生組)考試題(附答案)
- 供應(yīng)室崗前培訓(xùn)
- 《十六年前的回憶》教學(xué)設(shè)計(jì)【9篇】
- 《2025關(guān)于兩企業(yè)之間設(shè)備《采購(gòu)合同》的意見書》
- 小腸潰瘍的健康宣教
- 初中語(yǔ)文課外古詩(shī)文夏本紀(jì)全文閱讀及翻譯
- 產(chǎn)品加工定制合同標(biāo)準(zhǔn)文本
- 2手房屋轉(zhuǎn)讓合同范例
- 灌籃高手臺(tái)詞001話中日雙語(yǔ)
- 關(guān)于印發(fā)《臨床輸血技術(shù)規(guī)范》的通知
- 第5章 智能網(wǎng)聯(lián)汽車運(yùn)動(dòng)控制技術(shù)
- 外貿(mào)業(yè)務(wù)員面試試卷
- 四年級(jí)下冊(cè)勞動(dòng)教育全冊(cè)教案設(shè)計(jì)
- 電梯鋼結(jié)構(gòu)井道技術(shù)方案-
- 一般公共預(yù)算支出編制流程圖
- 四川大學(xué)-劉龍飛-畢業(yè)答辯PPT模板
- 麗聲北極星分級(jí)繪本第一級(jí)下The King's Yu Player教學(xué)設(shè)計(jì)
- 顯微操作技術(shù)(全面)
- 兩立體相交相貫
評(píng)論
0/150
提交評(píng)論