數(shù)據(jù)挖掘數(shù)據(jù)集PPT課件_第1頁(yè)
數(shù)據(jù)挖掘數(shù)據(jù)集PPT課件_第2頁(yè)
數(shù)據(jù)挖掘數(shù)據(jù)集PPT課件_第3頁(yè)
數(shù)據(jù)挖掘數(shù)據(jù)集PPT課件_第4頁(yè)
數(shù)據(jù)挖掘數(shù)據(jù)集PPT課件_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、引例統(tǒng)計(jì)學(xué)奧卡姆剃刀 以盡量少的因子去解釋現(xiàn)象,減少中間過(guò)程。誤差會(huì)以乘積的方式擴(kuò)大引入因子會(huì)使主題偏移第1頁(yè)/共20頁(yè)辛普森悖論 分組中具有優(yōu)勢(shì),總評(píng)中卻是劣勢(shì)。 愛(ài)荷華州的一位居民移居到阿拉巴馬州,結(jié)果提高了這兩個(gè)州的平均智商。 分組兼顧權(quán)重定量因子細(xì)化分析第2頁(yè)/共20頁(yè)數(shù)據(jù)挖掘的三種基本數(shù)據(jù)集 數(shù)據(jù)集事物數(shù)據(jù)集時(shí)序/序列數(shù)據(jù)集多維屬性數(shù)據(jù)集第3頁(yè)/共20頁(yè)4事物數(shù)據(jù)集ID WORKID TIME WORK第4頁(yè)/共20頁(yè)描述性結(jié)果模式以描述性語(yǔ)言及規(guī)則等展現(xiàn)形式關(guān)聯(lián)規(guī)則序列規(guī)則If-then 規(guī)則集第5頁(yè)/共20頁(yè)時(shí)序數(shù)據(jù)集值時(shí)間序列數(shù)據(jù)集值值第6頁(yè)/共20頁(yè)預(yù)測(cè)性結(jié)果模式以各種回歸式

2、、方程式、檢驗(yàn)結(jié)果等無(wú)偏預(yù)測(cè)值展現(xiàn)l線(xiàn)性、多項(xiàng)式、泊松、嶺脊等回歸類(lèi)lARIMA、X-11、WOLD分解等時(shí)間序列模式l嵌入式網(wǎng)狀結(jié)構(gòu)、過(guò)擬合網(wǎng)狀神經(jīng)等學(xué)習(xí)模式第7頁(yè)/共20頁(yè)ARIMA平穩(wěn)時(shí)間序列預(yù)測(cè)-舉例某地年最低氣溫時(shí)序數(shù)據(jù)繪制時(shí)序圖平穩(wěn)性和純隨機(jī)性檢驗(yàn)定階參數(shù)估計(jì)模式化及預(yù)測(cè)第8頁(yè)/共20頁(yè)ARIMA時(shí)間序列預(yù)測(cè)-舉例預(yù)測(cè)效果圖第9頁(yè)/共20頁(yè)多維屬性數(shù)據(jù)集屬性/值目標(biāo)有目標(biāo)值則是有監(jiān)督性第10頁(yè)/共20頁(yè)分類(lèi)性結(jié)果模式各種機(jī)器學(xué)習(xí)lK中心、兩階段、鄰近、系統(tǒng)等無(wú)監(jiān)督聚類(lèi)l分類(lèi)樹(shù)、邏輯回歸、神經(jīng)網(wǎng)等監(jiān)督性分類(lèi)模式第11頁(yè)/共20頁(yè)監(jiān)督性分類(lèi)性-舉例信貸風(fēng)險(xiǎn)預(yù)測(cè) 數(shù)據(jù)來(lái)源于銀行信貸部門(mén)對(duì)

3、用戶(hù)貸款信息的記錄,包括客戶(hù)基本信息、信用信息、是否拖欠等。希望通過(guò)對(duì)以往客戶(hù)數(shù)據(jù)的分析來(lái)對(duì)新客戶(hù)評(píng)價(jià)信用,降低風(fēng)險(xiǎn)。 待分析數(shù)據(jù)數(shù)據(jù)倉(cāng)庫(kù)處理后數(shù)據(jù)變換后數(shù)據(jù)數(shù)據(jù)抽取數(shù)據(jù)預(yù)處理數(shù)據(jù)挖掘數(shù)據(jù)變換解釋評(píng)價(jià)建模數(shù)據(jù)集第12頁(yè)/共20頁(yè)2021-11-25監(jiān)督性分類(lèi)性-舉例界面化流程圖第13頁(yè)/共20頁(yè)2021-11-25監(jiān)督性分類(lèi)性-舉例結(jié)果輸出模型比較預(yù)測(cè)的0/實(shí)際所有的0第14頁(yè)/共20頁(yè)2021-11-25監(jiān)督性分類(lèi)性-舉例結(jié)果輸出最優(yōu)模型樹(shù)第15頁(yè)/共20頁(yè)2021-11-25監(jiān)督性分類(lèi)性-舉例結(jié)果輸出分類(lèi) 將打分文件輸入待預(yù)測(cè)數(shù)據(jù)集,對(duì)新數(shù)據(jù)產(chǎn)生分類(lèi)。第16頁(yè)/共20頁(yè)文本數(shù)據(jù)集文本只有單列文本第17頁(yè)/共20頁(yè)企業(yè)決策支持信息系統(tǒng)企業(yè)決策支持信息系統(tǒng)ODS數(shù)據(jù)倉(cāng)庫(kù)統(tǒng)計(jì)分析數(shù)據(jù)挖掘決策支持1st Qtr2nd Qtr3rd Qtr4th QtrPowerPlayFileEditDataValuesDisplayTextLegendLocation 1992 All Products Age groups Revenue($000)OLAP

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論