實驗二、數(shù)據(jù)倉庫的OLAP技術(shù)實驗_第1頁
實驗二、數(shù)據(jù)倉庫的OLAP技術(shù)實驗_第2頁
實驗二、數(shù)據(jù)倉庫的OLAP技術(shù)實驗_第3頁
實驗二、數(shù)據(jù)倉庫的OLAP技術(shù)實驗_第4頁
實驗二、數(shù)據(jù)倉庫的OLAP技術(shù)實驗_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)嶒炛笇?dǎo)書自編BISTU計算機(jī)學(xué)院數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程組2013年11月數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)嶒炛笇?dǎo)書 實驗二、數(shù)據(jù)倉庫的OLAP技術(shù)實驗實驗?zāi)康模?)掌握決策樹模型的基本概念和計算方法,并用其預(yù)測三國表中“身份屬性”與其他屬性的關(guān)系;2)掌握貝葉斯分類器的基本概念,并用其預(yù)測三國表中“身份屬性”與其他屬性的關(guān)系;3)掌握關(guān)聯(lián)規(guī)則的基本概念和種類,并用其預(yù)測“腎細(xì)胞癌轉(zhuǎn)移情況”。4)對比以上三種模型,分析其聯(lián)系與區(qū)別。實驗結(jié)果分析與要求:完成實驗?zāi)康闹械膬?nèi)容,記錄操作中的各個步驟,并進(jìn)行分析。實驗內(nèi)容:1、使用決策樹模型預(yù)測三國表中“身份屬性”與其他屬性間的關(guān)系;材料:SQL

2、范例資料.xls中的三國表。軟件:SQLServer2008R2基本步驟:1)將三國表導(dǎo)入到SQL數(shù)據(jù)庫,具體步驟如實驗一所示。2)建立“AnalysisService”項目。2.1打開“SQLServerBusinessIntelligenceDevelopmentStudio”,選擇“文件(F)”9“新建(N)”9“項目”在“新建項目”選項卡的“VisualStudio已安裝的模板”中,選擇“AnalysisService項目”,并設(shè)置項目的“名稱(N)”和“位置(L)”,如將名稱設(shè)置為“Test2”,最后單擊“確定”按鈕即可新建一個SSIS項目。2.2打開安裝目錄“MicrosoftSQ

3、LServer2008R2配置工具”下的“SQLServer配置管理器”,分別將“SQLServer(MSSQLSERVER1)”、“SQLServerAnalysisServices(MSSQLSERVER1)”、“SQLServerBrowser”服務(wù)啟動,并將“登陸身份為”均設(shè)置“LocalSystem”。名稱啟動模式登錄身份為進(jìn)程ID服務(wù)類型匪)SQLServeri:jilSSQLSETR:i正在運(yùn)行自動Loc:alS7Etem1288SQLServer|嚴(yán)SQLServer(MSSQLSERVER1)正在運(yùn)行自動Loc:alSystem1240SQLServer:;逐)SQLServ

4、erArualyeieServices(MSSQLSEKTRl)正在運(yùn)行自動Loc:alSystem1556ArL:ily5ieServerjj)SQLServerBroneer正在運(yùn)行自動Loc:alSystem2196SQLBrowser固SQLServer代理(MSSQLSERrER:l已停止手動Loc:alSystem0SQLAgentFull-1關(guān)tFilterDaemonLauncher(MSSQLSERRl)正在運(yùn)行手動NTAlfTHLIFLETYMlETWOFlISETCE2988Full-t己蠶tFiltm.SQLServerIn.tegi_ati口nServices10.0

5、正在運(yùn)行自動町AirTHLlFJTYVNETWOFJSERVTCE992SSISServer|)SQLServerReportingServicee(MSSQLSEJTRl)正在運(yùn)行自動NTAl.rrHi:iFLETYl-.iIETfi,OFJSEmCE1668Repor匱SQLServerK理(MSSQLSERRl:l已停止手動NTAUTHURITYlNET肛iRIiSEEVICE0SQLAgent2.3在VS中,選擇“項目(P)”9“屬性(P),在“Test2屬性頁”選項卡的“配置屬性”9“部署”中,將默認(rèn)的服務(wù)器“l(fā)ocalhost”,更改為步驟1)中所設(shè)置的服務(wù)器名實例名,該例中即A0

6、3MSSQLSERVER1,然后點擊“應(yīng)用”,最后單擊“確定”。建立數(shù)據(jù)源3.1在“解決方案資源管理器”窗口,右擊項目名下的“數(shù)據(jù)源”,選擇“新建數(shù)據(jù)源”,進(jìn)入“數(shù)據(jù)源向?qū)А苯缑妗?.2單擊“下一步”按鈕,再單擊“新建”按鈕,進(jìn)入“連接管理器”界面。單擊“服務(wù)器名(E)”的下拉列表,選擇步驟1)中所使用的服務(wù)器,該例中即為“A03”;單擊“選擇或輸入一個數(shù)據(jù)庫名(D)”的下拉列表,選擇步驟1)中所使用的數(shù)據(jù)庫,該例中即為“Mydatabase”;點擊“確定”按鈕退回到“數(shù)據(jù)源向?qū)А苯缑妗?.3單擊“下一步”按鈕,在“模擬信息”選項卡中選擇“使用服務(wù)賬戶(Y)”,單擊“下一步”按鈕,單擊“完成”

7、按鈕。建立數(shù)據(jù)源視圖4.1在“解決方案資源管理器”窗口,右擊項目名下的“數(shù)據(jù)源視圖”,選擇“新建數(shù)據(jù)源視圖”,進(jìn)入“數(shù)據(jù)源視圖向?qū)А苯缑妗?.2單擊“下一步”按鈕,在“關(guān)系數(shù)據(jù)源(R)”中選擇所使用的數(shù)據(jù)庫,該例子中使用“Mydatabase”。4.3單擊“下一步”按鈕,將“可用對象(A)”中的表移入“包含的對象”中,單擊“下一步”按鈕,再單擊“完成”按鈕。建立數(shù)據(jù)挖掘結(jié)構(gòu)5.1在“解決方案資源管理器”窗口,右擊項目名下的“挖掘結(jié)構(gòu)”,選擇“新建挖掘結(jié)構(gòu)”進(jìn)入“挖掘結(jié)構(gòu)向?qū)А苯缑妗?.2單擊“下一步”按鈕,選擇“從現(xiàn)有關(guān)系數(shù)據(jù)庫或數(shù)據(jù)倉庫(D)”.5.3單擊“下一步按鈕到數(shù)據(jù)挖掘技術(shù)部分,選擇

8、“Microsoft決策樹”后,單擊“下一步”按鈕。5.4選擇所要用數(shù)據(jù)的數(shù)據(jù)庫位置后,單擊“下一步”按鈕。5.5選擇要使用的數(shù)據(jù)表,單擊“下一步”按鈕。5.6選擇所需的“索引鍵”、“輸入變量”、“預(yù)測變量”以“序列號碼”為鍵值,“身份”為預(yù)測變量,并單擊“建議”按鈕以了解預(yù)測變量與其他變量間的相關(guān)性,可找出較具影響力的輸入變量,完成后單擊“確定”按鈕,這時會回到原來的頁面,單擊“下一步”按鈕。5.7單擊“檢測”按鈕,此時程序會提出一些變量的相關(guān)系數(shù),用戶可自行選擇輸入與否,聲明正確的數(shù)據(jù)屬性,完成后單擊“下一步”按鈕。5.8在此可選擇測試數(shù)據(jù)的百分比,本實驗中無測試數(shù)據(jù),百分比選擇“0”5.

9、9單擊下一步,更改挖掘結(jié)構(gòu)名稱,單擊“完成”按鈕。6)選擇“挖掘模型查看器”,程序詢問是否生成和部署項目,單擊“是”按鈕;接下來單擊“運(yùn)行”按鈕,運(yùn)行完成后單擊“關(guān)閉”按鈕。7)建模完成,生成數(shù)據(jù)挖掘結(jié)構(gòu)接口包含數(shù)據(jù)挖掘結(jié)構(gòu)、挖掘模型、挖掘模型查看器、挖掘準(zhǔn)確度圖標(biāo)以及挖掘模型預(yù)測;其中在挖掘結(jié)構(gòu)中,主要是呈現(xiàn)數(shù)據(jù)間的關(guān)聯(lián)性以及分析的變量。而在挖掘模型中,主要是列出所建立的挖掘模型,也可以新建挖掘模型,并調(diào)整變量,變量使用狀況包含Ignore(忽略)、Input(輸入變量)、Predict(預(yù)測變量、輸入變量)以及PredictOnly(預(yù)測變量)。而在挖掘模型上右擊,選擇“設(shè)置算法參數(shù)”針對方法論的參數(shù)設(shè)置加以編輯。挖掘模型查看器則是呈現(xiàn)此樹狀結(jié)構(gòu),對于數(shù)據(jù)的分布進(jìn)一步的加以了解。而可以從“依賴關(guān)系網(wǎng)絡(luò)”了解因變量與自變量間的關(guān)聯(lián)性強(qiáng)弱程度。2、使用貝葉斯模型預(yù)測三國表中“身份屬性”與其他屬性間的關(guān)系;材料:SQL范例資料.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論