數(shù)據(jù)倉庫與數(shù)據(jù)挖掘試驗指導(dǎo)書0001_第1頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘試驗指導(dǎo)書0001_第2頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘試驗指導(dǎo)書0001_第3頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘試驗指導(dǎo)書0001_第4頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘試驗指導(dǎo)書0001_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)嶒炛笇?dǎo)書前言數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)課程在計算機數(shù)據(jù)管理、維護中有著相當重要的作用。數(shù)據(jù)倉 庫系統(tǒng)在企業(yè)信息管理系統(tǒng)中應(yīng)用非常廣泛,數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)倉庫的管理及維護、完善 數(shù)據(jù)倉庫、發(fā)揮數(shù)據(jù)倉庫的作用有著非常大的作用。本課程主要內(nèi)容為:數(shù)據(jù)倉庫的概念與體系結(jié)構(gòu),數(shù)據(jù)倉庫數(shù)據(jù)處理過程,數(shù)據(jù)倉庫系 統(tǒng)的設(shè)計與開發(fā),各種數(shù)據(jù)挖掘技術(shù)(關(guān)聯(lián)規(guī)則,數(shù)據(jù)分類,數(shù)據(jù)類聚,貝葉斯網(wǎng)絡(luò),粗糙 集,神經(jīng)網(wǎng)絡(luò),遺傳算法,統(tǒng)計分析,文本與 Web 挖掘)及其應(yīng)用。本課程既有理論也有實踐, 實踐環(huán)節(jié)主要是基于 SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境下進 行各種數(shù)據(jù)挖掘技術(shù)的實驗。為使學(xué)生能

2、在 SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境下進行各種數(shù)據(jù)挖掘技術(shù)的實驗,首先必須創(chuàng)建一個 SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境,但考慮到學(xué)院實驗室管理要求和培養(yǎng)學(xué) 生的獨立動手能力,因此第一個實驗(實驗一:SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境的配置,綜合性實驗)分兩方面進行,一方面由實驗室對 SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境的配置 完成,提供給學(xué)生進行數(shù)據(jù)挖掘?qū)嶒灒硪环矫?,學(xué)生可利用自己的計算機環(huán)境進行課外實 驗,交實驗報告,其他實驗可根據(jù)課程內(nèi)容及課時安排在實驗指導(dǎo)教師的指導(dǎo)下在實驗室完 成。目錄1、實驗一: SQL Server 2005

3、 示例數(shù)據(jù)倉庫環(huán)境的配置 ?頁?碼?2、實驗二:使用 SQL Server 2005 建立多維數(shù)據(jù)模型 ?頁?碼?3、實驗三SQL Server 2005 中的關(guān)聯(lián)規(guī)則應(yīng)用?頁?碼?4、實驗四:SQL Server 2005 中的決策樹應(yīng)用?頁?碼?5、實驗五:SQL Server 2005中的 k-means 應(yīng)用 ?頁?碼?6、實驗六:SQL Server 2005 中的貝葉斯網(wǎng)絡(luò)應(yīng)用?頁?碼?7、實驗七:SQL Server 2005 中的神經(jīng)網(wǎng)絡(luò)應(yīng)用?頁?碼?8、實驗八:SQL Server 2005 中的線性回歸應(yīng)用?頁?碼?9、實驗九:SQL Server 2005 中的 Logi

4、stic 回歸應(yīng)用?頁?碼?10、實驗報告基本內(nèi)容要求 ?頁?碼?實驗一: SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境的配置實驗學(xué)時: 2實驗類型: 綜合實驗要求: 必修一、實驗?zāi)康耐ㄟ^本實驗的學(xué)習(xí),使學(xué)生掌握配置 SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境的知識,訓(xùn)練 其獨立配置數(shù)據(jù)倉庫環(huán)境的技能,為今后繼續(xù)配置數(shù)據(jù)倉庫環(huán)境的學(xué)習(xí)奠定基礎(chǔ)。二、實驗內(nèi)容安裝 SQL Server 2005,并在安裝過程中進行示例數(shù)據(jù)庫安裝配置, 由于本實驗為綜合性 實驗,實驗中涉及到計算機系統(tǒng)(硬件、軟件)環(huán)境要求,涉及軟件系統(tǒng)安裝知識,涉及到 軟件系統(tǒng)安裝配置正確與否進行檢驗的知識。三、實驗原理

5、、方法和手段通用微型計算機環(huán)境及 Windows 操作系統(tǒng)環(huán)境下系統(tǒng)軟件的安裝與配置。四、實驗組織運行要求根據(jù)本實驗的特點、 要求和具體條件, 采用“以學(xué)生自主訓(xùn)練為主的開放模式組織教學(xué)” 。五、實驗條件見 Microft SQL Server 2005 簡體中文企業(yè)版系統(tǒng)光盤提供的“ SQL Server 2005 安裝要、.”求”。六、實驗步驟參照 Microft SQL Server 2005 簡體中文企業(yè)版系統(tǒng)光盤提供的“ SQL Server 2005 安裝 說明”及教材數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 P72-P74 的內(nèi)容。七、思考題1、為什么要配置示例數(shù)據(jù)庫?2、如何驗證配置示例數(shù)據(jù)庫的正確

6、性?八、實驗報告1實驗要求: 仔細閱讀 Microft SQL Server 2005 簡體中文企業(yè)版系統(tǒng)光盤提供的 “SQLServer 2005安裝說明”、“SQL Server 2005安裝要求”及教材 P72-P74的內(nèi)容2、實驗?zāi)康?、實驗?nèi)容、實驗原理按本實驗指導(dǎo)的內(nèi)容填寫3、實驗儀器:按實驗計算機的硬件配置參數(shù)填寫4、實驗步驟:按教材 P72-P74 中( 1)、(2)、(3)填寫5、實驗數(shù)據(jù):無6、實驗總結(jié):回答思考題以及本次實驗的心得九、其它說明實驗二:使用 SQL Server 2005 建立多維數(shù)據(jù)模型實驗學(xué)時: 2實驗類型: 驗證實驗要求: 必修一、實驗?zāi)康耐ㄟ^本實驗的學(xué)

7、習(xí),使學(xué)生掌握在 SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境下建立多維數(shù)據(jù) 模型過程的知識,訓(xùn)練其把教材上的內(nèi)容應(yīng)用到實際中的技能,為今后繼續(xù)數(shù)據(jù)挖掘技術(shù)的 學(xué)習(xí)奠定基礎(chǔ)。二、實驗內(nèi)容在 SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境下建立多維數(shù)據(jù)模型。三、實驗原理、方法和手段數(shù)據(jù)倉庫環(huán)境下多維數(shù)據(jù)模型建立的方法。四、實驗組織運行要求根據(jù)本實驗的特點、要求和具體條件,采用“集中授課形式” 。五、實驗條件SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境。六、實驗步驟參照教材數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 P75-P87 的內(nèi)容。七、思考題1、度量值的不同對多維數(shù)據(jù)集的結(jié)構(gòu)有何影響?2、維度的層次結(jié)構(gòu)

8、和有關(guān)屬性對提高多維數(shù)據(jù)集的可用性和易用性有何意義?八、實驗報告1實驗要求:預(yù)習(xí)教材 P75-P87 的內(nèi)容2、實驗?zāi)康?、實驗?nèi)容、實驗原理按本實驗指導(dǎo)的內(nèi)容填寫3、實驗儀器:按實驗計算機的硬件配置參數(shù)填寫4、實驗步驟:按教材 P75-P87 的 1-7 填寫5、實驗數(shù)據(jù):各實驗步驟中的維度、層次等具體數(shù)據(jù)6、實驗總結(jié):回答思考題以及本次實驗的心得九、其它說明實驗三:SQL Server 2005 中關(guān)聯(lián)規(guī)則的應(yīng)用實驗學(xué)時: 2實驗類型: 驗證實驗要求: 必修一、實驗?zāi)康耐ㄟ^本實驗的學(xué)習(xí),使學(xué)生掌握在 SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境下關(guān)聯(lián)規(guī)則的應(yīng) 用的知識,訓(xùn)練其把教材上的內(nèi)

9、容應(yīng)用到實際中的技能,為今后繼續(xù)關(guān)聯(lián)規(guī)則知識的學(xué)習(xí)奠 定基礎(chǔ)。二、實驗內(nèi)容在 SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境下關(guān)聯(lián)規(guī)則的應(yīng)用。三、實驗原理、方法和手段關(guān)聯(lián)規(guī)則,項目與項集,關(guān)聯(lián)規(guī)則的支持度與最小支持度,關(guān)聯(lián)規(guī)則的可信度與最小可 信度。四、實驗組織運行要求根據(jù)本實驗的特點、要求和具體條件,采用“集中授課形式” 。五、實驗條件SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境。六、實驗步驟參照教材數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 P99-P105 的內(nèi)容。七、思考題1、MINIMUM_SUPPORT取值不同對關(guān)聯(lián)規(guī)則的挖掘結(jié)果有何影響?2、MINIMUM_PROBABILIT的取值不同對關(guān)聯(lián)規(guī)則

10、的挖掘結(jié)果有何影響?八、實驗報告1 實驗要求:預(yù)習(xí)教材 P99-P105 的內(nèi)容2、實驗?zāi)康摹嶒瀮?nèi)容、實驗原理按本實驗指導(dǎo)的內(nèi)容填寫3、實驗儀器:按實驗計算機的硬件配置參數(shù)填寫4、實驗步驟:按教材 P99-P1 05的 1-7 填寫2組5、實驗數(shù)據(jù):實驗步驟 5 中的具體數(shù)據(jù),至少6、實驗總結(jié):回答思考題以及本次實驗的心得九、其它說明實驗四: SQL Server 2005 中決策樹的應(yīng)用實驗學(xué)時: 2實驗類型: 驗證實驗要求: 必修一、實驗?zāi)康耐ㄟ^本實驗的學(xué)習(xí),使學(xué)生掌握在 SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境下決策樹的應(yīng)用 的知識,訓(xùn)練其把教材上的內(nèi)容應(yīng)用到實際中的技能,為今

11、后繼續(xù)決策樹挖掘技術(shù)知識的學(xué) 習(xí)奠定基礎(chǔ)。二、實驗內(nèi)容在 SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境下決策樹的應(yīng)用。三、實驗原理、方法和手段精確度,查全率和查準率,信息增益,信息增益比。四、實驗組織運行要求根據(jù)本實驗的特點、要求和具體條件,采用“集中授課形式” 。五、實驗條件SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境。六、實驗步驟參照教材數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 P118-P123 的內(nèi)容。七、思考題1、MINIMUM_SUPPORT取值不同對決策樹的挖掘結(jié)果有何影響?2、SCORE_METH的取值不同對決策樹的挖掘結(jié)果有何影響?八、實驗報告1 實驗要求:預(yù)習(xí)教材 P118-P123 的

12、內(nèi)容2、實驗?zāi)康摹嶒瀮?nèi)容、實驗原理按本實驗指導(dǎo)的內(nèi)容填寫3、實驗儀器:按實驗計算機的硬件配置參數(shù)填寫4、實驗步驟:按教材 P118-P123的(1) - (7)填寫5、實驗數(shù)據(jù):實驗步驟 5中的具體數(shù)據(jù),根據(jù)思考題的取值要求選取數(shù)據(jù),至少 2組6、實驗總結(jié):回答思考題以及本次實驗的心得九、其它說明實驗五: SQL Server 2005 中的 k-means 應(yīng)用實驗學(xué)時: 2實驗類型: 驗證 實驗要求: 必修一、實驗?zāi)康耐ㄟ^本實驗的學(xué)習(xí), 使學(xué)生掌握在 SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境下 k-means 的應(yīng)用 的知識, 訓(xùn)練其把教材上的內(nèi)容應(yīng)用到實際中的技能, 為今后繼續(xù)

13、聚類知識的學(xué)習(xí)奠定基礎(chǔ)。二、實驗內(nèi)容在 SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境下 k-means 的應(yīng)用。三、實驗原理、方法和手段相似度計算方法、 k-means 思想。四、實驗組織運行要求根據(jù)本實驗的特點、要求和具體條件,采用“集中授課形式” 。五、實驗條件SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境。六、實驗步驟參照教材數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 P139-P143 的內(nèi)容。七、思考題1、CLUSTER_COUNT取值不同對決策樹的挖掘結(jié)果有何影響?八、實驗報告1 實驗要求:預(yù)習(xí)教材 P139-P143 的內(nèi)容2、實驗?zāi)康摹嶒瀮?nèi)容、實驗原理按本實驗指導(dǎo)的內(nèi)容填寫3、實驗儀器:按實驗

14、計算機的硬件配置參數(shù)填寫4、實驗步驟:按教材 P1 39-P1 43的( 1 ) -(7)填寫5、實驗數(shù)據(jù):實驗步驟 5 中的具體數(shù)據(jù),根據(jù)思考題的取值要求選取數(shù)據(jù),至少 1 組6、實驗總結(jié):回答思考題以及本次實驗的心得九、其它說明實驗七: SQL Server 2005 中的神經(jīng)網(wǎng)絡(luò)應(yīng)用實驗學(xué)時: 2實驗類型: 驗證實驗要求: 必修一、實驗?zāi)康耐ㄟ^本實驗的學(xué)習(xí),使學(xué)生掌握在 SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境下貝葉斯網(wǎng)絡(luò)的 應(yīng)用知識,訓(xùn)練其把教材上的內(nèi)容應(yīng)用到實際中的技能,為今后繼續(xù)貝葉斯網(wǎng)絡(luò)知識的學(xué)習(xí) 奠定基礎(chǔ)。二、實驗內(nèi)容在 SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境

15、下貝葉斯網(wǎng)絡(luò)的應(yīng)用。三、實驗原理、方法和手段先驗概率、后驗概率、條件概率、全概率公式、貝葉斯公示四、實驗組織運行要求根據(jù)本實驗的特點、要求和具體條件,采用“集中授課形式” 。五、實驗條件SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境。六、實驗步驟參照教材數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 P160-P165 的內(nèi)容。七、思考題八、實驗報告實驗學(xué)時: 2實驗類型: 驗證實驗要求: 必修一、實驗?zāi)康耐ㄟ^本實驗的學(xué)習(xí),使學(xué)生掌握在 SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境下神經(jīng)網(wǎng)絡(luò)的應(yīng) 用的知識,訓(xùn)練其把教材上的內(nèi)容應(yīng)用到實際中的技能,為今后繼續(xù)神經(jīng)網(wǎng)絡(luò)知識的學(xué)習(xí)奠 定基礎(chǔ)。二、實驗內(nèi)容在 SQL Ser

16、ver 2005 示例數(shù)據(jù)倉庫環(huán)境下神經(jīng)網(wǎng)絡(luò)的應(yīng)用。三、實驗原理、方法和手段神經(jīng)元模型、 BP 算法。四、實驗組織運行要求根據(jù)本實驗的特點、要求和具體條件,采用“集中授課形式” 。五、實驗條件SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境。六、實驗步驟參照教材數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 P189-P195 的內(nèi)容。七、思考題八、實驗報告1實驗要求:預(yù)習(xí)教材 P189-P195 的內(nèi)容2、實驗?zāi)康?、實驗?nèi)容、實驗原理按本實驗指導(dǎo)的內(nèi)容填寫3、實驗儀器:按實驗計算機的硬件配置參數(shù)填寫4、實驗步驟:按教材 P189-P195 的( 1)-(5)填寫5、實驗數(shù)據(jù):實驗步驟 5 中的具體數(shù)據(jù)6、實驗總結(jié):本次

17、實驗的心得九、其它說明實驗學(xué)時: 2實驗類型: 驗證實驗要求: 必修一、實驗?zāi)康耐ㄟ^本實驗的學(xué)習(xí),使學(xué)生掌握在 SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境下線性回歸的應(yīng) 用的知識,訓(xùn)練其把教材上的內(nèi)容應(yīng)用到實際中的技能,為今后繼續(xù)線性回歸知識的學(xué)習(xí)奠 定基礎(chǔ)。二、實驗內(nèi)容在 SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境下線性回歸的應(yīng)用。三、實驗原理、方法和手段線性回歸的參數(shù)估計、判定系數(shù)、回歸系數(shù)的檢驗。四、實驗組織運行要求根據(jù)本實驗的特點、要求和具體條件,采用“集中授課形式” 。五、實驗條件SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境。六、實驗步驟參照教材數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 P

18、215-P220 的內(nèi)容。七、思考題八、實驗報告實驗學(xué)時: 2 實驗類型: 驗證 實驗要求: 必修一、實驗?zāi)康耐ㄟ^本實驗的學(xué)習(xí), 使學(xué)生掌握在 SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境下 Logistic 回歸的 應(yīng)用知識,訓(xùn)練其把教材上的內(nèi)容應(yīng)用到實際中的技能,為今后繼續(xù) Logistic 回歸知識的學(xué) 習(xí)奠定基礎(chǔ)。二、實驗內(nèi)容在 SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境下 Logistic 回歸的應(yīng)用。三、實驗原理、方法和手段Logistic 回歸的參數(shù)估計。四、實驗組織運行要求根據(jù)本實驗的特點、要求和具體條件,采用“集中授課形式” 。五、實驗條件SQL Server 2005 示例數(shù)據(jù)倉庫環(huán)境。六、實驗步驟參照教材數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 P222-P228 的內(nèi)容。七、思考題實驗報告的基本內(nèi)容及要求每門課程的所有實驗項目的報告必須以課程為單位裝訂成冊,格式參見附件五。1實驗預(yù)習(xí)在實驗前每位同學(xué)都需要對本次

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論