數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)嶒?yàn)指導(dǎo)新版_第1頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)嶒?yàn)指導(dǎo)新版_第2頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)嶒?yàn)指導(dǎo)新版_第3頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)嶒?yàn)指導(dǎo)新版_第4頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)嶒?yàn)指導(dǎo)新版_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)嶒?yàn)指導(dǎo)書一、 課程簡介及基本要求數(shù)據(jù)倉庫與數(shù)據(jù)挖掘是專業(yè)教學(xué)計(jì)劃中一門專業(yè)選修課,是綜合性和實(shí)踐性都很強(qiáng)的課程,它是研究數(shù)據(jù)倉庫技術(shù)與數(shù)據(jù)挖掘技術(shù)的一門重要課程。它著重介紹數(shù)據(jù)倉庫原理、聯(lián)機(jī)分析處理、數(shù)據(jù)倉庫設(shè)計(jì)與開發(fā)、數(shù)據(jù)倉庫的決策支持應(yīng)用、數(shù)據(jù)挖掘原理等基本知識。通過學(xué)習(xí)本課程使學(xué)生初步掌握數(shù)據(jù)倉庫技術(shù)與數(shù)據(jù)挖掘技術(shù)的基礎(chǔ)理論與專業(yè)技術(shù),具備從數(shù)據(jù)資源提取信息與知識并進(jìn)行輔助決策的基本能力。課程主要內(nèi)容有:數(shù)據(jù)倉庫原理、聯(lián)機(jī)分析處理、數(shù)據(jù)倉庫設(shè)計(jì)與開發(fā)、數(shù)據(jù)倉庫的決策支持應(yīng)用、數(shù)據(jù)挖掘原理、信息論的決策樹方法、集合論的粗糙集方法、關(guān)聯(lián)規(guī)則、公式發(fā)現(xiàn)、神經(jīng)網(wǎng)絡(luò)、遺傳算法、

2、文本挖掘與Web挖掘,以及數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的發(fā)展。學(xué)生學(xué)習(xí)本課程之后,應(yīng)達(dá)到下列要求:1了解數(shù)據(jù)管理技術(shù)從數(shù)據(jù)庫到數(shù)據(jù)倉庫的發(fā)展過程。2掌握數(shù)據(jù)倉庫的定義、特點(diǎn)和研究數(shù)據(jù)倉庫的必要性。3掌握數(shù)據(jù)倉庫的體系結(jié)構(gòu)和聯(lián)機(jī)分析處理的概念4掌握數(shù)據(jù)倉庫的數(shù)據(jù)組織、數(shù)據(jù)預(yù)處理與規(guī)劃管理5掌握數(shù)據(jù)倉庫規(guī)劃、設(shè)計(jì)、管理的基本方法6掌握數(shù)據(jù)挖掘的基本概念及與數(shù)據(jù)倉庫的關(guān)系7熟悉聚類分析、分類發(fā)現(xiàn)和關(guān)聯(lián)規(guī)則等數(shù)據(jù)挖掘算法的使用環(huán)境、算法特點(diǎn),并能進(jìn)行算法復(fù)雜性的分析。8認(rèn)識數(shù)據(jù)挖掘的發(fā)展趨勢和應(yīng)用前景9能夠在實(shí)踐中應(yīng)用數(shù)據(jù)倉庫技術(shù)和應(yīng)用數(shù)據(jù)挖掘的方法。二、 課程實(shí)驗(yàn)?zāi)康囊髷?shù)據(jù)倉庫與數(shù)據(jù)挖掘課程上機(jī)練習(xí),是理論

3、教學(xué)之后的深化和補(bǔ)充,具有較強(qiáng)的實(shí)踐性,是本課程的重要環(huán)節(jié)。通過實(shí)驗(yàn)教學(xué)環(huán)節(jié),對學(xué)生進(jìn)行實(shí)踐技能和科學(xué)研究方法的訓(xùn)練,鞏固其在課堂上所學(xué)書本知識,加深對商務(wù)智能的基本概念,基本原理和分析方法的理解,掌握商務(wù)智能的核心基礎(chǔ)技術(shù)與工具,并能運(yùn)用典型的商務(wù)智能工具處理,解決一些實(shí)際問題。同時,通過實(shí)踐教學(xué)活動,拓寬學(xué)生的知識領(lǐng)域,鍛煉學(xué)生的實(shí)踐技能,培養(yǎng)科學(xué)嚴(yán)謹(jǐn)、求真務(wù)實(shí)的工作作風(fēng)。通過實(shí)驗(yàn)教學(xué)應(yīng)達(dá)到以下基本要求:1理解數(shù)據(jù)倉庫的工作機(jī)理及其構(gòu)建過程。2掌握典型的數(shù)據(jù)倉庫系統(tǒng)及其開發(fā)工具的使用。3理解OLAP的工作原理與流程,掌握典型OLAP工具的操作與使用方法。4理解數(shù)據(jù)挖掘的工作原理與流程,掌握

4、典型數(shù)據(jù)挖掘技術(shù)及其工具的使用方法。三、 適用專業(yè) 信息管理與信息系統(tǒng)專業(yè)四、 主要儀器設(shè)備計(jì)算機(jī)局域網(wǎng),在服務(wù)器與客戶端安裝MS SQL Server 系統(tǒng)及其Analysis Services系統(tǒng)。五、考核與報告1學(xué)生按上機(jī)階段要求上交上機(jī)報告。指導(dǎo)教師根據(jù)學(xué)生在上機(jī)過程中的出勤情況、設(shè)計(jì)表現(xiàn)、上機(jī)報告內(nèi)容等方面進(jìn)行綜合評定。2綜合上機(jī)過程中的出勤和獨(dú)立工作能力及表現(xiàn)情況占30%,實(shí)際完成情況占35%,綜合設(shè)計(jì)報告占35%,指導(dǎo)教師給出綜合上機(jī)成績。3上機(jī)成績按比例計(jì)入數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程學(xué)期總成績。實(shí)驗(yàn)一、數(shù)據(jù)倉庫的基本操作1實(shí)驗(yàn)?zāi)康模?1)建立系統(tǒng)數(shù)據(jù)源連接,并應(yīng)用Analysis

5、Server工具建立數(shù)據(jù)倉庫和數(shù)據(jù)源(2)察看、編輯數(shù)據(jù)倉庫的基本模型2實(shí)驗(yàn)步驟:1.1建立系統(tǒng)數(shù)據(jù)源連接數(shù)據(jù)源包含訪問一個對象源數(shù)據(jù)所需的信息。 如何設(shè)置系統(tǒng)數(shù)據(jù)源名稱(DSN)1. Microsoft® Windows NT® 4.0 用戶:單擊“開始”按鈕,指向“設(shè)置”,單擊“控制面板”,然后雙擊“數(shù)據(jù)源 (ODBC)”。 Windows® 2000 用戶:單擊“開始”按鈕,指向“設(shè)置”,單擊“控制面板”,然后雙擊“管理工具”,再雙擊“數(shù)據(jù)源 (ODBC)”。 2. 在“系統(tǒng) DSN”選項(xiàng)卡上單擊“添加”按鈕。 3. 選擇“Microsoft Access

6、驅(qū)動程序 (*.mdb)”,然后單擊“完成”按鈕。 4. 在“數(shù)據(jù)源名”框中,輸入“教程”,然后在“數(shù)據(jù)庫”下,單擊“選擇”。 5. 在“選擇數(shù)據(jù)庫”對話框中,瀏覽到“C:Program FilesMicrosoft Analysis ServicesSamples”,然后單擊“FoodMart 2000.mdb”。單擊“確定”按鈕。 6. 在“ODBC Microsoft Access 安裝”對話框中單擊“確定”按鈕。 7. 在“ODBC 數(shù)據(jù)源管理器”對話框中單擊“確定”按鈕。1.2啟動 Analysis ManagerAnalysis Manager 是一個在 Microsoft

7、4; 管理控制臺 (MMC) 上運(yùn)行的管理單元程序。 如何啟動 Analysis Manager· 單擊“開始”按鈕,依次指向“程序”、“Microsoft SQL Server”和“Analysis Services”,然后單擊“Analysis Manager”。 1.3建立數(shù)據(jù)庫和數(shù)據(jù)源 現(xiàn)在即可以開始使用 Analysis Manager! 如何建立數(shù)據(jù)庫結(jié)構(gòu)1. 在 Analysis Manager 樹視圖中展開“Analysis Servers”。 2. 單擊服務(wù)器名稱,即可建立與 Analysis Servers 的連接。 3. 右擊服務(wù)器名稱,然后單擊“新建數(shù)據(jù)庫”命

8、令。 4. 在“數(shù)據(jù)庫”對話框中的“數(shù)據(jù)庫名稱”框中,輸入“教程”,然后單擊“確定”按鈕。 5. 在 Analysis Manager 樹窗格中展開服務(wù)器,然后展開剛才創(chuàng)建的“教程”數(shù)據(jù)庫。新的“教程”數(shù)據(jù)庫包含下列項(xiàng)目: · 數(shù)據(jù)源 · 多維數(shù)據(jù)集 · 共享維度 · 挖掘模型 · 數(shù)據(jù)庫角色然后,建立到“教程”數(shù)據(jù)源中的示例數(shù)據(jù)的連接。教程中的全部練習(xí)都將使用這個示例。 在 Analysis Manager 中建立一個數(shù)據(jù)源,將數(shù)據(jù)庫連接到在 ODBC 數(shù)據(jù)源管理器中建立的系統(tǒng)數(shù)據(jù)源名稱 (DSN) 上。在建立多維數(shù)據(jù)集的過程中,所有的數(shù)據(jù)都

9、將來自這個源。如何建立數(shù)據(jù)源1. 在 Analysis Manager 樹窗格中,右擊“教程”數(shù)據(jù)庫下的“數(shù)據(jù)源”文件夾,然后單擊“新數(shù)據(jù)源”命令。 2. 在“數(shù)據(jù)鏈接屬性”對話框中,單擊“提供者”選項(xiàng)卡,然后單擊“Microsoft OLE DB Provider for ODBC Drivers”。 3. 單擊“連接”選項(xiàng)卡,然后從“使用數(shù)據(jù)源名稱”列表中單擊“教程”。 4. 單擊“測試連接”以確保一切工作正常。在“Microsoft 數(shù)據(jù)鏈接”對話框中應(yīng)出現(xiàn)一條消息,說明連接成功。在消息框中單擊“確定”按鈕。 5. 單擊“確定”按鈕關(guān)閉“數(shù)據(jù)鏈接屬性”對話框。1.4建立多維數(shù)據(jù)集多維數(shù)據(jù)

10、集是數(shù)據(jù)的一種多維結(jié)構(gòu)。多維數(shù)據(jù)集由維度和度量值的集合進(jìn)行定義。 如何打開多維數(shù)據(jù)集向?qū)?#183; 在 Analysis Manager 樹窗格中,“教程”數(shù)據(jù)庫下,右擊“多維數(shù)據(jù)集”文件夾,單擊“新建多維數(shù)據(jù)集”菜單,然后單擊“向?qū)А泵睢?如何向多維數(shù)據(jù)集添加度量值度量值是要進(jìn)行分析的數(shù)據(jù)庫中的量化值。常用的度量值為銷售、成本和預(yù)算數(shù)據(jù)。度量值根據(jù)多維數(shù)據(jù)集不同的維度類別進(jìn)行分析。 1. 在多維數(shù)據(jù)集向?qū)У摹皻g迎”步驟,單擊“下一步”按鈕。 2. 在“從數(shù)據(jù)源中選擇事實(shí)數(shù)據(jù)表”步驟,展開“教程”數(shù)據(jù)源,然后單擊“sales_fact_1998”。 3. 單擊“瀏覽數(shù)據(jù)”按鈕可以查看“sa

11、les_fact_1998”表中的數(shù)據(jù)。數(shù)據(jù)瀏覽完畢后,關(guān)閉“瀏覽數(shù)據(jù)”窗口,然后單擊“下一步”按鈕。 4. 若要定義多維數(shù)據(jù)集的度量值,在“事實(shí)數(shù)據(jù)表數(shù)據(jù)列”下,雙擊“store_sales”。對“store_cost”和“unit_sales”列重復(fù)此步驟,然后單擊“下一步”按鈕。 如何建立時間維度1. 在向?qū)У摹斑x擇多維數(shù)據(jù)集的維度”步驟,單擊“新建維度”命令。此操作將調(diào)用維度向?qū)А?2. 在“歡迎”步驟,單擊“下一步”按鈕。 3. 在“選擇維度的創(chuàng)建方式”步驟,選擇“星型架構(gòu):單個維度表”選項(xiàng),然后單擊“下一步”按鈕。 4. 在“選擇維度表”步驟,單擊“time_by_day”。單擊“

12、瀏覽數(shù)據(jù)”按鈕可以查看包含在“time_by_day”表中的數(shù)據(jù)。 查看完“time_by_day”表后,單擊“下一步”按鈕。 5. 在“選擇維度類型”步驟,選擇“時間維度”選項(xiàng),然后單擊“下一步”按鈕。 6. 接下來,將定義維度的級別。在“創(chuàng)建時間維度級別”步驟,單擊“選擇時間級別”,單擊“年、季度、月”,然后單擊“下一步”按鈕。 7. 在“選擇高級選項(xiàng)”步驟,單擊“下一步”按鈕。 8. 在向?qū)У淖詈笠徊?,輸入“Time”作為新維度的名稱。注意: 使用“與其它多維數(shù)據(jù)集共享此維度”復(fù)選框,可以指定此維度是共享的,還是專用的。該復(fù)選框位于屏幕的左下角。 保持該復(fù)選框的選中狀態(tài)。7. 單擊“完成

13、”返回到多維數(shù)據(jù)集向?qū)А?8. 在多維數(shù)據(jù)集向?qū)е校F(xiàn)在應(yīng)能在“多維數(shù)據(jù)集維度”列表中看到“Time”維度。 如何建立產(chǎn)品維度1. 再次單擊“新建維度”命令。在“歡迎進(jìn)入維度向?qū)А辈襟E,單擊“下一步”按鈕。 2. 在“選擇創(chuàng)建維度的方式”步驟,選擇“雪花架構(gòu): 多個相關(guān)維度表”選項(xiàng),然后單擊“下一步”按鈕。 3. 在“選擇維度表”步驟,雙擊“Product”和“product_class”將它們添加到“選定的表”。單擊“下一步”按鈕。 4. 在維度向?qū)У摹皠?chuàng)建和編輯聯(lián)接”步驟,顯示在上一步選定的兩個表以及它們之間的聯(lián)接。單擊“下一步”按鈕。 5. 若要定義維度的級別,在“可用的列”下,按順序雙

14、擊“product_category”、“product_subcategory”和“brand_name”。 雙擊每列后,其名稱顯示在“維度級別”下。在選擇了所有三列后,單擊“下一步”按鈕。 6. 在“指定成員鍵列”步驟,單擊“下一步”按鈕。 7. 在“選擇高級選項(xiàng)”步驟,單擊“下一步”按鈕。 8. 在向?qū)У淖詈笠徊?,在“維度名稱”框中,輸入“Product”,并保持“與其它多維數(shù)據(jù)集共享此維度”復(fù)選框?yàn)檫x中狀態(tài)。單擊“完成”按鈕。 9. 現(xiàn)在應(yīng)能在“多維數(shù)據(jù)集維度”列表中看到“Product”維度。如何建立客戶維度1. 單擊“新建維度”命令。 2. 在“歡迎”步驟,單擊“下一步”按鈕。 3

15、. 在“選擇創(chuàng)建維度的方式”步驟,選擇“星型架構(gòu): 單個維度表”選項(xiàng),然后單擊“下一步”按鈕。 4. 在“選擇維度表”步驟,單擊“Customer”,然后單擊“下一步”按鈕。 5. 在“選擇維度類型”步驟,單擊“下一步”按鈕。 6. 若要定義維度的級別,在“可用列”下,按順序雙擊“Country”、“State_Province”、“City”和“l(fā)name”列。 雙擊每一列后,其名稱將顯示在“維度級別”下方。選擇完所有四個列之后,單擊“下一步”按鈕。 7. 在“指定成員鍵列”步驟,單擊“下一步”按鈕。 8. 在“選擇高級選項(xiàng)”步驟,單擊“下一步”按鈕。 9. 在向?qū)У淖詈笠徊?,在“維度名稱”

16、框中,輸入“Customer”。保持“與其它多維數(shù)據(jù)集共享此維度”復(fù)選框的選中狀態(tài)。單擊“完成”按鈕。 10. 在多維數(shù)據(jù)集向?qū)е?,現(xiàn)在應(yīng)能在“多維數(shù)據(jù)集維度”列表中看到“Customer”維度。 如何生成商店維度1. 單擊“新建維度”命令。 2. 在“歡迎”步驟,單擊“下一步”按鈕。 3. 在“選擇創(chuàng)建維度的方式”步驟,選擇“星型架構(gòu): 單個維度表”選項(xiàng),然后單擊“下一步”按鈕。 4. 在“選擇維度表”步驟,單擊“Store”,然后單擊“下一步”按鈕。 5. 在“選擇維度表”步驟,單擊“Store”,然后單擊“下一步”按鈕。 6. 若要定義維度的級別,在“可用列”下,按順序雙擊“store_

17、country”、“store_state”、“store_city”和“store_name”列。 雙擊每一列之后,其名稱將顯示在“維度級別”框下。選擇了所有四個列之后,單擊“下一步”按鈕。 7. 在“指定成員鍵列”步驟,單擊“下一步”按鈕。 8. 在“選擇高級選項(xiàng)”步驟,單擊“下一步”按鈕。 9. 在向?qū)У淖詈笠徊?,在“維度名稱”框中,輸入“Store”,并保持“與其它多維數(shù)據(jù)集共享此維度”復(fù)選框的選中狀態(tài)。單擊“完成”按鈕。 10. 在多維數(shù)據(jù)集向?qū)е?,現(xiàn)在應(yīng)能在“多維數(shù)據(jù)集維度”列表中看到“Store”維度。如何完成多維數(shù)據(jù)集的生成1. 在多維數(shù)據(jù)集向?qū)е?,單擊“下一步”按鈕。 2.

18、在“事實(shí)數(shù)據(jù)表行數(shù)”消息給出提示時,單擊“是”按鈕。   3. 在多維數(shù)據(jù)集向?qū)У淖詈笠徊?,將多維數(shù)據(jù)集命名為“Sales”,然后單擊“完成”按鈕。 4. 向?qū)㈥P(guān)閉并隨之啟動多維數(shù)據(jù)集編輯器,其中包含剛剛創(chuàng)建的多維數(shù)據(jù)集。單擊藍(lán)色或黃色的標(biāo)題欄,對表進(jìn)行排列。 注意: 無須關(guān)閉多維數(shù)據(jù)集編輯器;在本教程的下一節(jié)將編輯該多維數(shù)據(jù)集。如果需要現(xiàn)在退出教程,請?jiān)陉P(guān)閉多維數(shù)據(jù)集之前先保存更改,并在出現(xiàn)其它提示時,一律選擇“否”。 1.5編輯多維數(shù)據(jù)集使用多維數(shù)據(jù)集編輯器可以對現(xiàn)有多維數(shù)據(jù)集進(jìn)行更改。 如何在多維數(shù)據(jù)集編輯器內(nèi)編輯多維數(shù)據(jù)集可以使用以下兩種方法啟用多維數(shù)據(jù)集編輯器: 

19、3; 在 Analysis Manager 樹窗格中右擊一個現(xiàn)有的多維數(shù)據(jù)集,然后單擊“編輯”命令。-或者-· 使用多維數(shù)據(jù)集編輯器直接創(chuàng)建新的多維數(shù)據(jù)集。除非您是高級用戶,否則不建議使用本方法。如果您是從上一節(jié)的操作接著下來的,則應(yīng)該已經(jīng)在多維數(shù)據(jù)集編輯器中。 在多維數(shù)據(jù)集編輯器的“架構(gòu)”窗格中,可以看到事實(shí)數(shù)據(jù)表(黃色標(biāo)題欄)及聯(lián)接的維度表(藍(lán)色標(biāo)題欄)。在多維數(shù)據(jù)集編輯器樹窗格中,可以在層次樹中預(yù)覽多維數(shù)據(jù)集的結(jié)構(gòu)。通過單擊左窗格中底部的“屬性”按鈕,可以編輯多維數(shù)據(jù)集的屬性。 如何向現(xiàn)有多維數(shù)據(jù)集添加維度此時,您可能需要一個新維度以提供有關(guān)產(chǎn)品促銷的數(shù)據(jù)。在多維數(shù)據(jù)集編輯器內(nèi)

20、可以方便地生成該維度。注意:默認(rèn)情況下,在多維數(shù)據(jù)集編輯器中生成的維度為專用維度,即只能用于當(dāng)前所處理的多維數(shù)據(jù)集,而不能與其它多維數(shù)據(jù)集共享。它們不顯示在 Analysis Manager 樹視圖中的“共享維度”文件夾中。當(dāng)通過維度向?qū)?chuàng)建此類維度時,可以使其在多維數(shù)據(jù)集之間共享。 1. 在多維數(shù)據(jù)集編輯器中,在“插入”菜單上單擊“表”命令。 2. 在“選擇表”對話框中,單擊“promotion”表,單擊“添加”按鈕,然后單擊“關(guān)閉”按鈕。 3. 若要定義新的維度,請雙擊“promotion”表中的“promotion_name”列。 4. 在“映射列”對話框中選擇“維度”選項(xiàng),然后單擊“確

21、定”按鈕。 5. 在樹視圖中選擇“Promotion Name”維度。 6. 在“編輯”菜單中單擊“重命名”命令。 7. 鍵入“Promotion”,按 ENTER 鍵。 8. 保存所做的更改。 9. 關(guān)閉多維數(shù)據(jù)集編輯器。當(dāng)系統(tǒng)提示您是否設(shè)計(jì)存儲時,單擊“否”。您將在下節(jié)中設(shè)計(jì)存儲。 1.6設(shè)計(jì)存儲和處理多維數(shù)據(jù)集可以設(shè)計(jì)多維數(shù)據(jù)集中的數(shù)據(jù)和聚合的存儲選項(xiàng)。在使用或?yàn)g覽多維數(shù)據(jù)集中的數(shù)據(jù)之前,必須先進(jìn)行處理。 如何使用存儲設(shè)計(jì)向?qū)гO(shè)計(jì)存儲1. 在 Analysis Manager 樹窗格中,在“教程”數(shù)據(jù)庫下展開“多維數(shù)據(jù)集”文件夾,右擊“Sales”多維數(shù)據(jù)集,然后單擊“編輯”命令。 2.

22、 在“歡迎”步驟中單擊“下一步”按鈕。 3. 選擇“MOLAP”作為數(shù)據(jù)存儲類型,然后單擊“下一步”按鈕。 4. 在“設(shè)置聚合選項(xiàng)”下單擊“性能提升達(dá)到”。在此框中輸入“40”作為指定百分比。 此操作指示 Analysis Services 將性能提升到 40%,而不管需要多大的磁盤空間。管理員可以用此優(yōu)化能力平衡查詢性能需求和存儲聚合數(shù)據(jù)所需磁盤空間大小。5. 單擊“啟動”按鈕。 6. 在 Analysis Services 設(shè)計(jì)聚合時,您可以查看向?qū)в疫叺摹靶阅芘c大小”圖。從中可以看出增加性能提升對使用額外磁盤空間的需求。完成設(shè)計(jì)聚合的進(jìn)程之后,單擊“下一步”按鈕。 7. 在“您希望做什么

23、?”下選擇“立即處理”,然后單擊“完成”按鈕。 注意:處理聚合可能會花費(fèi)一些時間。 8. 在處理時可以在出現(xiàn)的窗口中查看多維數(shù)據(jù)集。處理完成之后將出現(xiàn)一則信息,確認(rèn)處理已成功完成。 9. 單擊“關(guān)閉”按鈕返回 Analysis Manager 樹窗格。1.7瀏覽多維數(shù)據(jù)集數(shù)據(jù)可以開始瀏覽 Sales 多維數(shù)據(jù)集中的數(shù)據(jù)了! 如何使用多維數(shù)據(jù)集瀏覽器查看多維數(shù)據(jù)集數(shù)據(jù)1. 在 Analysis Manager 樹窗格中,右擊“Sales”多維數(shù)據(jù)集,然后單擊“瀏覽數(shù)據(jù)”命令。 2. 出現(xiàn)多維數(shù)據(jù)集瀏覽器,顯示由多維數(shù)據(jù)集的一個維度和度量值組成的網(wǎng)格。其它四個維度顯示在瀏覽器的上方。如何替換網(wǎng)格中

24、的維度1. 要用另一個維度替換網(wǎng)格中的維度,拖動上方框中的維度,然后直接將該維度放在要與其交換的列上。確保在此過程中,指針的形狀為雙端箭頭。 2. 使用這種拖放方法,選擇“Product”維度按鈕并將其拖動到網(wǎng)格上,然后直接放在“Measures”上方?!癙roduct”維度和“Measures”維度在多維數(shù)據(jù)集瀏覽器中將交換位置。 注意: 如果想將維度添加到網(wǎng)格,而不是用另一個維度進(jìn)行替換,則將該維度拖動到網(wǎng)格的中間。如何按時間篩選數(shù)據(jù)1. 單擊“Time”維度旁邊的箭頭。 2. 展開“所有 Time”和“1998”節(jié)點(diǎn),然后單擊“Quarter 1”。將對網(wǎng)格中的數(shù)據(jù)進(jìn)行篩選,使篩選出的數(shù)

25、據(jù)為僅反映該季度情況的數(shù)字。 如何深化1. 使用拖放方法交換“Product”和“Customer”維度。單擊“Product”并將其拖到“Country”維度上。 2. 雙擊網(wǎng)格中包含“Baking Goods”的單元。多維數(shù)據(jù)集展開以包括子類別列。 注意:雙擊已經(jīng)展開的單元可以關(guān)閉子類別列。 用上述方法使維度在網(wǎng)格上來回移動。這有助于了解如何使用 Analysis Manager 將有關(guān)復(fù)雜數(shù)據(jù)關(guān)系的信息信手拈來。 3. 完成后,單擊“關(guān)閉”按鈕關(guān)閉多維數(shù)據(jù)集瀏覽器。實(shí)驗(yàn)二、多維數(shù)據(jù)的組織與分析1實(shí)驗(yàn)?zāi)康模哼\(yùn)用Analysis Server工具進(jìn)行維度,度量值以及多維數(shù)據(jù)集的創(chuàng)建使用維度瀏

26、覽器進(jìn)行多維數(shù)據(jù)的查詢、編輯操作2實(shí)驗(yàn)步驟:2.1建立具有父子維度的多維數(shù)據(jù)集父子維度是由成員的父子關(guān)系定義的成員組織好的層次結(jié)構(gòu)。通常其各個分支并不具有對稱數(shù)量的級別。 對稱層次結(jié)構(gòu): 不對稱層次結(jié)構(gòu): 如何打開 Analysis Manager 維度向?qū)?. 在 Analysis Manager 樹窗格中,在“教程”數(shù)據(jù)庫下,右擊“共享維度”文件夾,單擊“新建維度”菜單,然后單擊“向?qū)А泵睢?如何建立 Employee 維度1. 在“歡迎”步驟,單擊“下一步”按鈕。 2. 在“選擇維度的創(chuàng)建方式”步驟,選擇“父子:單個維度表中相關(guān)的兩列”,然后單擊“下一步”按鈕。 3. 在“選擇維度表”

27、步驟,單擊“employee”,然后單擊“下一步”按鈕。 4. 若要定義子鍵列,在“成員鍵”框旁邊,選擇“employee_id”。若要定義父鍵列,在“父鍵”框旁邊,選擇“supervisor_id”。若要定義“成員名稱”列,在“成員名稱”框旁邊,選擇“full_name”。單擊“下一步”按鈕。 5. 在向?qū)У摹斑x擇高級選項(xiàng)”步驟,單擊“下一步”按鈕。 6. 在最后一步,在“維度名稱”框中,輸入“employee”。單擊“完成”按鈕。 7. 現(xiàn)在進(jìn)入維度編輯器。在“文件”菜單上,單擊“退出”命令關(guān)閉維度編輯器。 8. 現(xiàn)在,在“共享維度”列表中,應(yīng)能看到雇員維度。如何建立 HR 多維數(shù)據(jù)集1.

28、 在 Analysis Manager 樹窗格中,在“教程”數(shù)據(jù)庫下,右擊“多維數(shù)據(jù)集”文件夾,單擊“新建多維數(shù)據(jù)集”菜單,然后單擊“向?qū)А泵睢?2. 按照向?qū)е械牟襟E創(chuàng)建人力資源多維數(shù)據(jù)集,使其具有如下特征: 1. 事實(shí)數(shù)據(jù)表:salary(工資) 2. 度量值:salary_paid、vacation_used 3. 維度:Employee(雇員)、Store(商店)、Time(時間) 4. 是否計(jì)算事實(shí)數(shù)據(jù)表的行數(shù)?是 注意:在該向?qū)е?,將接收到一條消息,說明無法找到兩個聯(lián)接。單擊“確定”按鈕。(將在多維數(shù)據(jù)集編輯器中手動創(chuàng)建這兩個聯(lián)接)。 3. 在該向?qū)У淖詈笠徊?,將多維數(shù)據(jù)集命名為

29、“HR”,然后單擊“完成”按鈕。 4. 出現(xiàn)多維數(shù)據(jù)集編輯器。 若要手動創(chuàng)建聯(lián)接,將“time_by_day”表的“the_date”字段拖動到“salary”表的“pay_date”字段上。 5. 在“store”表的“store_id”字段上單擊,并將其拖動到“employee”表中的“store_id”字段上。 6. 刪除在“salary”表和“employee”表之間自動創(chuàng)建的“department_id”聯(lián)接:單擊該聯(lián)接將其選中,然后按“刪除”按鈕。  7. 完成時,關(guān)閉多維數(shù)據(jù)集編輯器。提示保存多維數(shù)據(jù)集時單擊“是”按鈕,但提示設(shè)計(jì)存儲時單擊“否”按鈕。(將在本教程的高級

30、分析部分處理該多維數(shù)據(jù)集。) 2.2瀏覽維度數(shù)據(jù)Microsoft® SQL Server 2000 Analysis Services 提供了維度瀏覽器,可用來查看和編輯維度結(jié)構(gòu)。 如何瀏覽維度數(shù)據(jù)1. 在 Analysis Manager 樹窗格中,在“教程”數(shù)據(jù)庫下,展開“共享維度”文件夾。 2. 右擊“Employee”維度,然后單擊“瀏覽維度數(shù)據(jù)”命令。 3. 出現(xiàn)維度瀏覽器,在左窗格的樹結(jié)構(gòu)中顯示維度成員。在右窗格中顯示成員屬性和公式。 4. 數(shù)據(jù)瀏覽完畢后,單擊“關(guān)閉”退出維度瀏覽器。2.3創(chuàng)建計(jì)算成員可以將多維數(shù)據(jù)集數(shù)據(jù)、算術(shù)運(yùn)算符、數(shù)字和/或函數(shù)組合起來創(chuàng)建自定義度

31、量值或維度成員,這些度量值和維度成員稱為計(jì)算成員。 如何創(chuàng)建計(jì)算成員1. 在 Analysis Manager 樹窗格中,在“教程”數(shù)據(jù)庫下,右擊“Sales”多維數(shù)據(jù)集,然后單擊“編輯”命令。 2. 即進(jìn)入多維數(shù)據(jù)集編輯器開始編輯 Sales 多維數(shù)據(jù)集。多維數(shù)據(jù)集組件(“維度”、“度量值”、“計(jì)算成員”等)列在多維數(shù)據(jù)集編輯器的左窗格中。 3. 右擊“計(jì)算成員”,然后單擊“新建計(jì)算成員”。 4. 現(xiàn)在進(jìn)入計(jì)算成員生成器中。前三個框用于確定計(jì)算成員的維度的特征:“父維度”(其所屬維度)、“父成員”(其所附加到的父代)和“成員名稱”。 5. 將“父維度”設(shè)置保持為“Measures”不變。此時

32、“父成員”框不可用,因?yàn)槎攘恐稻S度不支持層次結(jié)構(gòu)。在“成員名稱”框中輸入“Average price”。 6. 計(jì)算成員生成器的下半部分提供生成計(jì)算成員表達(dá)式所需的全部組件。在“數(shù)據(jù)”下展開“Measures”維度,然后展開“MeasuresLevel”。出現(xiàn)度量值列表。  7. 從中選擇“Store Sales”,然后將其拖入“值表達(dá)式”框中。 8. 在數(shù)字和運(yùn)算符鍵區(qū),單擊“/”運(yùn)算符。在“值表達(dá)式”框中表達(dá)式的末尾出現(xiàn)運(yùn)算符。 9. 在“數(shù)據(jù)”下選擇“Unit sales”度量值,然后拖至“值表達(dá)式”框中表達(dá)式的末尾。 10. 計(jì)算成員現(xiàn)已完全定義完畢。單擊“確定”按鈕。計(jì)算成

33、員生成器關(guān)閉,回到多維數(shù)據(jù)編輯器中。請注意,新創(chuàng)建的計(jì)算成員在多維數(shù)據(jù)集編輯器的左窗格的“計(jì)算成員”文件夾中已經(jīng)可用。 11. 單擊“保存”圖標(biāo)或單擊“文件”菜單中的“保存”命令以保存所做的更改。  如何查看計(jì)算成員數(shù)據(jù)計(jì)算成員的計(jì)算是在工作中進(jìn)行。即從來不存儲由計(jì)算成員表達(dá)式得出的數(shù)據(jù),每次分析需要計(jì)算成員時才進(jìn)行計(jì)算。 1. 若要查看數(shù)據(jù),請單擊右窗格底部的“數(shù)據(jù)”選項(xiàng)卡。出現(xiàn)數(shù)據(jù),Measures 維度出現(xiàn)在列中,Customer 維度出現(xiàn)在行中。注意共出現(xiàn)以下四列:三個度量值列和一個剛創(chuàng)建的計(jì)算成員列,即 Average Price。 2.  關(guān)閉多維數(shù)據(jù)

34、集編輯器。2.4創(chuàng)建成員屬性成員屬性是維度成員的一個特性。它為最終用戶提供關(guān)于成員的其它信息。 如何創(chuàng)建成員屬性1. 在 Analysis Manager 樹窗格中,展開“共享維度”文件夾。 2. 右擊“Customer”維度,然后單擊“編輯”命令。 3. 在維度編輯器中,展開“Lname”。您將看到該級別的“成員屬性”文件夾。 4. 在“架構(gòu)”窗格中,將“gender”列從“Customer”表拖動到“LName”的“成員屬性”文件夾。   5. 為以下五列重復(fù)上述步驟:“marital_status”、“education”、“yearly_income”、“num_childr

35、en_at_home”和“member_card”。 在“Lname”的“成員屬性”文件夾下應(yīng)看到以下六個成員屬性: “Gender”、“Marital Status”、“Education”、“Yearly Income”、“Num Children At Home”和“Member Card”。 6. 在“文件”菜單上單擊“保存”命令。 7. 關(guān)閉維度編輯器。2.5創(chuàng)建虛擬維度虛擬維度是基于物理維度內(nèi)容的邏輯維度。這些內(nèi)容可以是物理維度中的現(xiàn)有成員屬性,也可以是物理維度的表中的列。 如何創(chuàng)建虛擬維度1. 在 Analysis Manager 樹窗格中右擊“共享維度”文件夾,指向“新建維度”

36、菜單,然后單擊“向?qū)А泵睢?2. 在維度向?qū)У摹皻g迎”步驟中單擊“下一步”按鈕。 3. 選擇“虛擬維度:另一個維度的成員屬性”,然后單擊“下一步”按鈕。 4. 在“選擇帶有成員屬性的維度”步驟中,單擊“Customer”維度,然后單擊“下一步”按鈕。 5. 在“選擇虛擬維度的級別”步驟中,單擊“Lname.Yearly Income”成員屬性,然后單擊添加按鈕“>”。單擊“下一步”按鈕。 6. 在“選擇高級選項(xiàng)”步驟中,確保不選中“選項(xiàng)”框中的任何項(xiàng)目。此時不需要設(shè)置高級選項(xiàng)。單擊“下一步”按鈕。 7. 在“完成維度向?qū)А辈襟E中,在“維度名稱”框中輸入“Yearly Income”。

37、8. 單擊“完成”按鈕。 9. 您現(xiàn)在在維度編輯器中。單擊“文件”菜單中的“退出”命令。 10. 新維度包括在共享維度的列表中。如何向現(xiàn)有多維數(shù)據(jù)集添加虛擬維度1. 在 Analysis Manager 樹視圖中,右擊“多維數(shù)據(jù)集”文件夾中的“Sales”多維數(shù)據(jù)集,然后單擊“編輯”命令。 2. 在多維數(shù)據(jù)集編輯器中右擊左窗格樹中的“維度”。單擊“現(xiàn)有維度”。 3. 在維度管理器中選擇新創(chuàng)建維度“Yearly Income”,將它拖動到“多維數(shù)據(jù)集維度”列表中。單擊“確定”按鈕。 4. 關(guān)閉多維數(shù)據(jù)集編輯器。當(dāng)提示您保存多維數(shù)據(jù)集時單擊“是”。 5. 當(dāng)設(shè)計(jì)存儲窗口向您提示時請單擊“是”。 6

38、. 按照存儲設(shè)計(jì)向?qū)Р襟E操作并選擇以下設(shè)置: 1. 數(shù)據(jù)存儲類型:MOLAP 2. 聚合選項(xiàng):性能提升達(dá)到 20% 3. 最后步驟:處理多維數(shù)據(jù)集 7. 當(dāng)最后一行顯示為:“已成功完成處理”時,單擊“進(jìn)程”對話框中的“關(guān)閉”。 2.6查看多維數(shù)據(jù)集元數(shù)據(jù)和維度元數(shù)據(jù)元數(shù)據(jù)是關(guān)于數(shù)據(jù)屬性和數(shù)據(jù)結(jié)構(gòu)的信息。它也指用以界定對象(如多維數(shù)據(jù)集或維度)設(shè)計(jì)的信息。此信息顯示在 Analysis Manager 右窗格中。 如何查看銷售多維數(shù)據(jù)集的元數(shù)據(jù)1. 在 Analysis Manager 樹窗格中展開“多維數(shù)據(jù)集”文件夾。 2. 選擇“Sales”多維數(shù)據(jù)集。 3. 在 Analysis Mana

39、ger 右窗格中單擊“元數(shù)據(jù)”。 如何查看維度的元數(shù)據(jù)1. 在 Analysis Manager 樹窗格中,展開“共享維度”文件夾。 2. 單擊一個維度。 3. 在 Analysis Manager 右窗格中單擊“元數(shù)據(jù)”。實(shí)驗(yàn)三、基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘1實(shí)驗(yàn)?zāi)康模?1)用決策樹創(chuàng)建 OLAP 挖掘模型 (2)瀏覽 OLAP 數(shù)據(jù)挖掘維度和虛擬多維數(shù)據(jù)集(3)使用聚集功能創(chuàng)建 OLAP 挖掘模型(4)用決策樹創(chuàng)建關(guān)系挖掘模型2實(shí)驗(yàn)步驟:31使用 Microsoft 決策樹創(chuàng)建 OLAP 數(shù)據(jù)挖掘模型數(shù)據(jù)挖掘模型是一種包含運(yùn)行特定數(shù)據(jù)挖掘任務(wù)所需的全部設(shè)置的模型。 如何創(chuàng)建揭示客戶模式的數(shù)據(jù)挖掘

40、模型1. 在 Analysis Manager 樹視圖中,展開“多維數(shù)據(jù)集”文件夾,右擊“Sales”多維數(shù)據(jù)集,然后選擇“新建挖掘模型”命令。 2. 打開挖掘模型向?qū)АT凇斑x擇數(shù)據(jù)挖掘技術(shù)”步驟中的“技術(shù)”框中選擇“Microsoft 決策樹”。單擊“下一步”按鈕。 3. 在“選擇事例”步驟中,在“維度”框中選擇“Customer”。在“級別”框中,確保選擇了“Lname”。單擊“下一步”按鈕。 4. 在“選擇被預(yù)測實(shí)體”步驟中,選擇“事例級別的成員屬性”。然后在“成員屬性”框中選擇“Member Card”。 5. 單擊“下一步”按鈕。 6. 在“選擇訓(xùn)練數(shù)據(jù)”步驟中,滾動到“Custom

41、er”維度,清除“Country”、“State Province”和“City”框(因?yàn)椴恍枰诰奂墑e上而只需要在單獨(dú)的客戶級別上確定客戶模式)。單擊“下一步”按鈕。 7. 在“創(chuàng)建維度和虛擬多維數(shù)據(jù)集(可選)”步驟中,在“維度名稱”框中輸入“Customer Patterns”。然后在“虛擬多維數(shù)據(jù)集名稱”框中輸入“Trained Cube”。單擊“下一步”按鈕。 8. 在最后的步驟中,在“模型名稱”字段中鍵入“Customer patterns discovery”。確保選擇了“保存并開始處理”。單擊“完成”按鈕。 注意:處理數(shù)據(jù)挖掘模型可能會花費(fèi)一些時間。 9. 出現(xiàn)一個窗口,顯示模

42、型正在處理之中。處理完成之后,出現(xiàn)一則消息,說明“已成功完成處理”,然后單擊“關(guān)閉”按鈕。 如何讀取客戶決策樹1. 現(xiàn)在已在 OLAP 挖掘模型編輯器中??梢允褂镁庉嬈骶庉嬆P蛯傩曰蛘邽g覽其結(jié)果。最大化 OLAP 挖掘模型編輯器。 2. 決策樹顯示于右窗格中。其中包括四個窗格。中間的“內(nèi)容詳情”窗格 (1) 顯示焦點(diǎn)所在的決策樹的部分?!皟?nèi)容選擇區(qū)”窗格 (2) 顯示樹的完整視圖。該窗格使您可以將焦點(diǎn)設(shè)置到樹的其它部分。其它的兩個窗格分別是“特性”窗格 (3)(特性信息可以用“合計(jì)”選項(xiàng)卡以數(shù)值方式查看或者用“直方圖”選項(xiàng)卡以圖形方式查看)和與焦點(diǎn)所在節(jié)點(diǎn)相關(guān)聯(lián)的“節(jié)點(diǎn)路徑”區(qū)域 (4)。 3

43、. 在“內(nèi)容詳情”窗格的決策樹區(qū)域中,顏色代表“事例”的密度(在本事例中為:客戶的密度)。顏色越深則節(jié)點(diǎn)中包含的事例就越多。 單擊“全部”節(jié)點(diǎn)。該節(jié)點(diǎn)為黑色,因?yàn)樗?(7632) 事例的 100%。7632 代表 1998 年活動的客戶數(shù)目(即 Sales 多維數(shù)據(jù)集中有事務(wù)記錄的客戶)。這個數(shù)字也說明在 1998 年并非所有的客戶都是活動的,因?yàn)槲覀儚摹癈ustomer”維度的“Lname”級別中所包含的 9991 個客戶中只得到 7632 個事例。 4. 特性窗格顯示“全部”節(jié)點(diǎn)中,所有事例的 55.83%(或者說 4263 個示例)可能選擇銅卡 (Bronze);11.50% 可能選

44、擇金卡 (Golden);23.32% 可能選擇普通卡 (Normal);9.34% 可能選擇銀卡 (Silver)。如果沒有顯示百分比,則可以調(diào)整“特性”窗格中“合計(jì)”面板的“可能性”列的大小。 5. 如果選擇了樹的不同節(jié)點(diǎn),此百分比將會更改。讓我們調(diào)查一下哪些客戶可能選擇金卡。若要執(zhí)行此操作,則需要重新畫出樹以便勾畫出金卡的高密度區(qū)。在右下角的“樹顏色基于”字段中選擇“Golden”。該樹顯示另一種顏色模式??梢钥闯觥癈ustomer.Lname.Yearly Income = $150K+”節(jié)點(diǎn)的密度高于其它任何節(jié)點(diǎn)。 6. 樹的第一個級別由“yearly income”屬性決定。樹的組

45、織由算法決定,其基礎(chǔ)是該屬性在輸出中的重要性。這意味著“yearly income”屬性是最重要的因素,它將決定客戶可能選擇的會員卡的類型。選擇“Customer.Lname.Yearly Income = $150K+”節(jié)點(diǎn)。該特性窗格顯示收入較多的客戶中,45.09% 的客戶可能會選擇金卡。這個百分比要比“全部”節(jié)點(diǎn)中的 (11.50%) 高得多。當(dāng)繼續(xù)在樹中做進(jìn)一步調(diào)查時,讓我們調(diào)查一下這些百分比是如何演化的。 7. 雙擊“Customer.Lname.Yearly Income =  $150K+”節(jié)點(diǎn)。 該樹現(xiàn)在只顯示“Customer.Lname.Yearly Incom

46、e =  $150K+”節(jié)點(diǎn)下的子樹。 選擇“Customer.Lname.Marital Status =  M”節(jié)點(diǎn)。在“節(jié)點(diǎn)路徑”窗格中,可以看到包含于該節(jié)點(diǎn)的客戶的完整的特征定義:收入高于 150000 美元且已婚的客戶。該“特性”窗格現(xiàn)在顯示:與上一級別 (45.09%) 相比,較高百分比 (81.05%) 的客戶可能會選擇金卡。 8. 我們再返回到頂層,進(jìn)行一種與此不同的調(diào)查,即調(diào)查可能選擇普通卡的客戶。若要返回頂層節(jié)點(diǎn),可以單擊從“Customer.Lname.Yearly Income =  $150K+”節(jié)點(diǎn)左面伸出來的線(方法 1)或者使用“內(nèi)

47、容選擇區(qū)”回到樹的頂部(方法 2)。 9. 在“樹顏色基于”字段中選擇“Normal”。樹刷新節(jié)點(diǎn)的顏色之后,可以看到“Customer.Lname.Yearly Income = $150K+”節(jié)點(diǎn)的顏色非常淺;這意味著這些客戶選擇普通卡的可能性非常小。另一方面,可以看到“Customer.Lname.Yearly Income = $10K $30K”節(jié)點(diǎn)的顏色非常深。這意味著這些客戶選擇普通卡的可能性非常高?!疤匦浴贝案耧@示在此年收入范圍內(nèi)的客戶中,91.92% 的客戶可能會選擇普通卡。樹還顯示已無法對此節(jié)點(diǎn)進(jìn)行進(jìn)一步調(diào)查。這意味著在樹的這個分支中,年收入是決定客戶選擇普通卡的可能性的唯

48、一因素。 10. 可以查看樹的其它分支并調(diào)查客戶選擇一種卡而不選擇另一種卡的可能性。市場部可以使用此信息來確定最可能選擇某種類型卡的客戶的特征。根據(jù)這些特征(收入、子女?dāng)?shù)、婚姻狀況等等),可以重新定義會員卡服務(wù)和方案以便更好地適應(yīng)其客戶。 11. 完成對決策樹的分析之后,請關(guān)閉 OLAP 挖掘模型編輯器。 32瀏覽 OLAP 數(shù)據(jù)挖掘維度和虛擬多維數(shù)據(jù)集數(shù)據(jù)挖掘維度和虛擬多維數(shù)據(jù)集是兩個彼此關(guān)聯(lián)的對象,在使用 Microsoft 決策樹算法建立 OLAP 數(shù)據(jù)挖掘模型時得以創(chuàng)建。 如何瀏覽數(shù)據(jù)挖掘虛擬維度1. 在 Analysis Manager 樹視圖中,展開“共享維度”文件夾,右擊“Cus

49、tomer patterns”維度,然后單擊“瀏覽維度數(shù)據(jù)”命令。 2. 維度瀏覽器打開。展開“全部”成員維度。 3. 選擇“Customer.Lname.Yearly Income = $150K+”成員。在“自定義成員公式”窗格中,出現(xiàn)定義該節(jié)點(diǎn)的 MDX 公式。 4. 可以繼續(xù)展開維度并考察該節(jié)點(diǎn)的屬性。完成時,單擊“關(guān)閉”按鈕。如何瀏覽數(shù)據(jù)挖掘虛擬多維數(shù)據(jù)集1. 在 Analysis Manager 樹窗格中,展開“多維數(shù)據(jù)集”文件夾,右擊“Trained Cube”多維數(shù)據(jù)集,然后選擇“瀏覽數(shù)據(jù)”命令。 2. 多維數(shù)據(jù)集瀏覽器打開。最大化該多維數(shù)據(jù)集瀏覽器。 3. 將“Custome

50、r Patterns”維度拖動到“MeasuresLevel”框,以便用“Customer Patterns”維度替換“Measures”維度。 4. 按下列順序雙擊,展開“Customer”維度:“USA”->“WA”->“Redmond”。顯示 Redmond 地區(qū)的所有客戶。 5. 雙擊“級別 01”展開“Customer”維度。顯示“Customer Patterns”維度的第一個級別。 6. 關(guān)閉多維數(shù)據(jù)集瀏覽器。 3.3使用 Microsoft 聚集創(chuàng)建 OLAP 數(shù)據(jù)挖掘模型數(shù)據(jù)挖掘模型是包含運(yùn)行特定數(shù)據(jù)挖掘任務(wù)所需全部設(shè)置的模型。 如何創(chuàng)建將客戶群劃分為邏輯段的數(shù)據(jù)

51、挖掘模型 1. 在 Analysis Manager 樹窗格中展開“多維數(shù)據(jù)集”文件夾,右擊“Sales”多維數(shù)據(jù)集,然后單擊“新建挖掘模型”命令。 2. 在挖掘模型向?qū)У摹斑x擇數(shù)據(jù)挖掘技術(shù)”步驟中,在“技術(shù)”框中單擊“Microsoft 聚集”。單擊“下一步”按鈕。 3. 在“選擇事例”步驟中的“維度”框中,選擇“Customer”。在“級別”框中,確保已經(jīng)選擇了“Lname”。 單擊“下一步”按鈕。 4. 在“選擇訓(xùn)練數(shù)據(jù)”步聚中,在“Customer”維度中清除“Country”、“State Province”和“City”復(fù)選框,因?yàn)闆]有必要使用匯總級別劃分客戶群。然后,在“Meas

52、ures”維度中只選擇“Store Sales”。單擊“下一步”按鈕。 5. 在最后一個步驟中,在“模型名稱”框中輸入“Customer segmentation”。選擇“保存,但現(xiàn)在不處理”。單擊“完成”按鈕。 6. 當(dāng)前在 OLAP 挖掘模型編輯器中??梢允褂么司庉嬈骶庉嬆P蛯傩曰?yàn)g覽其結(jié)果。 7. 在編輯器的左窗格的屬性窗格中,在“Cluster Count”框中,用“3”代替“10”。 8. 保存所做更改。 9. 單擊“工具”菜單上的“處理挖掘模型”命令。 注意: 處理數(shù)據(jù)挖掘模型可能會花費(fèi)一些時間。10. 出現(xiàn)“處理”窗口,顯示正在處理模型。處理完成之后出現(xiàn)一則消息,說明“已成功完成

53、處理”。單擊“關(guān)閉”按鈕。如何讀取包含在各個聚集(客戶段)中的信息1. 現(xiàn)在已回到 OLAP 挖掘模型編輯器。分段樹顯示于右窗格中。右窗格由四個窗格組成:中間的“內(nèi)容詳情”窗格 (1) 顯示焦點(diǎn)所在的分段樹的部分。“內(nèi)容選擇區(qū)”窗格 (2) 顯示樹的完整視圖。該窗格使您可以將焦點(diǎn)設(shè)置到樹的其它部分。其它的兩個窗格分別是“特性”窗格 (3)(特性信息可以用“合計(jì)”選項(xiàng)卡以數(shù)值方式查看或者用“直方圖”選項(xiàng)卡以圖形方式查看)和與焦點(diǎn)所在節(jié)點(diǎn)相關(guān)聯(lián)的“節(jié)點(diǎn)路徑”區(qū)域 (4)。   2. 在“內(nèi)容詳情”窗格中,在分段樹區(qū)域中,顏色代表事例的密度(在此事例中為客戶的密度)。顏色越深則節(jié)點(diǎn)中包含的

54、事例就越多。單擊“全部”節(jié)點(diǎn)。該節(jié)點(diǎn)為黑色,因?yàn)樗?100% 的事例(客戶)。 3. 單擊“Cluster 1”。特性窗格顯示一個下拉列表和一個網(wǎng)格。下拉列表可用于選擇特定的客戶人口統(tǒng)計(jì)特征。網(wǎng)格顯示以人口統(tǒng)計(jì)特征的各個值為基礎(chǔ)對聚集中客戶的重新分區(qū)。 4. 對于“Cluster 1”,請選擇“節(jié)點(diǎn)特性集”框中的“Customer.Lname.Marital Status”,然后轉(zhuǎn)到“特性”網(wǎng)格。網(wǎng)格顯示“Cluster 1”包括 2878 個事例,對于“婚姻狀況”特征,事例分布如下:21.12% 的客戶已婚,其余 78.88% 單身。 5. 讓我們從另一個角度查看這些相同的 2878 個

55、事例。在“節(jié)點(diǎn)特性集”框中,選擇“Customer.Lname.Yearly Income”。網(wǎng)格中的分布顯示 0% 的客戶收入在 10000-30000 美元范圍之內(nèi);41.62% 的客戶收入在 30000-50000 美元范圍之內(nèi);24.01% 的客戶收入在 50000-70000 美元范圍之內(nèi)。結(jié)果顯示該聚集的 65% 以上的客戶在中等收入(年收入為 30000-70000 美元)范圍之內(nèi)。 6. 現(xiàn)在可以知道“Cluster 1”主要由中等收入的客戶構(gòu)成而且主要由單身客戶構(gòu)成。在列表中選擇“Customer.Lname.Num Children At Home”。結(jié)果顯示該聚集中平均在

56、家子女?dāng)?shù)為零。此項(xiàng)選擇顯示一個平均數(shù)而不是重新分區(qū),因?yàn)樵磾?shù)據(jù)庫的“Num of Children at Home”字段中包含連續(xù)的值。當(dāng)算法發(fā)現(xiàn)源數(shù)據(jù)中包含不連續(xù)的值,它將顯示包含這些值的重新分區(qū)。 當(dāng)算法發(fā)現(xiàn)源數(shù)據(jù)中包含連續(xù)的值(即非預(yù)定義數(shù)字),它將計(jì)算并顯示平均值。 7. 在“節(jié)點(diǎn)特性集”框中,選擇“Measures.Stores Sales”。網(wǎng)格顯示在“Cluster 1”中對每個客戶的平均銷售額為 72.42 美元。 8. 市場部現(xiàn)在了解到“Cluster 1”主要由中等收入的客戶構(gòu)成,而且完全是由單身客戶構(gòu)成,這些客戶家中沒有子女,每年在 FoodMart 商店平均花費(fèi) 72.

57、42 美元。根據(jù)這種情況,市場部可以確定在周刊中插入哪種贈券了。您也可以在樹中瀏覽以確定在“Cluster 2”和“Cluster 3”中所包含客戶特征。 9. 瀏覽完其它聚集后,請關(guān)閉 OLAP 挖掘模型編輯器。3.4使用 Microsoft 決策樹創(chuàng)建關(guān)系數(shù)據(jù)挖掘模型數(shù)據(jù)挖掘模型是一種包含運(yùn)行特定數(shù)據(jù)挖掘任務(wù)所需的全部設(shè)置的模型。 如何創(chuàng)建揭示客戶模式的數(shù)據(jù)挖掘模型1. 在 Analysis Manager 樹窗格中右擊“挖掘模型”文件夾,然后單擊“新建挖掘模型”命令。 2. 打開挖掘模型向?qū)АT凇皻g迎使用挖掘模型向?qū)А辈襟E中,單擊“下一步”按鈕。 3. 在“選擇源類型”步驟中,單擊“關(guān)系數(shù)據(jù)”。單擊“下一步”按鈕。 4. 在“選擇事例表”步驟中,單擊“單個表包含數(shù)據(jù)”。在“可用的表”框中選擇“Customer”。單擊“下一步”按鈕。 5. 在“選擇數(shù)據(jù)挖掘技術(shù)”步驟中,在“技術(shù)”框中選擇“Microsoft 決策樹”。單擊“下一步”按鈕。 6. 在“選擇鍵列”步驟中,在“事例鍵列”框中單擊“customer_id”。然后單擊“下一步”按鈕。 7. 在“選擇輸入與可預(yù)測列”步驟中,選擇以下列,然后用“>”按鈕依次移動到“可預(yù)測列”框中:“marital_status”、“year

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論