新版數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告_第1頁
新版數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告_第2頁
新版數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告_第3頁
新版數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告_第4頁
新版數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)挖掘概念與分析試驗(yàn)匯報(bào)編制日期:11月27日目錄一、相關(guān)名詞解釋 31.1數(shù)據(jù)倉庫 31.2數(shù)據(jù)挖掘 31.3決議樹 31.4時(shí)序 31.5關(guān)聯(lián)規(guī)則 4二、試驗(yàn)環(huán)境 4三、試驗(yàn)準(zhǔn)備 5四、試驗(yàn)內(nèi)容 5五、試驗(yàn)步驟 55.1對(duì)數(shù)據(jù)挖掘相關(guān)名詞進(jìn)行了解和利用 55.2對(duì)此次試驗(yàn)數(shù)據(jù)庫環(huán)境進(jìn)行熟悉環(huán)境 55.3準(zhǔn)備工作 55.3.1創(chuàng)建一個(gè)AnalysisServices項(xiàng)目 55.3.2創(chuàng)建一個(gè)數(shù)據(jù)源 65.3.3創(chuàng)建數(shù)據(jù)源視圖 85.4挖掘步驟 105.4.1Microsoft決議樹挖掘技術(shù)—?jiǎng)?chuàng)建用于目標(biāo)郵件方案挖掘結(jié)構(gòu) 105.4.2Microsoft時(shí)序挖掘技術(shù)—各個(gè)型號(hào)自行車銷售量做出預(yù)測(cè) 145.4.3Microsoft關(guān)聯(lián)規(guī)則挖掘技術(shù)—?jiǎng)?chuàng)建市場(chǎng)籃方案 155.4.4Microsoft時(shí)序分析與聚類分析挖掘技術(shù)—查看客戶瀏覽AdventureWorks網(wǎng)站方式 175.5數(shù)據(jù)挖掘結(jié)果分析 195.5.1Microsoft決議樹挖掘技術(shù)—目標(biāo)郵件方案挖掘結(jié)果分析 195.5.2Microsoft時(shí)序挖掘技術(shù)—各個(gè)型號(hào)自行車銷售量預(yù)測(cè)結(jié)果分析 205.5.3Microsoft關(guān)聯(lián)規(guī)則挖掘技術(shù)—?jiǎng)?chuàng)建市場(chǎng)籃方案結(jié)果分析 215.5.4Microsoft時(shí)序分析與聚類分析挖掘技術(shù)—查看客戶瀏覽AdventureWorks網(wǎng)站方式結(jié)果分析 22一、相關(guān)名詞解釋1.1數(shù)據(jù)倉庫a)英文名稱為DataWarehouse,可簡(jiǎn)寫為DW。數(shù)據(jù)倉庫是決議支持系統(tǒng)和聯(lián)機(jī)分析應(yīng)用數(shù)據(jù)源結(jié)構(gòu)化數(shù)據(jù)環(huán)境。數(shù)據(jù)倉庫研究和處理從數(shù)據(jù)庫中獲取信息問題。數(shù)據(jù)倉庫特征在于面向主題、集成性、穩(wěn)定性和時(shí)變性。b)數(shù)據(jù)倉庫系統(tǒng)是一個(gè)信息提供平臺(tái),他從業(yè)務(wù)處理系統(tǒng)取得數(shù)據(jù),主要以星型模型和雪花模型進(jìn)行數(shù)據(jù)組織,并為用戶提供各種伎倆從數(shù)據(jù)中獲取信息和知識(shí)。c)從功效結(jié)構(gòu)化分,數(shù)據(jù)倉庫系統(tǒng)最少應(yīng)該包含數(shù)據(jù)獲?。―ataAcquisition)、數(shù)據(jù)存放(DataStorage)、數(shù)據(jù)訪問(DataAccess)三個(gè)關(guān)鍵部分。1.2數(shù)據(jù)挖掘a)數(shù)據(jù)挖掘(DataMining),就是從大量數(shù)據(jù)中獲取有效、新奇、潛在有用、最終可了解模式非平凡過程。數(shù)據(jù)挖掘廣義觀點(diǎn):數(shù)據(jù)挖掘就是從存放在數(shù)據(jù)庫,數(shù)據(jù)倉庫或其余信息庫中大量數(shù)據(jù)中“挖掘”有趣知識(shí)過程。數(shù)據(jù)挖掘,又稱為數(shù)據(jù)庫中知識(shí)發(fā)覺(KnowledgeDiscoveryinDatabase,KDD),也有些人把數(shù)據(jù)挖掘視為數(shù)據(jù)庫中知識(shí)發(fā)覺過程一個(gè)基本步驟。知識(shí)發(fā)覺過程以下步驟組成:(1)數(shù)據(jù)清理,(2)數(shù)據(jù)集成,(3)數(shù)據(jù)選擇,(4)數(shù)據(jù)變換,(5)數(shù)據(jù)挖掘,(6)模式評(píng)定,(7)知識(shí)表示。數(shù)據(jù)挖掘能夠與用戶或知識(shí)庫交互。1.3決議樹a)決議樹是用二叉樹形圖來表示處理邏輯一個(gè)工具。能夠直觀、清楚地表示加工邏輯要求。尤其適合于判斷原因比較少、邏輯組合關(guān)系不復(fù)雜情況。b)決議樹提供了一個(gè)展示類似在什么條件下會(huì)得到什么值這類規(guī)則方法。比如,在貸款申請(qǐng)中,要對(duì)申請(qǐng)風(fēng)險(xiǎn)大小做出判斷,決議樹基本組成部分:決議節(jié)點(diǎn)、分支和葉子。c)數(shù)據(jù)挖掘中決議樹是一個(gè)經(jīng)常要用到技術(shù),能夠用于分析數(shù)據(jù),一樣也能夠用來做預(yù)測(cè)(就像上面銀行官員用他來預(yù)測(cè)貸款風(fēng)險(xiǎn))。慣用算法有CHAID、CART、Quest和C5.0。1.4時(shí)序a)Microsoft時(shí)序算法是MicrosoftSQLServerAnalysisServices(SSAS)提供回歸算法,用于創(chuàng)建數(shù)據(jù)挖掘模型以預(yù)測(cè)連續(xù)列,如預(yù)測(cè)方案中產(chǎn)品銷售額。其余Microsoft算法創(chuàng)建依靠給定輸入列來預(yù)測(cè)可預(yù)測(cè)列模型(如決議樹模型),而時(shí)序模型預(yù)測(cè)則僅依照算法在創(chuàng)建模型時(shí)從原始數(shù)據(jù)集派生趨勢(shì)。以下關(guān)系圖(圖1.1)顯示了一個(gè)經(jīng)典模型,用于預(yù)測(cè)各個(gè)時(shí)間銷售額。圖1.1關(guān)系圖關(guān)系圖中顯示該模型由兩部分組成:歷史信息以紅色顯示,預(yù)測(cè)信息以藍(lán)色顯示。紅色數(shù)據(jù)代表算法用于創(chuàng)建模型信息,而藍(lán)色數(shù)據(jù)則代表模型做出預(yù)測(cè)。由紅色數(shù)據(jù)和藍(lán)色數(shù)據(jù)聯(lián)合形成線稱為“序列”。每個(gè)預(yù)測(cè)模型必須包含一個(gè)事例序列,即區(qū)分序列列中不一樣點(diǎn)列。比如,因?yàn)殛P(guān)系圖中數(shù)據(jù)顯示了幾個(gè)月中歷史和預(yù)測(cè)銷售額序列,所以數(shù)據(jù)列為事例序列。b)Microsoft時(shí)序算法一個(gè)主要功效就是能夠執(zhí)行交叉預(yù)測(cè)。也就是說,假如使用兩個(gè)單獨(dú)但相關(guān)序列為該算法定型,就能夠使用得到模型依照其余序列行為預(yù)測(cè)一個(gè)序列結(jié)果。比如,一個(gè)產(chǎn)品實(shí)際銷售額可能會(huì)影響另一個(gè)產(chǎn)品預(yù)測(cè)銷售額。1.5關(guān)聯(lián)規(guī)則a)數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在一類主要可被發(fā)覺知識(shí)。若兩個(gè)或多個(gè)變量取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián)。關(guān)聯(lián)可分為簡(jiǎn)單關(guān)聯(lián)、時(shí)序關(guān)聯(lián)、因果關(guān)聯(lián)。關(guān)聯(lián)分析目標(biāo)是找出數(shù)據(jù)庫中隱藏關(guān)聯(lián)網(wǎng)。有時(shí)并不知道數(shù)據(jù)庫中數(shù)據(jù)關(guān)聯(lián)函數(shù),即使知道也是不確定,所以關(guān)聯(lián)分析生成規(guī)則帶有可信度。關(guān)聯(lián)規(guī)則挖掘發(fā)覺大量數(shù)據(jù)中項(xiàng)集之間有趣關(guān)聯(lián)或相關(guān)聯(lián)絡(luò)。關(guān)聯(lián)規(guī)則挖掘在數(shù)據(jù)挖掘中是一個(gè)主要課題,最近幾年已被業(yè)界所廣泛研究。b)關(guān)聯(lián)規(guī)則挖掘過程主要包含兩個(gè)階段:第一階段必須先從資料集合中找出全部高頻項(xiàng)目組(FrequentItemsets),第二階段再由這些高頻項(xiàng)目組中產(chǎn)生關(guān)聯(lián)規(guī)則(AssociationRules)。1.Apriori算法:使用候選項(xiàng)集找頻繁項(xiàng)集2.基于劃分算法3.FP-樹頻集算法1.6時(shí)序分析與聚類分析a)Microsoft次序分析和聚類分析算法是由MicrosoftSQLServerAnalysisServices(SSAS)提供一個(gè)次序分析算法。該算法經(jīng)過將相同次序分到一組或一類中來查找最常見次序。這些次序能夠采取多個(gè)格式,包含:1.用來說明用戶瀏覽網(wǎng)站時(shí)點(diǎn)擊路徑數(shù)據(jù)。2.用來說明客戶將商品添加到在線零售商購物車中次序數(shù)據(jù)。二、試驗(yàn)環(huán)境此次數(shù)據(jù)挖掘試驗(yàn)采取SQLserverdevelopment版本;數(shù)據(jù)倉庫示例為SQLserver自帶AdventureWorksDB和AdventureWorksDW;三、試驗(yàn)準(zhǔn)備創(chuàng)建一個(gè)AnalysisServices項(xiàng)目;創(chuàng)建一個(gè)數(shù)據(jù)源;創(chuàng)建數(shù)據(jù)源視圖;四、試驗(yàn)內(nèi)容Microsoft決議樹挖掘技術(shù);Microsoft時(shí)序挖掘技術(shù);Microsoft關(guān)聯(lián)規(guī)則挖掘技術(shù);Microsoft時(shí)序分析與聚類分析挖掘技術(shù);五、試驗(yàn)步驟5.1對(duì)數(shù)據(jù)挖掘相關(guān)名詞進(jìn)行了解和利用5.2對(duì)此次試驗(yàn)數(shù)據(jù)庫環(huán)境進(jìn)行熟悉環(huán)境注意是在安裝SQLserver過程中得把整個(gè)數(shù)據(jù)庫示例全部安裝;5.3準(zhǔn)備工作5.3.1創(chuàng)建一個(gè)AnalysisServices項(xiàng)目.打開MicrosoftSQLServerManagementStudio,連接好數(shù)據(jù)庫,確認(rèn)是否有AdventureWorks與AdventureWorksDW兩個(gè)數(shù)據(jù)庫,以下列圖所表示:.打開MicrosoftVisualStudio,點(diǎn)擊文件—新建項(xiàng)目—AnalysisServices項(xiàng)目,然后將項(xiàng)目名稱改為AdventureWorks,以下列圖:.點(diǎn)擊確定即完成了AnalysisServices項(xiàng)目標(biāo)創(chuàng)建。 5.3.2創(chuàng)建一個(gè)數(shù)據(jù)源.在處理方案資源管理器中,右鍵單擊“數(shù)據(jù)源”文件夾,然后選擇“新建數(shù)據(jù)源”。系統(tǒng)將打開數(shù)據(jù)源向?qū)?。在“歡迎使用數(shù)據(jù)源向?qū)А表撁嬷?,單擊“下一步”按鈕。.單擊“新建”按鈕向AdventureWorks數(shù)據(jù)庫添加連接。.(1)在“連接管理器”“提供程序”列表中,選擇“本機(jī)OLEDB\MicrosoftOLEDBProviderforSQLServer”;(2)數(shù)據(jù)庫服務(wù)器名為當(dāng)?shù)胤?wù)器也可填localhost;(3)使用SQLserver身份驗(yàn)證;(4)在選擇或輸入一個(gè)數(shù)據(jù)庫名欄中選擇AdventureWorksDW數(shù)據(jù)庫;(5)點(diǎn)擊測(cè)試按鈕,顯示測(cè)試成功之后點(diǎn)擊下一步繼續(xù)。.在“模擬信息”頁中,選擇“默認(rèn)值”,再單擊“下一步”。.在“完成向?qū)А表撁嬷?,?shù)據(jù)源默認(rèn)名稱為AdventureWorksDW。.單擊“完成”。新數(shù)據(jù)源AdventureWorksDW將顯示在處理方案資源管理器“數(shù)據(jù)源”文件夾中。5.3.3創(chuàng)建數(shù)據(jù)源視圖.在處理方案資源管理器中,右鍵單擊“數(shù)據(jù)源視圖”,選擇“新建數(shù)據(jù)源視圖”,在“歡迎使用數(shù)據(jù)源視圖向?qū)А表撋?,單擊“下一步”?在“選擇數(shù)據(jù)源”頁“關(guān)系數(shù)據(jù)源”下,系統(tǒng)將默認(rèn)選中您在上一個(gè)任務(wù)中創(chuàng)建AdventureWorksDW數(shù)據(jù)源。單擊“下一步”。在“選擇表和視圖”頁上,選擇以下各表,然后單擊右箭頭鍵,將這些表包含在新數(shù)據(jù)源視圖中:(1)dbo.ProspectiveBuyer(2)dbo.vAssocSeqLineItems(3)dbo.vAssocSeqOrders(4)dbo.vTargetMail(5)dbo.vTimeSeries.在“完成向?qū)А表撋?,默認(rèn)情況下,系統(tǒng)將數(shù)據(jù)源視圖命名為AdventureWorksDW。單擊“完成”。系統(tǒng)將打開數(shù)據(jù)源視圖設(shè)計(jì)器,顯示AdventureWorksDW數(shù)據(jù)源視圖。點(diǎn)擊完成按鈕出現(xiàn)以下所表示AdventureWorksDW數(shù)據(jù)源視圖。5.4挖掘步驟5.4.1Microsoft決議樹挖掘技術(shù)—?jiǎng)?chuàng)建用于目標(biāo)郵件方案挖掘結(jié)構(gòu).在處理方案資源管理器中,右鍵單擊“挖掘結(jié)構(gòu)”并選擇“新建挖掘結(jié)構(gòu)”。在“歡迎使用數(shù)據(jù)挖掘向?qū)А表撋?,單擊“下一步”?在“選擇定義方法”頁上,確認(rèn)已選中“從現(xiàn)關(guān)于系數(shù)據(jù)庫或數(shù)據(jù)倉庫”,再單擊“下一步”。在“選擇數(shù)據(jù)挖掘技術(shù)”頁“您要使用何種數(shù)據(jù)挖掘技術(shù)?”下,選擇“Microsoft決議樹”。.在“選擇數(shù)據(jù)源視圖”頁上,請(qǐng)注意已默認(rèn)選中AdventureWorksDW。在數(shù)據(jù)源視圖中,單擊“瀏覽”查看各表,然后單擊“關(guān)閉”返回該向?qū)А?在“指定表類型”頁上,選中vTargetMail表旁邊“事例”列中復(fù)選框,再單擊“下一步”。(1)在“指定定型數(shù)據(jù)”頁上,確保已選中CustomerKey列旁邊Key列中復(fù)選框。(2)選中BikeBuyer列旁邊“輸入”和“可預(yù)測(cè)”。(3)選中以下各列旁邊“輸入”復(fù)選框:Age、CommuteDistance、EnglishEducation、EnglishOccupation、FirstName、Gender、GeographyKey、HouseOwnerFlag、LastName、MaritalStatus、NumberCarsOwned、NumberChildrenAtHome、Region、TotalChildren、YearlyIncome。(1)在“完成向?qū)А表撋稀巴诰蚪Y(jié)構(gòu)名稱”中,鍵入TargetedMailing。(2)在“挖掘模型名稱”中,鍵入TM_Decision_Tree。(3)選中“允許鉆取”復(fù)選框。點(diǎn)擊完成可見以下挖掘視圖5.4.2Microsoft時(shí)序挖掘技術(shù)—各個(gè)型號(hào)自行車銷售量做出預(yù)測(cè)前幾步同決議樹方法。在“選擇數(shù)據(jù)挖掘技術(shù)”頁“您要使用何種數(shù)據(jù)挖掘技術(shù)?”下,選擇“Microsoft時(shí)序”。在“指定表類型”頁上,選擇vTimeSeries表旁邊“事例”復(fù)選框,再單擊“下一步”。(1)在“定型數(shù)據(jù)”頁上,選擇TimeIndex和ModelRegion列旁邊“鍵”復(fù)選框。(2)選擇“數(shù)量”列旁邊“輸入”和“可預(yù)測(cè)”復(fù)選框。(1)在“完成向?qū)А表摗巴诰蚪Y(jié)構(gòu)名稱”中,鍵入Forecasting。(2)在“挖掘模型名稱”中,鍵入Forecasting,再單擊“完成”。5.4.3Microsoft關(guān)聯(lián)規(guī)則挖掘技術(shù)—?jiǎng)?chuàng)建市場(chǎng)籃方案前幾步同決議樹方法。在“選擇數(shù)據(jù)挖掘技術(shù)”頁“您要使用何種數(shù)據(jù)挖掘技術(shù)?”下,選擇“Microsoft關(guān)聯(lián)規(guī)則”。在“指定表類型”頁上,選中vAssocSeqOrders表旁“事例”復(fù)選框,選中vAssocSeqLineItems表旁邊“嵌套”復(fù)選框,再單擊“下一步”。(1)在“指定定型數(shù)據(jù)”頁上,依次去除CustomerKey旁邊“鍵”復(fù)選框和LineNumber旁邊“鍵”和“輸入”復(fù)選框。(2)選中Model列旁邊“鍵”和“可預(yù)測(cè)”復(fù)選框。然后,系統(tǒng)也將自動(dòng)選中“輸入”復(fù)選框。在“完成向?qū)А表摗巴诰蚪Y(jié)構(gòu)名稱”中,鍵入Association。在“挖掘模型名稱”中,鍵入Association,再單擊“完成”。5.4.4Microsoft時(shí)序分析與聚類分析挖掘技術(shù)—查看客戶瀏覽AdventureWorks網(wǎng)站方式前幾步同決議樹方法。在“選擇數(shù)據(jù)挖掘技術(shù)”頁“您要使用何種數(shù)據(jù)挖掘技術(shù)?”下,選擇“Microsoft次序分析與聚類分析”。在“指定表類型”頁上,選中vAssocSeqOrders表旁“事例”復(fù)選框,選中vAssocSeqLineItems表旁邊“嵌套”復(fù)選框,再單擊“下一步”。 (1)在“指定定型數(shù)據(jù)”頁中,去除CustomerKey旁“鍵”復(fù)選框。 (2)選中Model列旁“輸入”和“可預(yù)測(cè)”復(fù)選框,再單擊“下一步”。(1)在“指定列內(nèi)容和數(shù)據(jù)類型”頁上,單擊“下一步”。(2)在“完成向?qū)А表摗巴诰蚪Y(jié)構(gòu)名稱”中,鍵入SequenceClustering。(3)在“挖掘模型名稱”中,鍵入SequenceClustering,再單擊“完成”。5.5數(shù)據(jù)挖掘結(jié)果分析5.5.1Microsoft決議樹挖掘技術(shù)—目標(biāo)郵件方案挖掘結(jié)果分析挖掘結(jié)果—決議樹結(jié)果分析:(1)在“決議樹”選項(xiàng)卡上,能夠檢驗(yàn)組成挖掘模型全部樹模型。因?yàn)槟繕?biāo)郵件模型僅包含單個(gè)可預(yù)測(cè)屬性(BikeBuyer),所以只需查看一顆樹。(2)檢驗(yàn)決議樹查看器中TM_Decision_Tree模型會(huì)看出,在預(yù)測(cè)自行車購置行為時(shí),年紀(jì)是最主要原因。從決議書中能夠看出,按年紀(jì)對(duì)客戶進(jìn)行分組之后,每個(gè)年紀(jì)節(jié)點(diǎn)決議樹下一個(gè)分支都有所不一樣。經(jīng)過瀏覽“決議樹”選項(xiàng)卡,我們能夠得出以下結(jié)論:沒有汽車或者有一輛汽車、年紀(jì)在34到40購置者購置自行車可能性非常大,居住在太平洋地域、沒有汽車或者有一輛汽車更年輕單身客戶購置汽車可能性也非常大。注意:值1指示該客戶之前購置了自行車;值0指示該客戶還未購置自行車。節(jié)點(diǎn)底紋顏色越深,節(jié)點(diǎn)中具備目標(biāo)值事例所占百分比越大。挖掘結(jié)果—依賴關(guān)系網(wǎng)絡(luò)結(jié)果分析:(1)“相關(guān)性網(wǎng)絡(luò)”選項(xiàng)卡能夠顯示決定挖掘模型預(yù)測(cè)能力各個(gè)屬性之間關(guān)系。(2)相關(guān)性網(wǎng)絡(luò)中間節(jié)點(diǎn)(BikeBuyer)表示挖掘模型中可預(yù)測(cè)屬性。周圍每個(gè)節(jié)點(diǎn)各表示一個(gè)會(huì)影響可預(yù)測(cè)屬性結(jié)果屬性??墒褂迷撨x項(xiàng)卡左側(cè)滑塊控制顯示鏈接強(qiáng)度。向下移動(dòng)滑塊時(shí),僅顯示最強(qiáng)鏈接。(3)單擊網(wǎng)絡(luò)中單個(gè)節(jié)點(diǎn),然后參考選項(xiàng)卡底部顏色圖例,可查看所選節(jié)點(diǎn)預(yù)測(cè)哪些節(jié)點(diǎn),它本身又是由哪些節(jié)點(diǎn)預(yù)測(cè)。5.5.2Microsoft時(shí)序挖掘技術(shù)—各個(gè)型號(hào)自行車銷售量預(yù)測(cè)結(jié)果分析挖掘結(jié)果—查看決議樹挖掘結(jié)果—圖表選項(xiàng)卡圖相對(duì)圖表圖絕對(duì)圖表結(jié)果分析:(1)該圖表同時(shí)顯示歷史數(shù)據(jù)和未來數(shù)據(jù)。未來數(shù)據(jù)帶有底紋,方便與歷史數(shù)據(jù)區(qū)分開。使用“預(yù)測(cè)步驟”列表,可控制要顯示數(shù)據(jù)未來步驟數(shù)量。使用“顯示偏差”復(fù)選框,可在預(yù)測(cè)中添加錯(cuò)誤欄。 (2)正如上述圖表所表示,全部區(qū)域總銷售額通常會(huì)增加,而且每12個(gè)月(在11月)出現(xiàn)一次峰值。預(yù)測(cè)將按此趨勢(shì)進(jìn)行。5.5.3Microsoft關(guān)聯(lián)規(guī)則挖掘技術(shù)—?jiǎng)?chuàng)建市場(chǎng)籃方案結(jié)果分析挖掘結(jié)果—相集“項(xiàng)集”選項(xiàng)卡顯示三種主要信息,這些信息與Microsoft關(guān)聯(lián)算法發(fā)覺項(xiàng)集相關(guān):支持度(發(fā)生項(xiàng)集事務(wù)數(shù)量)、大?。?xiàng)集中項(xiàng)數(shù)量)以及項(xiàng)集實(shí)際組成。依照算法參數(shù)設(shè)置方式,算法能夠生成大量項(xiàng)集。使用“項(xiàng)集”選項(xiàng)卡頂部控件,能夠篩選查看器,使其僅顯示包含指定最小支持度和項(xiàng)集大小項(xiàng)集。結(jié)果分析:(1)市場(chǎng)籃方案依照客戶在線購物籃中已經(jīng)有其余產(chǎn)品創(chuàng)建一個(gè)可預(yù)測(cè)客戶購置需求數(shù)據(jù)挖掘模型,該模型可預(yù)測(cè)可能出現(xiàn)在購物籃中其余項(xiàng)或客戶想要放入購物籃項(xiàng)。經(jīng)過結(jié)果分析,比如若要僅查看包含關(guān)于Mountain-200自行車信息項(xiàng)集,可在“篩選項(xiàng)集”中輸入Mountain-200。能夠在查看器中看到,只有包含“Mountain-200”字樣項(xiàng)集被顯示。查看器中返回每個(gè)項(xiàng)集都包含關(guān)于銷售Mountain-200自行車事務(wù)信息。比如,在“支持度”列中包含值710項(xiàng)集表示:在全部事務(wù)中,710個(gè)購置Mountain-200自行車人也購置了Sport-100自行車,這個(gè)就表現(xiàn)了相集中關(guān)聯(lián)信息。5.5.4Microsoft時(shí)序分析與聚類分析挖掘技術(shù)—查看客戶瀏覽AdventureWorks網(wǎng)站方式結(jié)果分析經(jīng)過使用Microsoft次序分析和聚類分析算法,能夠找到客戶將項(xiàng)放入購物籃次序。然后可使用上述信息簡(jiǎn)化網(wǎng)站流程,這么便可引導(dǎo)客戶購置更多產(chǎn)品。挖掘結(jié)果—“分類關(guān)系圖”選項(xiàng)卡結(jié)果分析:節(jié)點(diǎn)顏色明暗度表示分類中全部事例密度,節(jié)點(diǎn)越暗,包含事例越多。能夠更改節(jié)點(diǎn)明暗度代表含義,使其表示屬性和狀態(tài)。比如,在“明暗度變量”列表中選擇“模型”,并在“狀態(tài)”

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論