5種數(shù)據(jù)挖掘工具分析比較_第1頁
5種數(shù)據(jù)挖掘工具分析比較_第2頁
5種數(shù)據(jù)挖掘工具分析比較_第3頁
5種數(shù)據(jù)挖掘工具分析比較_第4頁
5種數(shù)據(jù)挖掘工具分析比較_第5頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

#數(shù)據(jù)挖掘工具調(diào)查與研究姓名:學(xué)號:5種數(shù)據(jù)挖掘工具分別為:1、IntelligentMiner2、SASEnterpreiseMiner3、SPSSClementine4、馬克威分析系統(tǒng)5、GDMIntelligentMiner一、綜述:ibm的ExterpriseMiner簡單易用,是理解數(shù)據(jù)挖掘的好的開始。能處理大數(shù)據(jù)量的挖掘,功能一般,可能僅滿足要求.沒有數(shù)據(jù)探索功能。與其他軟件接口差,只能用DB2,連接DB2以外的數(shù)據(jù)庫時,如Oracle,SAS,SPSS需要安裝DataJoiner作為中間軟件。難以發(fā)布。結(jié)果美觀,但同樣不好理解。二、基本內(nèi)容:一個挖掘項(xiàng)目可有多個發(fā)掘庫組成;每個發(fā)掘庫包含多個對象和函數(shù)對象:數(shù)據(jù):由函數(shù)使用的輸入數(shù)據(jù)的名稱和位置。離散化:將記錄分至明顯可識別的組中的分發(fā)操作。名稱映射:映射至類別字段名的值的規(guī)范。結(jié)果:由函數(shù)創(chuàng)建的結(jié)果的名稱和位置。分類:在一個項(xiàng)目的不同類別之間的關(guān)聯(lián)層次或點(diǎn)陣。值映射:映射至其它值的規(guī)范。函數(shù):發(fā)掘:單個發(fā)掘函數(shù)的參數(shù)。預(yù)處理:單個預(yù)處理函數(shù)的參數(shù)。序列:可以在指定序列中啟動的幾個函數(shù)的規(guī)范。統(tǒng)計(jì):單個統(tǒng)計(jì)函數(shù)的參數(shù)。統(tǒng)計(jì)方法和挖掘算法:單變量曲線,雙變量統(tǒng)計(jì),線性回歸,因子分析,主變量分析,分類,分群,關(guān)聯(lián),相似序列,序列模式,預(yù)測等。處理的數(shù)據(jù)類型:結(jié)構(gòu)化數(shù)據(jù)(如:數(shù)據(jù)庫表,數(shù)據(jù)庫視圖,平面文件)和半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)(如:顧客信件,在線服務(wù),傳真,電子郵件,網(wǎng)頁等)。架構(gòu):它采取客戶/服務(wù)器(C/S)架構(gòu),并且它的API提供了C++類和方法IntelligentMiner通過其獨(dú)有的世界領(lǐng)先技術(shù),例如自動生成典型數(shù)據(jù)集、發(fā)現(xiàn)關(guān)聯(lián)、發(fā)現(xiàn)序列規(guī)律、概念性分類和可視化呈現(xiàn),可以自動實(shí)現(xiàn)數(shù)據(jù)選擇、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)挖掘和結(jié)果呈現(xiàn)這一整套數(shù)據(jù)挖掘操作。若有必要,對結(jié)果數(shù)據(jù)集還可以重復(fù)這一過程,直至得到滿意結(jié)果為止。三、現(xiàn)狀:現(xiàn)在,IBM的IntelligentMiner已形成系列,它幫助用戶從企業(yè)數(shù)據(jù)資產(chǎn)中識別和提煉有價值的信息。它包括分析軟件工具IntelligentMinerforData和IBMIntelligentMinerforText,幫助企業(yè)選取以前未知的、有效的、可行的業(yè)務(wù)知識如客戶購買行為,隱藏的關(guān)系和新的趨勢,數(shù)據(jù)來源可以是大型數(shù)據(jù)庫和企業(yè)內(nèi)部或Internet上的文本數(shù)據(jù)源。然后公司可以應(yīng)用這些信息進(jìn)行更好、更準(zhǔn)確的決策,獲得競爭優(yōu)勢。四、挖掘案例:(客戶細(xì)分)商業(yè)需求::客戶細(xì)分?jǐn)?shù)據(jù)理解:根據(jù)用戶基本信息(實(shí)際上還包括客戶消費(fèi)行為,人口統(tǒng)計(jì)信息等,本示例為簡單起見,只在這個表的數(shù)據(jù)基礎(chǔ)上進(jìn)行挖掘)進(jìn)行客戶細(xì)分?jǐn)?shù)據(jù)準(zhǔn)備:建模:選擇挖掘模型(比如是分群,還是分類)確定模型輸入,需要做的處理,結(jié)果分析選擇模型輸入字段:挖掘模型選擇:神經(jīng)分群發(fā)掘函數(shù)使用了一個Kohonen特征映射神經(jīng)網(wǎng)絡(luò)。Kohonen特征映射使用一個稱作自組織的進(jìn)程來將相似的輸入記錄組合在一起。您可以指定群集的數(shù)目和遍數(shù)。這些參數(shù)控制進(jìn)程時間和將數(shù)據(jù)記錄分配到群集時使用的粒度程度。分群的主任務(wù)是為每個群集查找中心。此中心也稱為稱為原型。對于每個在輸入數(shù)據(jù)中的每個記錄,神經(jīng)分群發(fā)掘函數(shù)計(jì)算和記錄計(jì)分最近的群集原型。每個數(shù)據(jù)記錄的計(jì)分是用到群集原型的歐幾里得距離表示的。計(jì)分越靠近0,與群集原型的相似性程度就越高。計(jì)分越高,記錄與群集原型就越不相似。輸入數(shù)據(jù)的每個遍歷,中心被調(diào)整來達(dá)到更好的整個分群模型質(zhì)量。在發(fā)掘函數(shù)運(yùn)行時,進(jìn)度指示器顯示每次遍歷的質(zhì)量改進(jìn)狀況。4.建模:選擇模型:指定輸入數(shù)據(jù):

選擇分群方式:分群模型設(shè)置概要:5.運(yùn)行模型:點(diǎn)擊藍(lán)色按鈕運(yùn)行模型,運(yùn)行模型進(jìn)程:6.模型結(jié)果分析:運(yùn)行結(jié)果(群):customercluster一」CONSUME_LEVELGENDERCODEONLINEDURATION一」CONSUME_LEVELGENDERCODEONLINEDURATIONPAYEDMONEY=UNPAYFEEAVGPAYEDMONEY運(yùn)行結(jié)果,統(tǒng)計(jì):PAYEDMONEY=UNPAYFEEAVGPAYEDMONEY運(yùn)行結(jié)果,統(tǒng)計(jì):參考字段特證(對于所有字段類型「岸工土丄[]=樸充,加=芙別,:D=連轍俏,DM=離散齣:引.F*-SJl^iiLACC_LDBfiAMD_IDCOnSUHE.LEVEL乜GEWDERLACC_LDBfiAMD_IDCOnSUHE.LEVEL乜GEWDEREREi3IOn_ODDE£OMLinEZDURATICi^?PA'fEIi-ftOIffiY3WAT_FEE昌加_PAYED」KW了JDnDn'Am.7j】1門0弓応2]2I23252-52.5CL"曲?22ag.2730.64iaa.on34.S3理W37.7D100,DO99823262.21百工孚用石訕「,、.「一丸怕二紋」:標(biāo)識名稱最小值平均值IS注2BRANDID22S2L-LS332.575D33COM述_LEVEL16匹3259LL68:3624GEUDER0I0-L&160-3959126O1ILinE_DURATI0rfi706L6L2941T0.3577PATED_ff:;'IiETU550民27922,6533BITOFATFEE□L443.D23.824192T.6099AKPAYED血NEYU0UJ從上面兩個圖中我們可以看出一些有意義的分群,根據(jù)consume_level和online_duration分群有一定意義。而比如用gender進(jìn)行的分群我們可以直接觀察出來,意義不大,只有兩個大類,可以直觀地看出男女比例:consume_level(消費(fèi)層次)的群特征信息:可以看出在第2、3類消費(fèi)層次占的比重較大。

髒字段特征匕討二輕字艮::3COtlSUfE^LETEL量惟1tti3平鳩2.32691袖龍0.6B362字段詳刪誌壬妬:::X"J1E_LE'.7L鎰亍w睚.丈小It力」匕t-.-sL[二丁匚〔1丁二500.380000.380D2ls.rc:L?丁二6X.\:a00.110D19.66OD二死二]匚「〕[[00.000D4C.3:C:[7.3:::00.D000OO.OOOD在線通話時長的一點(diǎn)分析:FF-D0FF-D0:].:)[:DO.DDOOD5(二汎二門]訂工16.T3OD16.7100|][13.250D|}<][)月匚疋〕〔J〔)匚::.!)[:二門]-i洋菇■?--■:■$7'1'■?鳧7'1'2:)[二泓汛:J:X:J;O[:;.\X1疋〕〔;〕〔:].:n::.[:]['Ct二;觀D1J300從上面圖中可以看出,大部分客戶每一個月消費(fèi)是50元以下的。50-200各區(qū)間逐步遞減;而一個月消費(fèi)300以上的,也從3%,8%,12%逐漸遞增的態(tài)勢。挖掘的這些消費(fèi)分群信息,對有針對性的營銷,提前對客戶進(jìn)行細(xì)分是很有意義的。6?保存調(diào)出模型:客戶分類挖掘示例(待續(xù)):采用一樣的數(shù)據(jù),對客戶消費(fèi)水平進(jìn)行分類預(yù)測(consume_level)Ili'-f-Jm孔I*-K■■?+^<?.1■:dJ*稈曲|3Ili'-f-Jm孔I*-K■■?+^<?.1■:dJ*稈曲|3◎韭3-JcJjU:,■山r?i*巨應(yīng)l■:tartu^i科起Wr口Muir二j?沁aidc已國x」麻r&?■皿RM-Ain^Viwft.—l!■/RM.121ixff1Z1T■IEJ?.!k,甲Wra-JtB—iiFris-ci_i■:'i:t-h—1““JElIUHEH

_1""呼刊jjj.兇IOilliuhiin-KWn-lliW*■增"■汕旳.Jfl01>Wfl.^Jl?TlAXU■4如|.IrfL-1*Ei目點(diǎn)存w*nJr;rffl丄M:||T-IIFMVLFIV■a也IirHititiiUE.g-riOnMHLltfrt-ttiE^r—rim:iiMmitmiiiiirsrH¥Elr|LlEMf—rfM'!iRM0IlKIFS加if迴辛nA艮.junvitbqlititil<■:列IEFT■Iii—Airr,tfi.it-知厲+混淆矩陣:分類百分率:混淆矩陣:分類百分率:喫際肘2喫際肘2341562575211340000322115531550004201225880001327000005028&00060011000SASEnterpriseMiner一、綜述:SAS完仝以統(tǒng)計(jì)理論為基礎(chǔ),功能強(qiáng)大,有完備的數(shù)據(jù)探索功能。但難以掌握,要求是高級統(tǒng)計(jì)分析專業(yè)人員.結(jié)果難以理解。價格也極其昂貴,而且是租賃模式。二、基本內(nèi)容:支持SAS統(tǒng)計(jì)模塊,使之具有杰出的力量和影響,它還通過大量數(shù)據(jù)挖掘算法增強(qiáng)了那些模塊。SAS使用它的SEMMA方法學(xué)以提供一個能支持包括關(guān)聯(lián)、聚類、決策樹、神經(jīng)元網(wǎng)絡(luò)和統(tǒng)計(jì)回歸在內(nèi)的廣闊范圍的模型數(shù)據(jù)挖掘工具。SASEntelpriseMiner設(shè)計(jì)為被初學(xué)者和有經(jīng)驗(yàn)的用戶使用。它的GUI界面是數(shù)據(jù)流驅(qū)動的,且它易于理解和使用。它允許一個分析者通過構(gòu)造一個使用鏈接連接數(shù)據(jù)結(jié)點(diǎn)和處理結(jié)點(diǎn)的可視數(shù)據(jù)流圖建造一個模型。另外,此界面允許把處理結(jié)點(diǎn)直接插入到數(shù)據(jù)流中。由于支持多種模型,所以EnterpriseMiner允許用戶比較(評估)不同模型并利用評估結(jié)點(diǎn)選擇最適合的。另外,EnterpriseMiner提供了一個能產(chǎn)生被任何SAS應(yīng)用程序所訪問的評分模型的評分結(jié)點(diǎn)。三、用戶配置:SASEnterpriseMiner能運(yùn)行在客戶/服務(wù)器上或(計(jì)算機(jī)的外圍設(shè)備)能獨(dú)立運(yùn)行的配置上。此外,在客戶/服務(wù)器模式下,EnterpriseMiner允許把服務(wù)器配置成一個數(shù)據(jù)服務(wù)器、計(jì)算服務(wù)器或兩者的綜合。EntepnseMiner被設(shè)計(jì)成能在所有SAS支持的平臺上運(yùn)行。該結(jié)構(gòu)支持胖客戶機(jī)配置(要求客戶機(jī)上的完全SAS許可證)以及瘦客戶機(jī)(瀏覽器)版本。四、數(shù)據(jù)挖掘技術(shù)、算法和應(yīng)用程序:SASEntelpriseMiner支持關(guān)聯(lián)、聚類、決策樹、神經(jīng)元網(wǎng)絡(luò)和經(jīng)典的統(tǒng)計(jì)回歸技術(shù)。五、前景:它在統(tǒng)計(jì)分析軟件上的豐富經(jīng)驗(yàn),所以SAS開發(fā)出了一個全功能、易于使用、可靠和易于管理的系統(tǒng)。模型選項(xiàng)和算法所覆蓋的廣闊范圍、設(shè)計(jì)良好的用戶界面、現(xiàn)存數(shù)據(jù)商店的能力和在統(tǒng)計(jì)分析市場所占的巨大份額(允許一個公司獲得一個增加的SAS部件而不是一個新的工具)都可能使SAS在數(shù)據(jù)挖掘市場上取得領(lǐng)先位置。由于它最近剛投放市場,所以在寫此書時只能獲得少數(shù)公布的用戶基推測試。這些結(jié)果表明EnterpriseMiner在可伸縮性、預(yù)測準(zhǔn)確性和處理時間上都表現(xiàn)得很好??偟膩碚f,此工具適合于企業(yè)在數(shù)據(jù)挖掘方面的應(yīng)用以及CBM的全部決策支持應(yīng)用。六、案例:

SAS軟件成就安利(中國)高效物流安利(中國)透過庫存優(yōu)化系統(tǒng)提升服務(wù)效率20%,客戶滿意率指標(biāo)達(dá)到97%安利是國際上知名的直銷企業(yè),1992年進(jìn)入中國市場。目前,中國是安利在全球最大的市場,安利(中國)2008年的銷售業(yè)績達(dá)179億元人民幣,占安利全球收入的1/3強(qiáng),并且保持著強(qiáng)勁的增長勢頭。目前,安利(中國)擁有1000多種產(chǎn)品,全國共有229間店鋪、29個配送中心、22個外倉和1個4萬平方米的物流中心,倉庫總面積達(dá)10萬平方米,存儲量達(dá)5.6萬個卡板,每年的運(yùn)輸里程1,396萬公里,相當(dāng)于繞地球349圈。安利(中國)特有的“店鋪+直銷+經(jīng)銷”的多元化營銷模式和頻繁而快速的的市場促銷活動,加大了庫存管理的難度,要求運(yùn)營流程和相關(guān)人員具有更高的靈活應(yīng)變能力。為了更好地配合安利業(yè)務(wù)的高速發(fā)展,使得信息流的發(fā)展能夠與未來企業(yè)供應(yīng)鏈的飛速發(fā)展相適應(yīng)并具有一定的前瞻性,安利(中國)管理層決定進(jìn)一步深化當(dāng)前的商業(yè)分析應(yīng)用,在供應(yīng)鏈管理方面引入SAS技術(shù),建立"庫存優(yōu)化系統(tǒng)(InventoryOptimizationSystem,縮寫IOS)”,統(tǒng)籌考慮各種相互約束的條件,將“正確的產(chǎn)品”以“正確的成本”在“正確的時間”送達(dá)“正確的地點(diǎn)”,實(shí)現(xiàn)對復(fù)雜市場環(huán)境的快速反應(yīng),從而進(jìn)一步提高企業(yè)的市場競爭力。Arnway利庫存優(yōu)化系統(tǒng)(IOS)的主要功能IOS是一種極為有效的庫存管理工具,它提供了基于服務(wù)水平、交貨時間和成本等用戶指定的約束條件測算最佳庫存水平和模式的能力。具體功能如下:1?多層次的產(chǎn)品需求預(yù)測通過業(yè)內(nèi)領(lǐng)先的SAS時間序列分析技術(shù),根據(jù)過往歷史上的相關(guān)銷售數(shù)據(jù),對不同層次的商品、地區(qū)進(jìn)行自動診斷、建模、執(zhí)行以及調(diào)整預(yù)測,可以精密到具體產(chǎn)品、店鋪級別的需求數(shù)據(jù),預(yù)測未來的客戶需求量oIOS采集了安利(中國)歷史三年、超過7千萬張訂單的數(shù)據(jù)進(jìn)行分析。預(yù)測的結(jié)果由于考慮了需求的變動趨勢、季節(jié)性波動、產(chǎn)品促銷、產(chǎn)品屬性等因素,并基于最為健壯的模型庫,因此生成的預(yù)測數(shù)據(jù)更為準(zhǔn)確。并且具有高可擴(kuò)展性、靈活變動等特點(diǎn)。

2.考慮全面的智能排車系統(tǒng)根據(jù)預(yù)測的需求量,運(yùn)用優(yōu)化模型計(jì)算出每個地區(qū)的補(bǔ)貨頻率。同時,結(jié)合車型、運(yùn)載量、運(yùn)輸成本等相關(guān)運(yùn)輸數(shù)據(jù),計(jì)算出未來一周最優(yōu)的排車計(jì)劃。排車計(jì)劃會結(jié)合各補(bǔ)貨計(jì)劃人員負(fù)責(zé)的區(qū)域,以均衡各人的工作安排,及更妥善的人力分配。系統(tǒng)中直觀、清晰地展現(xiàn)出當(dāng)前的排車計(jì)劃、車輛信息等。排車計(jì)劃由于受到公司策略安排、產(chǎn)品促銷、庫存調(diào)配、人手安排等因素的影響,具有一定的變動性。計(jì)劃人員可以靈活方便地對其進(jìn)行變動,而這些變動又被系統(tǒng)紀(jì)錄起來,并區(qū)分成計(jì)劃調(diào)整和臨時變動兩種狀態(tài),以作為日后排車的依據(jù)和對排車效果分析的數(shù)據(jù)源。3?最優(yōu)化的庫存補(bǔ)貨策略庫存補(bǔ)貨策略首先要基于多層次的補(bǔ)貨網(wǎng)絡(luò),從成品生產(chǎn)的工廠到物流中心到外倉,從外倉到店鋪。綜合考慮各個產(chǎn)品的預(yù)測需求量和需求的變動性、運(yùn)輸時間、包裝規(guī)格、庫存成本、運(yùn)輸成本、運(yùn)輸頻率、客戶服務(wù)水平、庫存策略、最小訂貨量等影響因素后,更精細(xì)地動態(tài)制定庫存補(bǔ)貨策略,包括重訂購水平以及訂購至水平。這些補(bǔ)貨策略能細(xì)致到具體每個倉庫、每間店鋪中的每個產(chǎn)品,而且能隨著時間的推移動態(tài)適應(yīng)市場變化,并進(jìn)行相應(yīng)的調(diào)整。InventoryOptimizationNewmethodvs.oldmethodOptimizedinventoryOptimizedinventory4.指標(biāo)分析和預(yù)警功能此功能為整個庫存管理提供日常所需的KPI(KeyPerformaneeIndication)報(bào)表和緊急狀態(tài)預(yù)警。包括庫存水平分析、采購建議分析、存貨預(yù)警、暫時缺貨EAS(EmergingAlertSystem)分析、運(yùn)輸空載率、產(chǎn)品銷售監(jiān)控等一系列分析數(shù)據(jù)和報(bào)表。12am?金義丹12am?金義丹e削31M554號g10115CO5J2MK6itCentreIf?iFO#lal^KX月駐旳旳ppwlRtf#KA?*4B11K咖lh儀JVrtrSPSS(StatisticalProductandServiceSolutions)一、綜述:“統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案”軟件。最初軟件全稱為“社會科學(xué)統(tǒng)計(jì)軟件包”。但是隨著SPSS產(chǎn)品服務(wù)領(lǐng)域的擴(kuò)大和服務(wù)深度的增加,SPSS公司已于2000年正式將英文全稱更改為“統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案”。SPSS是世界上最早采用圖形菜單驅(qū)動界面的統(tǒng)計(jì)軟件,該軟件應(yīng)用于自然科學(xué)、技術(shù)科學(xué)、社會科學(xué)的各個領(lǐng)域,世界上許多有影響的報(bào)刊雜志紛紛就SPSS的自動統(tǒng)計(jì)繪圖、數(shù)據(jù)的深入分析、使用方便、功能齊全等方面給予了高度的評價與稱贊。迄今SPSS軟件已有30余年的成長歷史。全球約有25萬家產(chǎn)品用戶,它們分布于通訊、醫(yī)療、銀行、證券、保險、制造、商業(yè)、市場研究、科研教育等多個領(lǐng)域和行業(yè),是世界上應(yīng)用最廣泛的專業(yè)統(tǒng)計(jì)軟件。二、特點(diǎn):它最突出的特點(diǎn)就是操作界面極為友好,輸出結(jié)果美觀漂亮。它將幾乎所有的功能都以統(tǒng)一、規(guī)范的界面展現(xiàn)出來,使用Windows的窗口方式展示各種管理和分析數(shù)據(jù)方法的功能,對話框展示出各種功能選擇項(xiàng)。用戶只要掌握一定的Windows操作技能,粗通統(tǒng)計(jì)分析原理,就可以使用該軟件為特定的科研工作服務(wù)。SPSS采用類似EXCEL表格的方式輸入與管理數(shù)據(jù),數(shù)據(jù)接口較為通用,能方便的從其他數(shù)據(jù)庫中讀入數(shù)據(jù)。其統(tǒng)計(jì)過程包括了常用的、較為成熟的統(tǒng)計(jì)過程,完全可以滿足非統(tǒng)計(jì)專業(yè)人士的工作需要。輸出結(jié)果十分美觀,存儲時則是專用的SPO格式,可以轉(zhuǎn)存為HTML格式和文本格式。對于熟悉老版本編程運(yùn)行方式的用戶。SPSS還特別設(shè)計(jì)了語法生成窗口,用戶只需在菜單中選好各個選項(xiàng),然后按“粘貼”按鈕就可以自動生成標(biāo)準(zhǔn)的SPSS程序。極大的方便了中、高級用戶。SPSS輸出結(jié)果雖然漂亮,但不能為WORD等常用文字處理軟件直接打開,只能采用拷貝、粘貼的方式加以交互。這可以說是SPSS軟件的缺陷。三、功能:增強(qiáng)的數(shù)據(jù)管理功能。完善的結(jié)果報(bào)告功能。從10版起,對數(shù)據(jù)和結(jié)果的圖表呈現(xiàn)功能一直是SPSS改進(jìn)的重點(diǎn)。ComplexSamples模塊增加統(tǒng)計(jì)建模功能。ComplexSamples是12版中新增的模塊,用于實(shí)現(xiàn)復(fù)雜抽樣的設(shè)計(jì)方案,以及對相應(yīng)的數(shù)據(jù)進(jìn)行描述。一般線形模型將會被完整地引入復(fù)雜抽樣模塊中,以實(shí)現(xiàn)對復(fù)雜抽樣研究中各種連續(xù)性變量的建模預(yù)測功能。ClassificationTree模塊。這個模塊實(shí)際上就是將以前單獨(dú)發(fā)行的SPSSAnswerTree軟件整合進(jìn)了SPSS平臺。ClassificationTree模塊基于數(shù)據(jù)挖掘中發(fā)展起來的樹結(jié)構(gòu)模型對分類變量或連續(xù)變量進(jìn)行預(yù)測,可以方便、快速的對樣本進(jìn)行細(xì)分,不需要用戶有太多統(tǒng)計(jì)專業(yè)知識。更好的SPSS系列產(chǎn)品兼容。能夠針對市場細(xì)分工作提供更為完整的方法體系。四、前景:通過對SPSS在質(zhì)量信息管理中的應(yīng)用進(jìn)行了初步探討,不難發(fā)現(xiàn)盡管SPSS是一種通用的社會科學(xué)統(tǒng)計(jì)軟件,但非常適用于質(zhì)量數(shù)據(jù)的處理和分析,廣大質(zhì)量工作者可以逐步探索SPSS在質(zhì)量管理中的新用途,大幅度改善質(zhì)量管理的效率和效果,幫助管理者做出最優(yōu)決策,最大限度地提高產(chǎn)品和服務(wù)質(zhì)量。它的前景十分可觀。五、案例:機(jī)械設(shè)備維護(hù)保障預(yù)測性分析一Sikorsky航空公司公司介紹:位于Stratford,Conn,是一家世界領(lǐng)先的直升機(jī)設(shè)計(jì)、制造和服務(wù)公司。該公司的直升機(jī)業(yè)務(wù)涵蓋了商業(yè)、工業(yè)及軍事等行業(yè),美國空軍所有5個分支機(jī)構(gòu)、世界上40多個國家的軍事及商業(yè)機(jī)構(gòu)均選擇采購使用Sikorsky公司的直升機(jī)。該公司的愿景反映了其對安全和創(chuàng)新的長期承諾:“我們先進(jìn)的飛機(jī)及技術(shù)把任何時間任何地點(diǎn)的人們安全地送回家?!弊詮?944年全世界第一起直升機(jī)營救事例起,Sikorsky的直升機(jī)估計(jì)已經(jīng)拯救了200多萬條生命。Sikorsky公司是位于Hartford,Conn的美國聯(lián)合技術(shù)集團(tuán)的下屬公司之一。美國聯(lián)合技術(shù)

集團(tuán)是一家為航天航空及建筑系統(tǒng)行業(yè)提供高技術(shù)產(chǎn)品和支持服務(wù)的集團(tuán)。面臨的問題如何預(yù)測機(jī)器零件損耗并及時更新以保證安全生產(chǎn)如何管理機(jī)器設(shè)備庫存以保證及時供貨的同時又使管理成本降到最低如何降低機(jī)器設(shè)備的損耗,延長機(jī)器設(shè)備使用壽命的同時又保證安全生產(chǎn)如何摸清機(jī)器設(shè)備使用的各種成本,進(jìn)行成本管理并直接降低成本如何充分分析挖掘企業(yè)現(xiàn)有所有數(shù)據(jù)源,包括結(jié)構(gòu)性數(shù)據(jù)及非結(jié)構(gòu)性數(shù)據(jù)(文本數(shù)據(jù)),并進(jìn)行預(yù)測性分析產(chǎn)品選擇Sikorsky提供客戶各種各樣的維護(hù)保障項(xiàng)目幫助客戶以可知的成本運(yùn)營飛機(jī)及提高飛機(jī)的可利用性。其中的全面保障項(xiàng)目(TAP),涵蓋了飛機(jī)相關(guān)零件及服務(wù)中98%的成本費(fèi)用。Sikorsky公司尋求一種軟件及解決方案幫助直升機(jī)客戶識別和預(yù)測飛機(jī)設(shè)備的維護(hù)保障并最終提高客戶的滿意度。Sikorsky航空公司已選擇了使用SPSS公司市場領(lǐng)先的預(yù)測性分析軟件及解決方案,該軟件通過積極主動地預(yù)測直升機(jī)客戶的預(yù)期需求極大地提高了客戶的忠誠度。應(yīng)用產(chǎn)品:SPSS統(tǒng)計(jì)分析產(chǎn)品;Clementine數(shù)據(jù)挖掘產(chǎn)品(包括數(shù)據(jù)挖掘和文本挖掘);SPSS企業(yè)級預(yù)測平臺PES;解決方案:項(xiàng)目的解決方案按照行業(yè)內(nèi)公認(rèn)的方法論一CRISP-DM分為六個步驟:業(yè)務(wù)理解,數(shù)據(jù)理解,數(shù)據(jù)準(zhǔn)備,建模,評估以及部署。商業(yè)理解預(yù)測飛機(jī)零部件損耗并及時更新零部件保證安全飛行管理飛機(jī)零部件庫存,降低庫存成本,但保證及時供貨摸清飛機(jī)設(shè)備成本,成本管理,降低成本規(guī)范飛行員的駕駛操作降低零部件損耗并保證安全飛行整合各種資源,提高飛機(jī)的可利用性數(shù)據(jù)理解及數(shù)據(jù)準(zhǔn)備正常飛行時飛機(jī)監(jiān)測系統(tǒng)所收集到的數(shù)據(jù)飛行員駕駛操作日志記錄,包括錯誤操作記錄及正確操作記錄機(jī)務(wù)人員操作日志記錄,包括錯誤操作記錄及正確操作記錄飛機(jī)零部件損耗數(shù)據(jù)飛機(jī)各零部件成本飛行器維護(hù)保障數(shù)據(jù)根據(jù)數(shù)據(jù)的結(jié)構(gòu)化程度可分為結(jié)構(gòu)性數(shù)據(jù)如每架直升機(jī)的歷史數(shù)據(jù)和現(xiàn)今數(shù)據(jù),非結(jié)構(gòu)性數(shù)據(jù)包括飛行日志和機(jī)務(wù)人員錯誤日志記錄數(shù)據(jù)顆粒度:日、月、季、年總之,從所有數(shù)據(jù)源收集信息,并通過Clementine進(jìn)行數(shù)據(jù)清理及數(shù)據(jù)審核,分析缺失值并填補(bǔ)之,形成可供建模的清潔完整數(shù)據(jù)。數(shù)據(jù)審核及缺失值填補(bǔ)界面數(shù)據(jù)的標(biāo)準(zhǔn)化及轉(zhuǎn)換界面

數(shù)據(jù)審核及缺失值填補(bǔ)界面數(shù)據(jù)的標(biāo)準(zhǔn)化及轉(zhuǎn)換界面Vu.u.IILUI」5二£起蘭器需工"E£』E^I-H■ruIF—IW^HIJMIWjrsirf'tVu.u.IILUI」5二£起蘭器需工"E£』E^I-H■ruIF—IW^HIJMIWjrsirf't■-MEJL計(jì)IJnwri■h—ihinm■_■HumL^OL...I―JULUL-I■2■-*PHI0■■.10盜鬥naciiiij|■..IMKUhi^!k^L.1]L丄L^J底寸口SI山II]■W—mIMABB亠…#.1*4.…—丄—二XJUJBI—■!*■-■■'IMBHrii"imBHH「」*!■!■■—MnUBKWniIlmira'■FAJfa—r-M『GEE|RH數(shù)據(jù)建模關(guān)聯(lián)規(guī)則:飛行員的駕駛操作方法(包括正確操作方法和錯誤操作方法)與飛機(jī)零部件損耗之間的關(guān)系,飛行員日志與零部件損耗之間的關(guān)系,機(jī)務(wù)人員日志與零部件損耗之間的關(guān)系。如什么樣的駕駛操作方法會使零部件損耗特別快,什么樣的駕駛操作方法可降低零部件的損耗。對這些關(guān)系的深入理Sikorsky公司可預(yù)先采取行動措施降低飛機(jī)的直接維護(hù)成本時間序列分析:飛機(jī)各種零部件使用的生命周期,根據(jù)時間序列的分析,發(fā)現(xiàn)飛機(jī)各種零部件該更換的信息,及時更換零部件,保障飛行安全異常監(jiān)測:對零部件及機(jī)務(wù)人員的異常情況進(jìn)行偵測,發(fā)出預(yù)警信息,提高飛行的安全性回歸分析:通過回歸建模包括logistic回歸和多元回歸,擬合飛機(jī)成本消耗的模型,包括各個組成成本的消耗及影響因素,降低成本。同時也可對庫存管理進(jìn)行擬合,探討影響庫存的各個因素,降低庫存成本。聚類與分類:零部件運(yùn)營狀態(tài)細(xì)分,飛機(jī)維護(hù)保障狀態(tài)細(xì)分等。時間序列分析圖和關(guān)聯(lián)規(guī)則分析圖模型評估及發(fā)布:結(jié)合飛機(jī)業(yè)務(wù)知識及商業(yè)知識,使用SPSS企業(yè)級預(yù)測平臺PES進(jìn)行模型評估及發(fā)布。評估模型:使用累積圖或準(zhǔn)確性;多個模型使用競爭方式評估;自動報(bào)表發(fā)布實(shí)施效果及結(jié)果反饋:通過SPSS預(yù)測性分析軟件和解決方案,Sikorsky飛機(jī)預(yù)先性地保障了客戶飛機(jī)的安全,降低了零部件的損耗,合理地控制了成本,提高了飛機(jī)的可利用性,提高了客戶的滿意度和忠誠度,達(dá)到了可觀的社會效益和經(jīng)濟(jì)效益。(單機(jī)版V5.0)一、綜述:上海天律信息技術(shù)有限公司產(chǎn)品品牌,旗下產(chǎn)品包括馬克威分析系統(tǒng)單機(jī)版、網(wǎng)絡(luò)版,馬克威決策支持平臺。馬克威分析系統(tǒng)單機(jī)版V5.0是一套集分析、挖掘、預(yù)測、決策支持及展現(xiàn)于一體的知識發(fā)現(xiàn)工具,通過構(gòu)建工作流方式對海量數(shù)據(jù)進(jìn)行分析和挖掘,建立概念模型,從海量信息和數(shù)據(jù)中尋找規(guī)律和知識,并通過新穎、獨(dú)特的展現(xiàn)方式為決策者提供科學(xué)有效的數(shù)據(jù)參考。它適用于企業(yè)、政府、科研教育、軍隊(duì)等單位和機(jī)構(gòu)。馬克威分析系統(tǒng)是中國信息化過程中不可缺少的工具。馬克威分析系統(tǒng)5.0(單機(jī)版)是馬克威分析系統(tǒng)系列產(chǎn)品中全新的一代企業(yè)級統(tǒng)計(jì)分析和數(shù)據(jù)挖掘產(chǎn)品,也是全球第一套準(zhǔn)三維操作環(huán)境的統(tǒng)計(jì)分析和數(shù)據(jù)挖掘軟件產(chǎn)品。它融合了先進(jìn)的軟件開發(fā)技術(shù)和強(qiáng)大的算法庫,能使用戶更為輕松、高效、準(zhǔn)確地對數(shù)據(jù)進(jìn)行處理和分析。二、特點(diǎn):全球第一套準(zhǔn)三維操作環(huán)境的統(tǒng)計(jì)分析和數(shù)據(jù)挖掘軟件產(chǎn)品完全基于工作流的軟件應(yīng)用高度圖形化的操作方式,無需任何編程基礎(chǔ)高性能運(yùn)行,支持海量數(shù)據(jù)和多種數(shù)據(jù)源,突破傳統(tǒng)Java速度限制個性化動態(tài)報(bào)表和新穎的展示可重復(fù)性使用的分析流程,圖形化的批量處理模式跨平臺運(yùn)行支持多國語言1.全球第一套以工作流模式在準(zhǔn)三維操作環(huán)境下運(yùn)作的統(tǒng)計(jì)分析和數(shù)據(jù)挖掘系統(tǒng)產(chǎn)品完全基于工作流的軟件應(yīng)用3.高度圖形化的操作方式,無需任何編程基礎(chǔ)高性能運(yùn)行,支持海量數(shù)據(jù)和多種數(shù)據(jù)源,突破傳統(tǒng)Java速度限制個性化動態(tài)報(bào)表和新穎的展示可重復(fù)性使用的分析流程,圖形化的批量處理模式跨平臺運(yùn)行8、支持多國語言三、功能特點(diǎn):企業(yè)指標(biāo)分析、定制和管理模型構(gòu)建和管理體系預(yù)警預(yù)測數(shù)據(jù)分析和挖掘平臺經(jīng)營管控、績效分析、管理駕駛艙平臺展現(xiàn)平臺(包括定制報(bào)表、報(bào)表展現(xiàn),圖表及OLAP展現(xiàn)等)系統(tǒng)權(quán)限管理企業(yè)數(shù)據(jù)倉庫建設(shè)和管理四、案例:上海市外貿(mào)出口時間序列分析外貿(mào)出口是上海市經(jīng)濟(jì)發(fā)展的一個很重要的方面,尤其是近年來江浙一帶出口加工貿(mào)易的蓬勃發(fā)展,使得上海市外貿(mào)出口呈現(xiàn)出快速變化的特點(diǎn),為了分析上海市外貿(mào)出口額的變化規(guī)律,并進(jìn)行預(yù)測,可以選用馬克威分析系統(tǒng)的時間序列分析模塊,進(jìn)行建模和預(yù)測。使用馬克威分析系統(tǒng)進(jìn)行建模的步驟為:模型識別:描繪數(shù)據(jù)圖形,對數(shù)據(jù)進(jìn)行變換、檢驗(yàn)平穩(wěn)性。計(jì)算基本序列的自相關(guān)關(guān)系,以決定是否要進(jìn)行差分。利用自相關(guān)和偏相關(guān)系數(shù)進(jìn)行數(shù)據(jù)的調(diào)整和模型的定階。4?使用時間序列算法(ARIMA等)估計(jì)模型參數(shù)和相關(guān)統(tǒng)計(jì)量。對模型進(jìn)行檢驗(yàn)。利用模型進(jìn)行預(yù)測。使用時間序列模型對上海市外貿(mào)出口額進(jìn)行預(yù)測的效果為:■iaujj■繕蟲p51/1CiJu-'F*丄Iaaurf!ft1-anudwoNs'X.;片侖外唏出口純顱列囹■>GDM(博通數(shù)據(jù)挖掘分析系統(tǒng))一、簡述:GDM,是天才博通科技有限公司自主研發(fā)的一款基于B/S架構(gòu)的、分布式數(shù)據(jù)挖掘系統(tǒng),采用了較之“數(shù)據(jù)挖掘交叉行業(yè)標(biāo)準(zhǔn)過程”CRISP-DM(Cross-1ndustryStandardProcessforDataMining)更為科學(xué)的分析流程,并提供了易用的圖形化用戶界面和強(qiáng)大的圖形可視化技術(shù)。GDM使分析人員能夠快速構(gòu)建各類數(shù)據(jù)挖掘模型,并以WebService形式進(jìn)行發(fā)布,方便其它企業(yè)級應(yīng)用系統(tǒng)中快速調(diào)用模型,并進(jìn)行靈活封裝。該系統(tǒng)目前最新版本GDM4.2包含21種經(jīng)典的數(shù)據(jù)挖掘方法、14種統(tǒng)計(jì)分析方法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論