版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、基于神經(jīng)網(wǎng)絡(luò)的基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘方法數(shù)據(jù)挖掘方法0 0 引言引言1 1 數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘技術(shù)2 2 神經(jīng)網(wǎng)絡(luò)原理神經(jīng)網(wǎng)絡(luò)原理3 3 基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘4 4 結(jié)論結(jié)論2 20 0 引言引言現(xiàn)代信息技術(shù)的高速發(fā)展,數(shù)據(jù)庫應(yīng)用的規(guī)模、范圍不斷擴(kuò)大,可獲得的數(shù)據(jù)量越來越大,數(shù)據(jù)的種類也日益繁多。面對如此大規(guī)模的、并且存在著“噪聲”的數(shù)據(jù),如何從中提取出隱含其中的有意義的、對決策有用的信息或知識(shí),進(jìn)一步提高信息利用率,成為“信息時(shí)代”亟待解決的一個(gè)問題。3 30 0 引言引言20世紀(jì)90年代出現(xiàn)的數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘技術(shù)受到不同領(lǐng)域研究學(xué)者的極大關(guān)注,盡管對數(shù)據(jù)挖掘的
2、研究與應(yīng)用還只處于初級階段,但是它的應(yīng)用前景早已被各方面專家學(xué)者看好。garter group在1997年的一份報(bào)告中指出:數(shù)據(jù)挖掘技術(shù)將在未來的三到五年內(nèi)成為對全球影響最的一個(gè)關(guān)鍵技術(shù)領(lǐng)域。4 41 1 數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘的含義:數(shù)據(jù)挖掘的含義:數(shù)據(jù)挖掘數(shù)據(jù)挖掘,又稱數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn)知識(shí)發(fā)現(xiàn),就是從大量數(shù)據(jù)中獲取有效、新穎、潛在有用、最終可理解的模式的非平凡過程。簡單地說,數(shù)據(jù)挖掘就是從海量的數(shù)據(jù)中挖掘出可能有潛在價(jià)值的信息的技術(shù)。這些知識(shí)是是隱含的,事先未知的潛在的有用的信息。5 51 1 數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘的主要功能:數(shù)據(jù)挖掘的主要功能:分類分類:按照對象的
3、屬性、特征,建立不同的組類來描述事物。聚類聚類:識(shí)別出分析對象內(nèi)在的規(guī)則,按照這些規(guī)則把對象分成若干類。6 61 1 數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘的主要功能:數(shù)據(jù)挖掘的主要功能:關(guān)聯(lián)規(guī)則和序列模式關(guān)聯(lián)規(guī)則和序列模式:關(guān)聯(lián)是某種事物發(fā)生時(shí)其他事物會(huì)發(fā)生的這樣一種聯(lián)系。預(yù)測預(yù)測:把握分析對象發(fā)展的規(guī)律,對未來的趨勢做出預(yù)見。偏差的檢測偏差的檢測:對分析對象的少數(shù)的、極端的特例的描述,揭示內(nèi)在的原因。7 71 1 數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘的處理過程:數(shù)據(jù)挖掘的處理過程:數(shù)據(jù)挖掘的過程主要分為5個(gè)部分:問題的定義數(shù)據(jù)準(zhǔn)備數(shù)據(jù)整理建立模型評價(jià)和解釋8 81 1 數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖
4、掘的處理過程:數(shù)據(jù)挖掘的處理過程:9 91 1 數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘技術(shù)現(xiàn)行的數(shù)據(jù)挖掘方法:現(xiàn)行的數(shù)據(jù)挖掘方法:統(tǒng)計(jì)方法、關(guān)聯(lián)發(fā)現(xiàn)、聚類分析、分類與回歸和決策樹、聯(lián)機(jī)分析處理(olap)、查詢工具、主管信息系統(tǒng)(eis)等。這些方法幫助分析包含在數(shù)據(jù)倉庫中的數(shù)據(jù),它們的共同特點(diǎn)是問題驅(qū)動(dòng)問題驅(qū)動(dòng)的。用戶必須提出許多問題,才能得到包含在復(fù)雜關(guān)系中的結(jié)果,當(dāng)提不出問題或提出的問題不正確時(shí),將得不到正確的數(shù)據(jù)。10102 2 神經(jīng)網(wǎng)絡(luò)原理神經(jīng)網(wǎng)絡(luò)原理神經(jīng)網(wǎng)絡(luò)是由大量并行分布式并行分布式處理單元組成的簡單處理單元。它有通過調(diào)整連接強(qiáng)度而從經(jīng)驗(yàn)知識(shí)進(jìn)行學(xué)習(xí)的能力并可將這些知識(shí)進(jìn)行運(yùn)算。是模擬人腦模擬人腦
5、的一種技術(shù)系統(tǒng)。11113 3 基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘由以下二個(gè)階段組成:網(wǎng)絡(luò)構(gòu)造、訓(xùn)練和剪枝網(wǎng)絡(luò)構(gòu)造、訓(xùn)練和剪枝規(guī)則提取與評估規(guī)則提取與評估12123 3 基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘網(wǎng)絡(luò)構(gòu)造、訓(xùn)練和剪枝:網(wǎng)絡(luò)構(gòu)造、訓(xùn)練和剪枝:這個(gè)階段需要選擇擬采用的網(wǎng)絡(luò)模型,選擇或設(shè)計(jì)一種網(wǎng)絡(luò)訓(xùn)練算法。訓(xùn)練后的網(wǎng)絡(luò)可能有些臃腫,剪枝就是在不影響網(wǎng)絡(luò)準(zhǔn)確性的前提下,將網(wǎng)絡(luò)中冗余的連接和結(jié)點(diǎn)去掉。沒有冗余結(jié)點(diǎn)和連接的網(wǎng)絡(luò)產(chǎn)生的模式更精練和更易于理解。13133 3 基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘規(guī)則提取和評估:規(guī)則提取和評估:這一階段從
6、進(jìn)化后產(chǎn)生的相對簡單的網(wǎng)絡(luò)中提取分類規(guī)則。規(guī)則提取目的就是從網(wǎng)絡(luò)中提取規(guī)則,并轉(zhuǎn)換為某種易理解的形式表達(dá)出來,如決策樹、模糊邏輯等方法。再利用測試樣本對規(guī)則的可靠性進(jìn)行測試與評估,最后輸出有用知識(shí)。14143 3 基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘適合神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘問題:適合神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘問題:分類分類是數(shù)據(jù)挖掘的一個(gè)主要問題。單層感知器的線性可分能力早已證明,但是對于非線性可分問題單層網(wǎng)絡(luò)是無能為力的??赏ㄟ^加入中間層,引入轉(zhuǎn)換函數(shù),將非分線性可分的問題映射后變?yōu)榫€性可分。一個(gè)多層的神經(jīng)網(wǎng)絡(luò)具有非常強(qiáng)的分類能力,并且分類誤差率較低。15153 3 基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘基于
7、神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘適合神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘問題:適合神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘問題:時(shí)序預(yù)測時(shí)序預(yù)測是依據(jù)當(dāng)前已知的數(shù)據(jù)來預(yù)測將來未知數(shù)據(jù)的狀態(tài)。神經(jīng)網(wǎng)絡(luò)固有的輸人輸出映射特性,特別適合用來建立預(yù)測模型。不管是線性問題還是非線性問題,只要輸入輸出間存在連續(xù)映射關(guān)系,就可以用一個(gè)多層神經(jīng)網(wǎng)絡(luò)以任意精度來逼近之。16163 3 基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘適合神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘問題:適合神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘問題:聚類聚類是無監(jiān)督學(xué)習(xí)過程,它依據(jù)數(shù)據(jù)間的相似度將數(shù)據(jù)集劃分為不同的簇。目的是概觀數(shù)據(jù)的全貌,了解數(shù)據(jù)點(diǎn)的分布情況以及可能存在的問題。17174 4 結(jié)論結(jié)論神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn):神經(jīng)網(wǎng)絡(luò)的優(yōu)
8、點(diǎn):非用戶驅(qū)動(dòng),用戶參與少,挖掘?qū)哟紊?。處理變量較多,能處理定性變量,復(fù)雜、動(dòng)態(tài)數(shù)據(jù),發(fā)現(xiàn)的事實(shí)或規(guī)則是以描述和可視性為主要目的。分布記憶性和快速的計(jì)算能力。18184 4 結(jié)論結(jié)論神經(jīng)網(wǎng)絡(luò)的不足:神經(jīng)網(wǎng)絡(luò)的不足:非數(shù)值型數(shù)據(jù)的處理:非數(shù)值型數(shù)據(jù)的處理:量化此類數(shù)據(jù)往往憑人們主觀經(jīng)驗(yàn)而定,如果不能按實(shí)際情況進(jìn)行量化,將影響挖掘結(jié)果。數(shù)據(jù)質(zhì)量:數(shù)據(jù)質(zhì)量:由于某些數(shù)據(jù)具有冗余或不完整性,致使產(chǎn)生的規(guī)則存在不真實(shí)和異常等問題。19194 4 結(jié)論結(jié)論神經(jīng)網(wǎng)絡(luò)的不足:神經(jīng)網(wǎng)絡(luò)的不足:權(quán)值和閾值初值的確定:權(quán)值和閾值初值的確定:權(quán)值和閾值的初值影響算法的迭代次數(shù)和學(xué)習(xí)結(jié)果。學(xué)習(xí)樣本的大小:學(xué)習(xí)樣本的大?。簩τ跀?shù)據(jù)量較小的數(shù)據(jù)庫,可能出現(xiàn)錯(cuò)誤的結(jié)果,這時(shí)就可以把這些數(shù)據(jù)作為新樣本補(bǔ)充到學(xué)習(xí)樣本中去。20204 4 結(jié)論結(jié)論神經(jīng)網(wǎng)絡(luò)的不足:神經(jīng)網(wǎng)絡(luò)的不足:激勵(lì)函數(shù)的選?。杭?lì)函數(shù)的選?。杭?lì)函數(shù)是對多個(gè)輸入進(jìn)行處理產(chǎn)生輸出的功能模塊,它將關(guān)系到結(jié)果是有價(jià)值和真實(shí)。對于數(shù)據(jù)庫中模糊知識(shí)的發(fā)現(xiàn),往先對輸出狀態(tài)進(jìn)行編碼,采用符號(hào)函數(shù)作為激勵(lì)數(shù)。神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度問題:神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度問題:構(gòu)造神經(jīng)網(wǎng)絡(luò)時(shí)要求對其訓(xùn)練許多遍,這意味著獲得精確的神經(jīng)網(wǎng)絡(luò)需要花費(fèi)許多
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 賓館承包合同協(xié)議書寫法
- 臨時(shí)工聘用合同樣本
- 2024廣告服務(wù)合同模板
- 無擔(dān)保眼鏡購買分期付款合同范本
- 2024公寓租賃合同模板【公寓租賃合同】
- 城市糧食采購合同模板
- 服裝行業(yè)銷售管理系統(tǒng)經(jīng)銷合同
- 環(huán)保工程維保合同模板
- 高校畢業(yè)就業(yè)協(xié)議書樣本
- 商標(biāo)許可協(xié)議書
- 高中語文人教版高中必修文言文定語后置
- 傳統(tǒng)孝道人物虞舜
- 確定積極分子會(huì)議記錄范文七篇
- 長江三峽水利樞紐可行性報(bào)告
- 江蘇省某高速公路結(jié)構(gòu)物臺(tái)背回填監(jiān)理細(xì)則
- 電大護(hù)理本科臨床實(shí)習(xí)手冊內(nèi)容(原表)
- 當(dāng)代德國學(xué)校勞動(dòng)教育課程構(gòu)建的經(jīng)驗(yàn)與啟示共3篇
- “小金庫”治理與防范 習(xí)題及答案
- 王偉核桃經(jīng)濟(jì)價(jià)值及加工利用
- 新生兒胎糞吸入綜合征臨床路徑標(biāo)準(zhǔn)住院流程及路徑表單
- 氯化鈉特性表
評論
0/150
提交評論