數(shù)據(jù)挖掘技術(shù)在水利工程管理中的應(yīng)用實(shí)踐_第1頁
數(shù)據(jù)挖掘技術(shù)在水利工程管理中的應(yīng)用實(shí)踐_第2頁
數(shù)據(jù)挖掘技術(shù)在水利工程管理中的應(yīng)用實(shí)踐_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)挖掘技術(shù)在水利工程管理中的應(yīng)用實(shí)踐摘要:隨著我國經(jīng)濟(jì)水平的發(fā)展,科技的進(jìn)步,水利工程發(fā)展十分迅猛。在水 利工程管理中,通過數(shù)據(jù)挖掘技術(shù),能夠在大量數(shù)據(jù)中搜尋到有價(jià)值的信息,通 過對(duì)信息的合理利用,使得水利工程管理更加高效、更加科學(xué)。本文對(duì)數(shù)據(jù)挖掘 技術(shù)在水利工程管理中應(yīng)用進(jìn)行深入探究,對(duì)其中的管理要點(diǎn)進(jìn)行充分分析,意 在為同行業(yè)者起到借鑒作用。關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);水利工程;應(yīng)用實(shí)踐改革開放以來,我國科技水平快速發(fā)展,經(jīng)濟(jì)水平也在不斷提高,水利工程 基礎(chǔ)設(shè)施也在進(jìn)一步完善當(dāng)中。在水利工程中,數(shù)據(jù)挖掘技術(shù)應(yīng)用廣泛,能夠在 大量信息中快速建立數(shù)據(jù)模型,進(jìn)而提升水利工程管理效率,讓水利工程管理更

2、 加趨于高效化、科學(xué)化。一、數(shù)據(jù)挖掘技術(shù)的定義與應(yīng)用(一)數(shù)據(jù)挖掘技術(shù)的定義科技的快速發(fā)展和數(shù)據(jù)的存儲(chǔ)技術(shù)的快速進(jìn)步,使得各種行業(yè)或組織的數(shù)據(jù) 得以海量積累。但是,從海量的數(shù)據(jù)當(dāng)中,提取有用的信息成為了一個(gè)難題。在 海量數(shù)據(jù)面前,傳統(tǒng)的數(shù)據(jù)分析工具和方法很無力。由此,數(shù)據(jù)挖掘技術(shù)就登上 了歷史的舞臺(tái)。數(shù)據(jù)挖掘是一種技術(shù),將傳統(tǒng)的數(shù)據(jù)分析方法與處理大量數(shù)據(jù)的 復(fù)雜算法相結(jié)合,從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提 取隱含在其中的、人們事先不知道的、但又是潛在有用信息和知識(shí)的過程。(二)數(shù)據(jù)挖掘技術(shù)的應(yīng)用數(shù)據(jù)挖掘技術(shù)應(yīng)用廣泛,如:在交通領(lǐng)域,幫助鐵路票價(jià)制定、交通流量預(yù) 測(cè)等;在生

3、物學(xué)當(dāng)中,挖掘基因與疾病之間的關(guān)系、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、代謝途徑 預(yù)測(cè)等;在金融行業(yè)當(dāng)中,股票指數(shù)追蹤、稅務(wù)稽查等方面有重要運(yùn)用;在電子 商務(wù)領(lǐng)域,對(duì)顧客行為分析、定向營銷、定向廣告投放、誰是最有價(jià)值的用戶、 什么產(chǎn)品搭配銷售等??梢哉f,有數(shù)據(jù)的方法,就有數(shù)據(jù)挖掘的用武之地。在水利工程管理中,對(duì)技術(shù)人員有較高的技術(shù)要求,必須能夠靈活運(yùn)用數(shù)據(jù) 挖掘技術(shù),才能在大量信息中及時(shí)發(fā)現(xiàn)有價(jià)值的數(shù)據(jù)。水利工程管理中的數(shù)據(jù)挖 掘技術(shù)可分為以下幾種類別:其一,在大量數(shù)據(jù)中抽樣選取部分?jǐn)?shù)據(jù),對(duì)此部分?jǐn)?shù)據(jù)進(jìn)行檢測(cè),將檢測(cè)結(jié) 果與參考數(shù)據(jù)進(jìn)行比對(duì),找出之間的差異,通過差異深度挖掘所有數(shù)據(jù),進(jìn)而找 出其中具有價(jià)值的信息。

4、其二,對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)性挖掘。數(shù)據(jù)會(huì)通過事物發(fā)展不斷產(chǎn)生變化,因此, 在使用數(shù)據(jù)挖掘技術(shù),應(yīng)該先要尋找到數(shù)據(jù)變化的規(guī)律,通過變化規(guī)律對(duì)所有數(shù) 據(jù)進(jìn)行檢測(cè),將檢測(cè)結(jié)果在所有數(shù)據(jù)中進(jìn)行篩選,找出與檢測(cè)結(jié)果最為相近的數(shù) 據(jù),進(jìn)而達(dá)到挖掘目的。其三,要準(zhǔn)確把握數(shù)據(jù)間存在的內(nèi)在聯(lián)系。在面對(duì)不計(jì)其數(shù)的數(shù)據(jù)時(shí),通過 數(shù)據(jù)間的內(nèi)在聯(lián)系能夠準(zhǔn)確定位特殊數(shù)據(jù),通過這種聯(lián)系對(duì)數(shù)據(jù)進(jìn)行分析處理, 能夠有效提升挖掘數(shù)據(jù)的精準(zhǔn)性。其四,在進(jìn)行數(shù)據(jù)挖掘過程中,除了以上三點(diǎn)提到的挖掘方法,還可將大量 數(shù)據(jù)進(jìn)行歸納合并。根據(jù)數(shù)據(jù)固有特征,將特征相同或變化規(guī)律相同的數(shù)據(jù)分為 一類,將特征不同或變化規(guī)律有別于其他數(shù)據(jù)的分為一類。將所

5、有數(shù)據(jù)歸納合并 之后,進(jìn)行組別間的數(shù)據(jù)挖掘,能夠避免數(shù)據(jù)重復(fù)挖掘,提高數(shù)據(jù)挖掘效率。二、數(shù)據(jù)挖掘具體實(shí)施方法(一)收集信息收集信息不能盲目,要在充分了解水利工程管理目標(biāo)的情況下進(jìn)行。通過對(duì) 收集的數(shù)據(jù)信息進(jìn)行分析,明確信息數(shù)據(jù)的目標(biāo),選擇與實(shí)際數(shù)據(jù)相符合的收集 方式,將信息儲(chǔ)存到數(shù)據(jù)庫中。(二)信息集成信息集成也成為共享信息,是把不同格式、來源、特點(diǎn)性質(zhì)的數(shù)據(jù)在邏輯上 或物理上有機(jī)地集中,從而為水利工程管理提供全面的數(shù)據(jù)共享。(三)數(shù)據(jù)歸約數(shù)據(jù)歸約是在保持?jǐn)?shù)據(jù)原貌的前提下,最大限度地精簡(jiǎn)數(shù)據(jù)量。其目的就是 提升數(shù)據(jù)挖掘效率,對(duì)信息來源進(jìn)行有效處理。如果不對(duì)數(shù)據(jù)來源進(jìn)行歸約,即 使只是少量的數(shù)據(jù)

6、,也需要進(jìn)行復(fù)雜的數(shù)據(jù)分析扣挖掘時(shí)間。這時(shí)就需要對(duì)數(shù)據(jù) 源頭進(jìn)行歸約,歸約后的數(shù)據(jù)雖然小,但仍能完整保留原始數(shù)據(jù)樣貌,這樣,數(shù) 據(jù)挖掘效率將大幅上升將更有效,并產(chǎn)生相同的分析結(jié)果。(四)整理數(shù)據(jù)在數(shù)據(jù)庫中存儲(chǔ)的信息,容易造成數(shù)據(jù)屬性和表述方式不一致的現(xiàn)象,需要 對(duì)此類數(shù)據(jù)進(jìn)行整理。應(yīng)選則合適的整理方式對(duì)丟失的信息進(jìn)行彌補(bǔ),對(duì)數(shù)據(jù)中 的噪音數(shù)據(jù)進(jìn)行進(jìn)行處理,確保數(shù)據(jù)庫中數(shù)據(jù)的完整性與統(tǒng)一性。(五)交換數(shù)據(jù)數(shù)據(jù)交換通過合理的方式,對(duì)所有參與分析的數(shù)據(jù)進(jìn)行分析,并將分析結(jié)果 轉(zhuǎn)換成與挖掘技術(shù)相符的數(shù)據(jù)模型。(六)挖掘數(shù)據(jù)數(shù)據(jù)挖掘需要出現(xiàn)海量數(shù)據(jù)、計(jì)算機(jī)技術(shù)大數(shù)據(jù)量的處理能力、計(jì)算機(jī)存儲(chǔ) 于計(jì)算能力、

7、交叉學(xué)科的發(fā)展等條件。在數(shù)據(jù)分析過程中,選擇適合的分析工具, 通過統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法和數(shù)據(jù)庫方法等數(shù)據(jù)技術(shù)處理方法, 對(duì)數(shù)據(jù)庫中的所有數(shù)據(jù)進(jìn)行技術(shù)處理,準(zhǔn)確獲得其中有價(jià)值的信息。(七)評(píng)估模式為了得到準(zhǔn)確的數(shù)據(jù)信息,要通過合理的評(píng)估方式對(duì)所挖掘的數(shù)據(jù)進(jìn)行反復(fù) 對(duì)比,進(jìn)而確保數(shù)據(jù)信息的準(zhǔn)確性。(八)成果表示成果表示是利用專業(yè)化的方式對(duì)數(shù)據(jù)信息進(jìn)行實(shí)時(shí)共享。三、水利工程管理數(shù)據(jù)挖掘模型的建立方式對(duì)于水利工程來說,其管理復(fù)雜,數(shù)據(jù)挖掘需要相關(guān)人員具備大量技術(shù)儲(chǔ)備, 從多學(xué)科入手,利用技術(shù)人員的專業(yè)知識(shí)準(zhǔn)確分析挖掘數(shù)據(jù)的準(zhǔn)確性,進(jìn)而從大 量信息中快速找到可利用的信息。所以,在水利工程

8、管理數(shù)據(jù)挖掘中,要建立起 半自動(dòng)層次系統(tǒng)對(duì)數(shù)據(jù)進(jìn)行深度挖掘。該模型的建立有以下幾點(diǎn):(一)建立完整的用戶界面。利用顯示裝置將數(shù)據(jù)反映出來,對(duì)挖掘數(shù)據(jù)能 夠快速查詢,將查詢結(jié)果通過用戶界面顯示出來。(二)建立OLAP/OLAM。其功能就是能夠?qū)?shù)據(jù)庫中是所有數(shù)據(jù)進(jìn)行集中存 儲(chǔ),在OLAP/OLAM中進(jìn)行數(shù)據(jù)分析,是整個(gè)水利工程管理數(shù)據(jù)挖掘模型建立的 核心。(三)信息存儲(chǔ)是構(gòu)建水利工程管理數(shù)據(jù)挖掘模型的基礎(chǔ),不僅能將所有挖 掘數(shù)據(jù)進(jìn)行有效存儲(chǔ),還能進(jìn)場(chǎng)信息集成操作,對(duì)過濾機(jī)進(jìn)行及時(shí)清理。(四)將所挖掘的數(shù)據(jù)通過數(shù)據(jù)庫進(jìn)行存儲(chǔ)之后,數(shù)據(jù)庫能夠?qū)?shù)據(jù)的源頭 進(jìn)行準(zhǔn)確分析。四、將水利工程管理數(shù)據(jù)挖掘模型

9、與GIS系統(tǒng)進(jìn)行結(jié)合將水利工程管理數(shù)據(jù)挖掘模型與GIS系統(tǒng)進(jìn)行結(jié)合的方式主要有三種,分別 是嵌入式、松散和緊密耦合式。(一)在對(duì)數(shù)據(jù)進(jìn)行空間層面的挖掘中,GIS系統(tǒng)具備對(duì)數(shù)據(jù)進(jìn)行強(qiáng)大處理的 功能。GIS系統(tǒng)與數(shù)據(jù)挖掘技術(shù)有機(jī)結(jié)合,能夠形成一個(gè)較為完整的控制系統(tǒng)。 通過嵌入式的應(yīng)用,在進(jìn)行數(shù)據(jù)空間層面挖掘時(shí),即使是對(duì)完整度不高的數(shù)據(jù)也 能進(jìn)行有效的處理。其優(yōu)點(diǎn)就是能夠減少數(shù)據(jù)挖掘工作量,降低數(shù)據(jù)挖掘難度。 缺點(diǎn)同樣明顯,嵌入式必須在指定的系統(tǒng)中才能正常運(yùn)行,不能進(jìn)行系統(tǒng)間的轉(zhuǎn) 移,會(huì)給不同客戶間的需求造成影響,限制系統(tǒng)的開發(fā)。(二)挖掘數(shù)據(jù)系統(tǒng)和GIS系統(tǒng)是兩個(gè)互相獨(dú)立的系統(tǒng)。挖掘數(shù)據(jù)系統(tǒng)通過 變換的方式對(duì)數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行挖掘;而松散耦合式能夠不借助GIS系統(tǒng),自 主完成數(shù)據(jù)挖掘工作。但進(jìn)行數(shù)據(jù)空間層面的挖掘時(shí),難度明顯提高。(三)將嵌入式與松散耦合式結(jié)合就形成了緊密耦合式。其綜合了嵌入式與 松散耦合式的優(yōu)勢(shì),不僅能對(duì)數(shù)據(jù)進(jìn)行空間層面的挖掘,降低難度,而且不受不 同客戶間的需求造成影響,靈活性較高。但過度依賴GIS系統(tǒng),容易受到其他系 統(tǒng)的影響。所以要在明確水利工程管理目標(biāo)的基礎(chǔ)上,結(jié)合自身實(shí)際狀況,合理 選擇緊密耦合式系統(tǒng),提升數(shù)據(jù)挖掘效率。結(jié)束語綜上所述,利用數(shù)據(jù)挖掘技術(shù)能夠提升水利工程管理水平,發(fā)揮水利工程最 大作用,提升人民生活水平

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論