論文開題報(bào)告-數(shù)據(jù)挖掘技術(shù)的應(yīng)用_第1頁
論文開題報(bào)告-數(shù)據(jù)挖掘技術(shù)的應(yīng)用_第2頁
論文開題報(bào)告-數(shù)據(jù)挖掘技術(shù)的應(yīng)用_第3頁
論文開題報(bào)告-數(shù)據(jù)挖掘技術(shù)的應(yīng)用_第4頁
論文開題報(bào)告-數(shù)據(jù)挖掘技術(shù)的應(yīng)用_第5頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

PAGEPAGE0在職攻讀碩士學(xué)位研究生開題報(bào)告學(xué)號(hào):研究生類別:□高校教師□工程碩士□同等學(xué)歷研究生:班劍鋒導(dǎo)師:王燕研究方向:智能信息處理論文題目:數(shù)據(jù)挖掘技術(shù)在鋁電解質(zhì)量管理中的應(yīng)用專業(yè)(學(xué)科):計(jì)算機(jī)技術(shù)學(xué)院:計(jì)算機(jī)與通信學(xué)院入學(xué)時(shí)間:2007年4月開題時(shí)間:年月日年月日填報(bào)說明一、開題報(bào)告中的一至七項(xiàng)必須采用計(jì)算機(jī)輸入和打印,開題報(bào)告格式可在研究生部網(wǎng)址http://www./yanjiusheng/download/download.htm下載。二、開題報(bào)告為A4大小,于左側(cè)裝訂成冊(cè)。各欄空格不夠時(shí),請(qǐng)自行加頁。三、開題答辯成績(jī)(即每個(gè)學(xué)生開題報(bào)告評(píng)審表的平均成績(jī))由學(xué)院研究生專干填寫,學(xué)院負(fù)責(zé)人簽署是否同意開題的意見。五、開題報(bào)告通過后,分別由研究生、導(dǎo)師、學(xué)院和研究生部各存檔一份。PAGEPAGE1

學(xué)位論文題目數(shù)據(jù)挖掘技術(shù)在鋁電解質(zhì)量管理中的應(yīng)用課題來源根據(jù)工作實(shí)踐自擬一、課題意義及國內(nèi)外研究現(xiàn)狀綜述1、課題意義近十幾年來,人們利用信息技術(shù)生產(chǎn)和搜集數(shù)據(jù)的能力大幅度提高,千萬萬個(gè)數(shù)據(jù)庫被用于商業(yè)管理、政府辦公、科學(xué)研究和工程開發(fā)等等,這一勢(shì)頭仍將持續(xù)發(fā)展下去。于是,一個(gè)新的挑戰(zhàn)被提了出來:在這被稱之為信息爆炸的時(shí)代,信息過量幾乎成為人人需要面對(duì)的問題。如何才能不被信息的汪洋大海所淹沒,從中及時(shí)發(fā)現(xiàn)有用的知識(shí),提高信息利用率呢?要想使數(shù)據(jù)真正成為一個(gè)公司的資源,只有充分利用它為公司自身的業(yè)務(wù)決策和戰(zhàn)略發(fā)展服務(wù)才行,否則大量的數(shù)據(jù)可能成為包袱,甚至成為垃圾。因此,面對(duì)"人們被數(shù)據(jù)淹沒,人們卻饑餓于知識(shí)"的挑戰(zhàn),數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)(DMKD)技術(shù)應(yīng)運(yùn)而生,并得以蓬勃發(fā)展,越來越顯示出其強(qiáng)大的生命力。

數(shù)據(jù)挖掘(DataMining)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。還有很多和這一術(shù)語相近似的術(shù)語,如從數(shù)據(jù)庫中發(fā)現(xiàn)知識(shí)(KDD)、數(shù)據(jù)分析、數(shù)據(jù)融合(DataFusion)以及決策支持等。人們把原始數(shù)據(jù)看作是形成知識(shí)的源泉,就像從礦石中采礦一樣。原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系數(shù)據(jù)庫中的數(shù)據(jù),也可以是半結(jié)構(gòu)化的,如文本、圖形、圖像數(shù)據(jù),甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識(shí)的方法可以是數(shù)學(xué)的,也可以是非數(shù)學(xué)的;可以是演繹的,也可以是歸納的。發(fā)現(xiàn)了的知識(shí)可以被用于信息管理、查詢優(yōu)化、決策支持、過程控制等,還可以用于數(shù)據(jù)自身的維護(hù)。因此,數(shù)據(jù)挖掘是一門很廣義的交叉學(xué)科,它匯聚了不同領(lǐng)域的研究者,尤其是數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計(jì)、可視化、并行計(jì)算等方面的學(xué)者和工程技術(shù)人員。

質(zhì)量管理是企業(yè)管理的一個(gè)重要組成部分,傳統(tǒng)的以紙介質(zhì)為媒介的手工質(zhì)量管理方式和方法面臨著前所未有的挑戰(zhàn)。由于鋁電解冶煉行業(yè)的特點(diǎn),在生產(chǎn)過程中會(huì)產(chǎn)生大量與質(zhì)量有關(guān)的數(shù)據(jù),如何管理好這些數(shù)據(jù)成為眾多鋁電解企業(yè)所必須面對(duì)的問題。目前,國內(nèi)鋁電解企業(yè)所建立的質(zhì)量管理信息系統(tǒng)水平參差不齊,一部分企業(yè)只建立了基于單機(jī)系統(tǒng)的簡(jiǎn)單質(zhì)量數(shù)據(jù)管理系統(tǒng),系統(tǒng)沒有覆蓋質(zhì)量管理的全部流程,大部分業(yè)務(wù)還是以紙介質(zhì)傳遞為主;一部分企業(yè)建立了基于網(wǎng)絡(luò)的質(zhì)量管理信息系統(tǒng),數(shù)據(jù)實(shí)現(xiàn)了網(wǎng)上傳遞,但對(duì)質(zhì)量數(shù)據(jù)的應(yīng)用,僅限于打印和簡(jiǎn)單的查詢,并沒有應(yīng)用科學(xué)的分析方法對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步的深度分析。采用C/S與B/S技術(shù)相結(jié)合,運(yùn)用數(shù)據(jù)挖掘技術(shù)的質(zhì)量管理信息系統(tǒng)既可以解決質(zhì)量數(shù)據(jù)網(wǎng)上傳遞問題又可以對(duì)質(zhì)量數(shù)據(jù)進(jìn)行有效的科學(xué)分析,對(duì)鋁電解企業(yè)具有非常重要的意義。2、國內(nèi)外研究現(xiàn)狀綜述KDD一詞首次出現(xiàn)在1989年8月舉行的第11屆國際聯(lián)合人工智能學(xué)術(shù)會(huì)議上。迄今為止,由美國人工智能協(xié)會(huì)主辦的KDD國際研討會(huì)已經(jīng)召開了7次,規(guī)模由原來的專題討論會(huì)發(fā)展到國際學(xué)術(shù)大會(huì),人數(shù)由二三十人到七八百人,研究重點(diǎn)也逐漸從發(fā)現(xiàn)方法轉(zhuǎn)向系統(tǒng)應(yīng)用,并且注重多種發(fā)現(xiàn)策略和技術(shù)的集成,以及多種學(xué)科之間的相互滲透。此外,數(shù)據(jù)庫、人工智能、信息處理、知識(shí)工程等領(lǐng)域的國際學(xué)術(shù)刊物也紛紛開辟了KDD專題或?qū)??。IEEE的KnowledgeandDataEngineering會(huì)刊領(lǐng)先在1993年出版了KDD技術(shù)???所發(fā)表的5篇論文代表了當(dāng)時(shí)KDD研究的最新成果和動(dòng)態(tài),較全面地論述了KDD系統(tǒng)方法論、發(fā)現(xiàn)結(jié)果的評(píng)價(jià)、KDD系統(tǒng)設(shè)計(jì)的邏輯方法,集中討論了鑒于數(shù)據(jù)庫的動(dòng)態(tài)性冗余、高噪聲和不確定性、空值等問題,KDD系統(tǒng)與其它傳統(tǒng)的機(jī)器學(xué)習(xí)、專家系統(tǒng)、人工神經(jīng)網(wǎng)絡(luò)、數(shù)理統(tǒng)計(jì)分析系統(tǒng)的聯(lián)系和區(qū)別,以及相應(yīng)的基本對(duì)策。目前,數(shù)據(jù)挖掘技術(shù)在鋁電解質(zhì)量管理方面的應(yīng)用研究,主要集中在對(duì)系統(tǒng)產(chǎn)生的日?qǐng)?bào)數(shù)據(jù)進(jìn)行分析,利用決策樹技術(shù)對(duì)報(bào)表數(shù)據(jù)進(jìn)行處理,發(fā)現(xiàn)陽升時(shí)間、氧化鋁加料量、陽降時(shí)間影響陽極效應(yīng)的發(fā)生,可以根據(jù)給出的決策樹模型找到減少效應(yīng)發(fā)生概率的有效途徑。工作電壓、效應(yīng)持續(xù)時(shí)間和效應(yīng)電壓會(huì)影響電解槽的平均電壓,可以用數(shù)據(jù)挖掘方法來處理鋁電解中大量的報(bào)表數(shù)據(jù),從這些大量數(shù)據(jù)中獲取降低能耗和成本的方法,并根據(jù)效應(yīng)持續(xù)時(shí)間對(duì)平均電壓進(jìn)行預(yù)測(cè)。但是,鋁電解生產(chǎn)是一個(gè)復(fù)雜的過程,影響最終成品質(zhì)量的因素不僅包括電解槽生產(chǎn)過程的條件,還包括原輔材料質(zhì)量、原鋁質(zhì)量、成品質(zhì)量、炭塊質(zhì)量、鑄造配比等多方面因素。因此,建立一個(gè)覆蓋鋁電解生產(chǎn)全過程的質(zhì)量數(shù)據(jù)挖掘系統(tǒng),利用分類、聚類、關(guān)聯(lián)規(guī)則等方法發(fā)現(xiàn)各種數(shù)據(jù)之間的內(nèi)在聯(lián)系,從而總結(jié)出指導(dǎo)鋁電解實(shí)際生產(chǎn)的最佳實(shí)踐。隨著DMKD研究逐步走向深入,人們?cè)絹碓角宄卣J(rèn)識(shí)到,DMKD的研究主要有3個(gè)技術(shù)支柱,即數(shù)據(jù)庫、人工智能和數(shù)理統(tǒng)計(jì)。數(shù)據(jù)庫技術(shù)在經(jīng)過了80年代的輝煌之后,已經(jīng)在各行各業(yè)成為一種數(shù)據(jù)庫文化或時(shí)尚,數(shù)據(jù)庫界目前除了關(guān)注萬維網(wǎng)數(shù)據(jù)庫、分布式數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫、多媒體數(shù)據(jù)庫、查詢優(yōu)化和并行計(jì)算等技術(shù)外,已經(jīng)在開始反思。數(shù)據(jù)庫最實(shí)質(zhì)的應(yīng)用僅僅是查詢嗎?理論根基最深的關(guān)系數(shù)據(jù)庫最本質(zhì)的技術(shù)進(jìn)步點(diǎn),就是數(shù)據(jù)存放和數(shù)據(jù)使用之間的相互分離。查詢是數(shù)據(jù)庫的奴隸,發(fā)現(xiàn)才是數(shù)據(jù)庫的主人;數(shù)據(jù)只為職員服務(wù),不為老板服務(wù)!這是很多單位的領(lǐng)導(dǎo)在熱心數(shù)據(jù)庫建設(shè)后發(fā)出的感嘆。由于數(shù)據(jù)庫文化的迅速普及,用數(shù)據(jù)庫作為知識(shí)源具有堅(jiān)實(shí)的基礎(chǔ);另一方面,對(duì)于一個(gè)感興趣的特定領(lǐng)域——客觀世界,先用數(shù)據(jù)庫技術(shù)將其形式化并組織起來,就會(huì)大大提高知識(shí)獲取起點(diǎn),以后從中發(fā)掘或發(fā)現(xiàn)的所有知識(shí)都是針對(duì)該數(shù)據(jù)庫而言的。因此,在需求的驅(qū)動(dòng)下,很多數(shù)據(jù)庫學(xué)者轉(zhuǎn)向?qū)?shù)據(jù)倉庫和數(shù)據(jù)挖掘的研究,從對(duì)演繹數(shù)據(jù)庫的研究轉(zhuǎn)向?qū)w納數(shù)據(jù)庫的研究。

專家系統(tǒng)曾經(jīng)是人工智能研究工作者的驕傲。專家系統(tǒng)實(shí)質(zhì)上是一個(gè)問題求解系統(tǒng),目前的主要理論工具是基于謂詞演算的機(jī)器定理證明技術(shù)——二階演繹系統(tǒng)。領(lǐng)域?qū)<议L期以來面向一個(gè)特定領(lǐng)域的經(jīng)驗(yàn)世界,通過人腦的思維活動(dòng)積累了大量有用信息。在研制一個(gè)專家系統(tǒng)時(shí),知識(shí)工程師首先要從領(lǐng)域?qū)<夷抢铽@取知識(shí),這一過程實(shí)質(zhì)上是歸納過程,是非常復(fù)雜的個(gè)人到個(gè)人之間的交互過程,有很強(qiáng)的個(gè)性和隨機(jī)性。因此,知識(shí)獲取成為專家系統(tǒng)研究中公認(rèn)的瓶頸問題。

其次,知識(shí)工程師在整理表達(dá)從領(lǐng)域?qū)<夷抢铽@得的知識(shí)時(shí),用if-then等類的規(guī)則表達(dá),約束性太大,用常規(guī)數(shù)理邏輯來表達(dá)社會(huì)現(xiàn)象和人的思維活動(dòng)局限性太大,也太困難,勉強(qiáng)抽象出來的規(guī)則有很強(qiáng)的工藝色彩,差異性極大,知識(shí)表示又成為一大難題。

此外,即使某個(gè)領(lǐng)域的知識(shí)通過一定手段獲取并表達(dá)了,但這樣做成的專家系統(tǒng)對(duì)常識(shí)和百科知識(shí)出奇地貧乏,而人類專家的知識(shí)是以擁有大量常識(shí)為基礎(chǔ)的。人工智能學(xué)家Feigenbaum估計(jì),一般人擁有的常識(shí)存入計(jì)算機(jī)大約有100萬條事實(shí)和抽象經(jīng)驗(yàn)法則,離開常識(shí)的專家系統(tǒng)有時(shí)會(huì)比傻子還傻。例如戰(zhàn)場(chǎng)指揮員會(huì)根據(jù)"在某地發(fā)現(xiàn)一只剛死的波斯貓"的情報(bào)很快斷定敵高級(jí)指揮所的位置,而再好的軍事專家系統(tǒng)也難以顧全到如此的信息。

以上這3大難題大大限制了專家系統(tǒng)的應(yīng)用,使得專家系統(tǒng)目前還停留在構(gòu)造諸如發(fā)動(dòng)機(jī)故障論斷一類的水平上。人工智能學(xué)者開始著手基于案例的推理,尤其是從事機(jī)器學(xué)習(xí)的科學(xué)家們,不再滿足自己構(gòu)造的小樣本學(xué)習(xí)模式的象牙塔,開始正視現(xiàn)實(shí)生活中大量的、不完全的、有噪聲的、模糊的、隨機(jī)的大數(shù)據(jù)樣本,也走上了數(shù)據(jù)挖掘的道路。

數(shù)理統(tǒng)計(jì)是應(yīng)用數(shù)學(xué)中最重要、最活躍的學(xué)科之一,它在計(jì)算機(jī)發(fā)明之前就誕生了,迄今已有幾百年的發(fā)展歷史。如今相當(dāng)強(qiáng)大有效的數(shù)理統(tǒng)計(jì)方法和工具,已成為信息咨詢業(yè)的基礎(chǔ)。信息時(shí)代,咨詢業(yè)更為發(fā)達(dá)。然而,數(shù)理統(tǒng)計(jì)和數(shù)據(jù)庫技術(shù)結(jié)合得并不算快,數(shù)據(jù)庫查詢語言SQL中的聚合函數(shù)功能極其簡(jiǎn)單,就是一個(gè)證明。咨詢業(yè)用數(shù)據(jù)庫查詢數(shù)據(jù)還遠(yuǎn)遠(yuǎn)不夠。一旦人們有了從數(shù)據(jù)查詢到知識(shí)發(fā)現(xiàn)、從數(shù)據(jù)演繹到數(shù)據(jù)歸納的要求,概率論和數(shù)理統(tǒng)計(jì)就獲得了新的生命力,所以才會(huì)在DMKD這個(gè)結(jié)合點(diǎn)上,立即呈現(xiàn)出"忽如一夜春風(fēng)來,千樹萬樹梨花開"的繁榮景象。一向以數(shù)理統(tǒng)計(jì)工具和可視化計(jì)算聞名的美國SAS公司,領(lǐng)先宣布進(jìn)入DMKD行列。

數(shù)據(jù)挖掘所能發(fā)現(xiàn)的知識(shí)有如下幾種:廣義型知識(shí),反映同類事物共同性質(zhì)的知識(shí);特征型知識(shí),反映事物各方面的特征知識(shí);差異型知識(shí),反映不同事物之間屬性差別的知識(shí);關(guān)聯(lián)型知識(shí),反映事物之間依賴或關(guān)聯(lián)的知識(shí);預(yù)測(cè)型知識(shí),根據(jù)歷史的和當(dāng)前的數(shù)據(jù)推測(cè)未來數(shù)據(jù);偏離型知識(shí),揭示事物偏離常規(guī)的異常現(xiàn)象。所有這些知識(shí)都可以在不同的概念層次上被發(fā)現(xiàn),隨著概念樹的提升,從微觀到中觀再到宏觀,以滿足不同用戶、不同層次決策的需要。當(dāng)前,DMKD研究正方興未艾,預(yù)計(jì)在21世紀(jì)還會(huì)形成更大的高潮,研究焦點(diǎn)可能會(huì)集中到以下幾個(gè)方面:研究專門用于知識(shí)發(fā)現(xiàn)的數(shù)據(jù)挖掘語言,也許會(huì)像SQL語言一樣走向形式化和標(biāo)準(zhǔn)化;尋求數(shù)據(jù)挖掘過程中的可視化方法,使得知識(shí)發(fā)現(xiàn)的過程能夠被用戶理解,也便于在知識(shí)發(fā)現(xiàn)過程中的人機(jī)交互;研究在網(wǎng)絡(luò)環(huán)境下的數(shù)據(jù)挖掘技術(shù),特別是在Internet上建立DMKD服務(wù)器,與數(shù)據(jù)庫服務(wù)器配合,實(shí)現(xiàn)數(shù)據(jù)挖掘;加強(qiáng)對(duì)各種非結(jié)構(gòu)化數(shù)據(jù)的挖掘,如文本數(shù)據(jù)、圖形圖像數(shù)據(jù)、多媒體數(shù)據(jù)。但是,無論怎樣,需求牽引,市場(chǎng)驅(qū)動(dòng)是永恒的,DMKD將首先滿足信息時(shí)代用戶的急需,大量基于DMKD的決策支持軟件工具產(chǎn)品將會(huì)問世。二、課題研究目標(biāo)、研究?jī)?nèi)容和擬解決的關(guān)鍵性問題1研究目標(biāo)和內(nèi)容研究目標(biāo):設(shè)計(jì)一套覆蓋鋁電解生產(chǎn)全過程的質(zhì)量數(shù)據(jù)信息系統(tǒng),建立質(zhì)量數(shù)據(jù)庫。利用數(shù)據(jù)挖掘技術(shù)對(duì)鋁電解生產(chǎn)過程中產(chǎn)生的海量質(zhì)量數(shù)據(jù)進(jìn)行特征化、關(guān)聯(lián)、分類、聚類分析以及演變和偏差分析,發(fā)現(xiàn)生產(chǎn)管理中存在的不足,讓數(shù)據(jù)來指導(dǎo)電解生產(chǎn),從數(shù)據(jù)中發(fā)現(xiàn)決策知識(shí)。研究?jī)?nèi)容:傳統(tǒng)的鋁電解質(zhì)量及過程控制系統(tǒng)存在著網(wǎng)絡(luò)處理能力較差,信息孤島現(xiàn)象嚴(yán)重,數(shù)據(jù)分析能力欠缺等問題,將數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)引入到鋁電解質(zhì)量系統(tǒng)中,并結(jié)合計(jì)算機(jī)網(wǎng)絡(luò)技術(shù),進(jìn)行了深入的理論和實(shí)驗(yàn)研究,主要內(nèi)容如下:異構(gòu)數(shù)據(jù)庫數(shù)據(jù)集成,目前數(shù)據(jù)集成典型的方法主要有模式集成方法和數(shù)據(jù)復(fù)制方法。其中模式集成是指在構(gòu)建集成系統(tǒng)時(shí)將各數(shù)據(jù)源的數(shù)據(jù)視圖集成為全局模式,使用戶能夠按照全局模式透明地訪問各種數(shù)據(jù)源的數(shù)據(jù);數(shù)據(jù)復(fù)制是指將各個(gè)數(shù)據(jù)源的數(shù)據(jù)復(fù)制到與其相關(guān)的其他數(shù)據(jù)源上,并維護(hù)數(shù)據(jù)源整體上的一致性,提高信息共享利用的效率。將數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)引入到鋁電解控制系統(tǒng)的過程中,結(jié)合鋁電解的經(jīng)驗(yàn)和知識(shí),充分利用控制系統(tǒng)產(chǎn)生的各種數(shù)據(jù),設(shè)計(jì)并開發(fā)鋁電解數(shù)據(jù)挖掘系統(tǒng);研究聚類分析模型,對(duì)氧化鋁、炭塊、氟化鹽等原輔材料質(zhì)量數(shù)據(jù),電解槽生產(chǎn)過程的工作電壓、效應(yīng)持續(xù)時(shí)間和效應(yīng)電壓等數(shù)據(jù),以及原鋁質(zhì)量數(shù)據(jù)的分析,實(shí)現(xiàn)對(duì)單槽和系列槽的槽況分類,從而找出各種因素在鋁電解生產(chǎn)中的內(nèi)在規(guī)則。數(shù)據(jù)挖掘系統(tǒng)的設(shè)計(jì),把多維分析、人工智能、數(shù)據(jù)庫、鋁電解生產(chǎn)工藝等領(lǐng)域的技術(shù)結(jié)合在一起,通過數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)選取、數(shù)據(jù)預(yù)處理、數(shù)據(jù)變換、確定KDD目標(biāo)、選擇算法、數(shù)據(jù)挖掘、模式解釋、知識(shí)評(píng)價(jià)的步驟從大量數(shù)據(jù)中提取有效的、新穎的、潛在有用的知識(shí)。2擬解決的關(guān)鍵性問題質(zhì)量數(shù)據(jù)業(yè)務(wù)流程的改進(jìn)。鋁電解數(shù)據(jù)挖掘系統(tǒng)模型研究。三、擬采取的研究方法、技術(shù)路線、試驗(yàn)方案及其可行性分析在鋁電解生產(chǎn)過程中計(jì)算機(jī)控制技術(shù)已經(jīng)普及,例如生產(chǎn)過程控制的自動(dòng)化、向電解槽中添加氧化鋁的自動(dòng)化等。當(dāng)前,電解槽系列的電流強(qiáng)度、槽電壓及其隨時(shí)間的變化是控制電解過程的主要參數(shù)。因此,實(shí)時(shí)監(jiān)視并記錄這些數(shù)據(jù)的變化是提高控制精度、準(zhǔn)確性的基礎(chǔ)。生產(chǎn)過程中實(shí)時(shí)監(jiān)測(cè)并記錄的海量數(shù)據(jù)包含豐富的生產(chǎn)實(shí)際過程中各種因素之間相互影響、相互作用的寶貴信息,對(duì)于加強(qiáng)對(duì)生產(chǎn)過程的認(rèn)識(shí)、提高控制和管理水平無疑具有重要意義。數(shù)據(jù)挖掘技術(shù)的誕生和發(fā)展使從實(shí)時(shí)控制監(jiān)視中積累的海量數(shù)據(jù)中提取信息和知識(shí)成為可能。通過計(jì)算機(jī)的高速運(yùn)算使用智能方法從大量數(shù)據(jù)中提取數(shù)據(jù)模式,挖掘出知識(shí),集神經(jīng)網(wǎng)絡(luò)、模糊計(jì)算、粗糙集理論、知識(shí)表示、歸納邏輯和高性能計(jì)算機(jī)等技術(shù)的綜合運(yùn)用,并成功地應(yīng)用于商業(yè)領(lǐng)域。利用SQLServer2000提供的挖掘模型和AnalysysServices提供的挖掘模型和Excel2003中的回歸方法,對(duì)鋁電解生產(chǎn)過程中自動(dòng)產(chǎn)生的大量質(zhì)量日?qǐng)?bào)表數(shù)據(jù)進(jìn)行分析,探索這些數(shù)據(jù)之間可能存在的規(guī)律性。四、課題的創(chuàng)新性改進(jìn)鋁電解質(zhì)量管理系統(tǒng)相關(guān)反饋技術(shù),增進(jìn)人機(jī)交互性。建立一種新的鋁電解質(zhì)量數(shù)據(jù)挖掘模型,提高系統(tǒng)的整體效率。五、計(jì)劃進(jìn)度、預(yù)期進(jìn)展和預(yù)期成果1.查閱文獻(xiàn)、收集資料查閱相關(guān)的文獻(xiàn)資料(包括英文),對(duì)數(shù)據(jù)挖掘和鋁電解技術(shù)的最新發(fā)展有全面的了解。2.調(diào)查研究深入學(xué)習(xí)國內(nèi)外數(shù)據(jù)挖掘相關(guān)理論,通過學(xué)習(xí),了解該領(lǐng)域中還需要解決的問題。3.選題報(bào)告簡(jiǎn)明扼要的介紹課題內(nèi)容,說明課題的意義及研究的可行性。4.實(shí)驗(yàn)和上機(jī)前的準(zhǔn)備工作實(shí)驗(yàn)和上機(jī)前的準(zhǔn)備工作,搜集有關(guān)數(shù)據(jù)挖掘和相關(guān)反饋的資料,了解分類、聚類等各種方法及表示的各種算法的優(yōu)缺點(diǎn),借鑒其他領(lǐng)域中相關(guān)知識(shí)的應(yīng)用。5.實(shí)驗(yàn)工作通過實(shí)驗(yàn)分析理論及相關(guān)算法的正確性,與現(xiàn)算法相比的優(yōu)越性與不足之處。6.上機(jī)計(jì)算或者理論計(jì)算通過嚴(yán)密的理論證明理論與相關(guān)算法的可靠性與完備性。7.撰寫畢業(yè)論文檢驗(yàn)實(shí)際工作的正確性和完整性,寫工作總結(jié)以及總結(jié)課題研究過程,詳細(xì)說明課題研究成果。8.學(xué)位論文答辯邀請(qǐng)相關(guān)領(lǐng)域的專家學(xué)者對(duì)研究成果進(jìn)行評(píng)定與審查。六、與本課題有關(guān)的工作積累、已有的研究工作成績(jī)?cè)趯?dǎo)師的指導(dǎo)下,搜集和閱讀了大量的與數(shù)據(jù)挖掘相關(guān)的中英文文獻(xiàn),對(duì)本領(lǐng)域的研究意義、研究現(xiàn)狀以及存在的問題有了較深入的了解。而且通過對(duì)人工智能、模式識(shí)別等課程的學(xué)習(xí),更是儲(chǔ)備了一定的理論基礎(chǔ)。此外,本人2001年參加工作以來,一直在中鋁連分公司從事計(jì)算機(jī)相關(guān)工作,熟悉鋁電解生產(chǎn)流程,通過多年工作學(xué)習(xí)掌握了多種計(jì)算機(jī)語言、Oralce數(shù)據(jù)庫、網(wǎng)絡(luò)構(gòu)建等計(jì)算機(jī)相關(guān)技術(shù),為接下來的研究工作打下良好的基礎(chǔ)。七、研究經(jīng)費(fèi)預(yù)算計(jì)劃和經(jīng)費(fèi)落實(shí)情況自費(fèi)形式,已經(jīng)落實(shí)。八、參考文獻(xiàn)[1]韓家煒,數(shù)據(jù)挖掘:概念與技術(shù)DataMining:ConceptsandTechniques,2ndedition,[M]MorganKaufmann,2006.

[2]毛國君,數(shù)據(jù)挖掘原理與算法[M].清華大學(xué)出版社

[3]胡亮,李強(qiáng),康健,網(wǎng)絡(luò)程序設(shè)計(jì)[M].吉林大學(xué)出版社.

[4]Pang-Ning,TanMichaelSteinbach,VipinKumar,IntroductiontoDataMining[M].人民郵電出版社

[5]Bchner,A.G.,Mulvenna,M.D.,Anand,S.S.&Hughes,J.G.AnInterne–enabledKnowledgeDiscoveryProcess[A].Proc.9thInt'l.DatabaseConf.[C],forthcoming,1999,(a).

[6]Fu,Y.,Sandhu,K.,Shih,M.-Y.ClusteringofWebusersbasedonaccesspatterns[A].Proceedingsofthe1999KDDWorkshoponWebMining[C],San

Diego,CA.Springer-Verlag,1999.

[7]Bchner,A.G.,Mulvenna,M.D.DiscoveringInternetMarketingIntelligencethroughOnlineAnaly

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論