數(shù)據(jù)挖掘技術(shù)教學(xué)大綱_第1頁
數(shù)據(jù)挖掘技術(shù)教學(xué)大綱_第2頁
數(shù)據(jù)挖掘技術(shù)教學(xué)大綱_第3頁
數(shù)據(jù)挖掘技術(shù)教學(xué)大綱_第4頁
數(shù)據(jù)挖掘技術(shù)教學(xué)大綱_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)挖掘技術(shù)課程教學(xué)大綱、課程基本信息課程名稱(中文)數(shù)據(jù)挖掘技術(shù)課程代碼課程名稱(英文)DataMining課程類別通識教育課專業(yè)教育課實踐教育課口創(chuàng)新創(chuàng)業(yè)課其他課程學(xué)時40學(xué)時課程學(xué)分2.5學(xué)分適用專業(yè)物聯(lián)網(wǎng)工程專業(yè)(本科)開課學(xué)期第7學(xué)期先修課程概率與統(tǒng)計,數(shù)據(jù)庫原理續(xù)修課程課程簡介數(shù)據(jù)挖掘是計算機工程學(xué)院開設(shè)的一門重要的專業(yè)課程。本課程主要講授數(shù)據(jù)挖掘的基本概念,原理、方法和技術(shù),具體包括:數(shù)據(jù)的預(yù)處理、分類預(yù)測、關(guān)聯(lián)挖掘,聚類分析等內(nèi)容。通過學(xué)習(xí),使學(xué)生理解數(shù)據(jù)挖掘的基本流程,掌握數(shù)據(jù)挖掘的基本理論和技術(shù),熟悉數(shù)據(jù)挖掘成果的表達(dá);掌握數(shù)據(jù)挖掘的基本方法,能熟練地應(yīng)用數(shù)據(jù)挖掘技術(shù)對現(xiàn)實

2、數(shù)據(jù)進行有效的分析,能夠結(jié)合Clementine軟件從大量統(tǒng)計數(shù)據(jù)中獲取有價值的信息。二、課程教育目標(biāo)(一)總體目標(biāo)數(shù)據(jù)挖掘是高級數(shù)據(jù)處理和分析技術(shù)。通過本課程學(xué)習(xí),使學(xué)生了解數(shù)據(jù)挖掘這種現(xiàn)代數(shù)據(jù)分析和知識挖掘方法的思想與技術(shù),了解數(shù)據(jù)挖掘的基本理論,掌握重要的數(shù)據(jù)挖掘方法,掌握如何利用Clementine實現(xiàn)數(shù)據(jù)分析和挖掘,并使學(xué)生具有進一步學(xué)習(xí)的基本與能力。(二)具體目標(biāo)1 .能夠?qū)搿⑤敵龈鞣N類型的數(shù)據(jù),并對數(shù)據(jù)進行簡單描述統(tǒng)計2 .能夠編寫建立線性回歸模型、非純性回歸模型、編寫回歸模型的程序,并能夠通過程序檢驗?zāi)P? .能夠?qū)?shù)據(jù)進行聚類分析、分類分析、關(guān)聯(lián)分析、能夠?qū)ξ谋緮?shù)據(jù)進行數(shù)據(jù)

3、挖掘三、課程學(xué)時分配課程章節(jié)課程內(nèi)容理論學(xué)時實踐學(xué)時第一章數(shù)據(jù)挖掘和Clementine2弟早Clementine數(shù)據(jù)管理2第三章Clementine數(shù)據(jù)的基本分析26第四章關(guān)聯(lián)規(guī)則挖掘26第五章分類與預(yù)測46第八章聚類分析46合計-1624四、課程內(nèi)容第一章數(shù)據(jù)挖掘和Clementine使用概述【教學(xué)內(nèi)容】1 .1數(shù)據(jù)挖掘的產(chǎn)生背景2 .數(shù)據(jù)挖掘產(chǎn)生的背景3 .數(shù)據(jù)挖掘的發(fā)展4 .數(shù)據(jù)挖掘概述5 .2什么是數(shù)據(jù)挖掘6 .數(shù)據(jù)挖掘概念7 .數(shù)據(jù)挖掘分類8 .數(shù)據(jù)挖掘體系結(jié)構(gòu)9 .3Clementine軟件概述1. Clementine的配置2. Clementine操作基礎(chǔ)【學(xué)習(xí)目標(biāo)】本章作為

4、緒論,其目的是讓學(xué)生對數(shù)據(jù)挖掘技術(shù)有一個總體的認(rèn)識。因此,主要內(nèi)容是對數(shù)據(jù)挖掘技術(shù)的概念、產(chǎn)生背景、發(fā)展趨勢以及應(yīng)用等進行提煉和概括,并熟悉Clementine軟件的使用環(huán)境。要求學(xué)生掌握以下內(nèi)容:1 .數(shù)據(jù)挖掘的發(fā)展2 .數(shù)據(jù)挖掘基本知識3 .數(shù)據(jù)挖掘功能4 .數(shù)據(jù)挖掘應(yīng)用5 .數(shù)據(jù)挖掘的熱點問題6 .熟悉Clementine軟件【重點、難點】1 .重點:(1)數(shù)據(jù)挖掘概念(2)數(shù)據(jù)挖掘分類2 .難點:Clementine操作基礎(chǔ)【教學(xué)方法】1 .通過多媒體課件和傳統(tǒng)教學(xué)相結(jié)合,闡明課程與教學(xué)基本原理,豐富學(xué)生課程與教學(xué)的基本知識結(jié)構(gòu),培養(yǎng)學(xué)生的職業(yè)規(guī)范;2 .通過案例分析,強調(diào)理論與實踐相

5、結(jié)合,促進學(xué)生知識整合,培養(yǎng)學(xué)生的反思能力。第二章Clementine數(shù)據(jù)管理【教學(xué)內(nèi)容】2.1 數(shù)據(jù)源節(jié)點(Sources)1 .從開放數(shù)據(jù)庫中導(dǎo)入數(shù)據(jù)2 .從文本文件中讀取數(shù)據(jù)3,導(dǎo)入Excel格式的數(shù)據(jù)4 .用戶手動創(chuàng)建數(shù)據(jù)5 .2記錄選項節(jié)點(RecordOps)1 .選擇節(jié)點2,對數(shù)據(jù)的抽樣3 .修正數(shù)據(jù)集中的不均勻性4 .統(tǒng)計匯總5,對節(jié)點數(shù)據(jù)的排序6,區(qū)分節(jié)點來清除重復(fù)記錄2.3字段選項節(jié)點1,變量說明2,變量值的重新計算3,變量類別值的調(diào)整4,生成新變量5,變量值的離散化處理6.生成樣本集分割變量【學(xué)習(xí)目標(biāo)】本章中的數(shù)據(jù)管理主要是指數(shù)據(jù)挖掘中的數(shù)據(jù)預(yù)處理部分。對數(shù)據(jù)進行預(yù)處理,

6、不但可以節(jié)約大量的空間和時間而且得到的挖掘結(jié)果能更好地起到?jīng)Q策和預(yù)測作用。數(shù)據(jù)預(yù)處理一般包括:數(shù)據(jù)清理,數(shù)據(jù)集成,數(shù)據(jù)變換,數(shù)據(jù)歸約等方法。要求學(xué)生掌握本章講授的所有數(shù)據(jù)管理技術(shù)?!局攸c、難點】(1)數(shù)據(jù)源節(jié)點(2)記錄選項節(jié)點(3)字段選項節(jié)點2.難點:無【教學(xué)方法】1,通過多媒體課件和傳統(tǒng)教學(xué)相結(jié)合,闡明課程與教學(xué)基本原理,豐富學(xué)生課程與教學(xué)的基本知識結(jié)構(gòu),培養(yǎng)學(xué)生的職業(yè)規(guī)范;2.通過案例分析,強調(diào)理論與實踐相結(jié)合,促進學(xué)生知識整合,培養(yǎng)學(xué)生的反思能力。第三章Clementine數(shù)據(jù)的基本描述分析【教學(xué)內(nèi)容】3.1 數(shù)據(jù)質(zhì)量探索1 .數(shù)據(jù)的基本描述與質(zhì)量探索2 .離群點和極端值的修正3,缺

7、失值的替補4,數(shù)據(jù)質(zhì)量管理的其他功能3.2 數(shù)據(jù)基本描述分析1,計算基本描述統(tǒng)計量2,繪制散點圖3.3 兩分類變量相關(guān)性的研究1,兩分類變量相關(guān)性的圖形分析2,兩分類變量相關(guān)性的數(shù)值分析3.4 兩總體的均值比較3.5 變量重要性分析【學(xué)習(xí)目標(biāo)】基本描述分析是數(shù)據(jù)分析的基礎(chǔ),通常對數(shù)值型變量進行描述分析,涉及數(shù)據(jù)的集中趨勢和離散程度。描述集中趨勢的描述性統(tǒng)計量一般有均值、中位數(shù)和眾數(shù);描述離散程度的描述性統(tǒng)計量一般有方差、標(biāo)準(zhǔn)差和極差。要求學(xué)生掌握Clementine數(shù)據(jù)的基本分析方法?!局攸c、難點】1 .重點:(1)數(shù)據(jù)質(zhì)量探索(2)數(shù)據(jù)基本描述分析2 .難點:兩分類變量相關(guān)性的研究【教學(xué)方法

8、】1 .通過多媒體課件和傳統(tǒng)教學(xué)相結(jié)合,闡明課程與教學(xué)基本原理,豐富學(xué)生課程與教學(xué)的基本知識結(jié)構(gòu),培養(yǎng)學(xué)生的職業(yè)規(guī)范;2 .通過案例分析,強調(diào)理論與實踐相結(jié)合,促進學(xué)生知識整合,培養(yǎng)學(xué)生的反思能力。第四章關(guān)聯(lián)規(guī)則挖掘【教學(xué)內(nèi)容】4.1 關(guān)聯(lián)規(guī)則概述1 .基本概念2 .關(guān)聯(lián)規(guī)則表示3 .關(guān)聯(lián)規(guī)則挖掘算法簡介4.2 Apriori算法1. Apriori算法生成頻繁項集的過程2. Apriori算法從頻繁項集產(chǎn)生關(guān)聯(lián)規(guī)則4.3 在Clementine中應(yīng)用Apriori算法4.4 序列模式挖掘1 .序列與序列模式2 .Apriori算法3 .在Clementine中應(yīng)用序列模式挖掘【學(xué)習(xí)目標(biāo)】關(guān)聯(lián)

9、規(guī)則是形如X-Y的蘊涵式,其中,X和Y分別稱為關(guān)聯(lián)規(guī)則的先導(dǎo)和后繼。其中,關(guān)聯(lián)規(guī)則XCY,存在支持度和信任度。本章對關(guān)聯(lián)規(guī)則挖掘中的概念、方法、算法進行全面的分析和講解。由于關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘技術(shù)中研究最早、成果最多、相對比較成熟的分支,因此本章重點在于一些經(jīng)典理論和算法、熱點問題的介紹。要求學(xué)生掌握以下內(nèi)容:1 .關(guān)聯(lián)規(guī)則相關(guān)概念2 .Apriori算法3 .在Clementine中應(yīng)用Apriori算法【重點、難點】4 .重點:(1)關(guān)聯(lián)規(guī)則相關(guān)概念(2)Apriori算法2.難點:序列模式挖掘【教學(xué)方法】1 .通過多媒體課件和傳統(tǒng)教學(xué)相結(jié)合,闡明課程與教學(xué)基本原理,豐富學(xué)生課程與教學(xué)

10、的基本知識結(jié)構(gòu),培養(yǎng)學(xué)生的職業(yè)規(guī)范;2 .通過案例分析,強調(diào)理論與實踐相結(jié)合,促進學(xué)生知識整合,培養(yǎng)學(xué)生的反思能力。第五章分類與預(yù)測【教學(xué)內(nèi)容】5.1分類與決策樹概述1 .分類和預(yù)測數(shù)據(jù)分析形式介紹2 .決策樹概述3 .2ID3、C4.5與C5.0算法及應(yīng)用1 .信息嫡計算2 .決策樹歸納策略3 .ID3算法及缺點4 .C4.5算法5 .C5.0算法及優(yōu)點6 .在Clementine中應(yīng)用C5.07 .3二項Logistic回歸分析8 .4二項Logistic回歸分析應(yīng)用【學(xué)習(xí)目標(biāo)】分類是指把數(shù)據(jù)樣本映射到一個事先定義的類中的學(xué)習(xí)過程,即給定一組輸入的屬性向量及其對應(yīng)的類,用基于歸納的學(xué)習(xí)算法

11、得出分類。預(yù)測可以涉及數(shù)據(jù)值預(yù)測和類標(biāo)記預(yù)測,但預(yù)測通常指值預(yù)測。兩者的區(qū)別是,分類是用來預(yù)測數(shù)據(jù)對象的類標(biāo)記,而預(yù)測則是估計某些空缺或未知值。分類與預(yù)測在數(shù)據(jù)挖掘中是一項非常重要的方面,本章對分類與預(yù)測的基本概念與步驟、經(jīng)典的方法以及有關(guān)的問題進行了闡述。要求學(xué)生掌握以下內(nèi)容:分類和預(yù)測數(shù)據(jù)分析形式1. ID3算法2. C4.5算法3. Logistic回歸分析【重點、難點】(1) 點:(1)決策樹概述(2) ID3算法(3) C4.5算法2.難點:Logistic回歸分析【教學(xué)方法】豐富學(xué)生培養(yǎng)學(xué)生的1 .通過多媒體課件和傳統(tǒng)教學(xué)相結(jié)合,闡明課程與教學(xué)基本原理,課程與教學(xué)的基本知識結(jié)構(gòu),培

12、養(yǎng)學(xué)生的職業(yè)規(guī)范;2 .通過案例分析,強調(diào)理論與實踐相結(jié)合,促進學(xué)生知識整合,反思能力。第六章聚類分析【教學(xué)內(nèi)容】6.1 聚類分析的一般問題1 .聚類分析介紹2 .聚類分析應(yīng)用領(lǐng)域3 .聚類分析原理4 .主要聚類方法分類6.2 Clementine的k-means聚類及應(yīng)用1. k-means算法2. k-means算法的優(yōu)缺點3. 在Clementine中應(yīng)用k-means6.3 Clementine的兩步聚類及應(yīng)用1 .兩步聚類算法2 .Clementine的兩步聚類應(yīng)用【學(xué)習(xí)目標(biāo)】聚類是將數(shù)據(jù)分類到不同的類或者簇的過程,所以同一個簇中的對象有很大的相似性,而不同簇間的對象有很大的相異性。

13、聚類分析是一種探索性的分析,在分類的過程中,人們不必事先給出一個分類的標(biāo)準(zhǔn),聚類分析能夠從樣本數(shù)據(jù)出發(fā),自動進行分類。聚類能夠作為一個獨立的工具獲得數(shù)據(jù)的分布狀況,觀察每一簇數(shù)據(jù)的特征,集中對特定的聚簇集合作進一步地分析。聚類分析還可以作為其他算法(如分類和定性歸納算法)的預(yù)處理步驟。聚類是數(shù)據(jù)挖掘技術(shù)中一個重要組成部分,內(nèi)容很多,因此要求學(xué)生掌握聚類分析原理、基本方法和主要算法。【重點、難點】2.重點:(1)聚類分析原理(2)主要聚類方法分類2.難點:Clementine操作基礎(chǔ)【教學(xué)方法】1 .通過多媒體課件和傳統(tǒng)教學(xué)相結(jié)合,闡明課程與教學(xué)基本原理,豐富學(xué)生課程與教學(xué)的基本知識結(jié)構(gòu),培養(yǎng)學(xué)

14、生的職業(yè)規(guī)范;2 .通過案例分析,強調(diào)理論與實踐相結(jié)合,促進學(xué)生知識整合,培養(yǎng)學(xué)生的反思能力。五、考核方式及成績評定1 .考核方式:課程考核方式分為過程考核(平時考核)和課終考核(期末考核)。過程考核(平時考核)方式包括課堂表現(xiàn)、平時作業(yè)、階段性測試、調(diào)研報告等;課終考核(期末考核)采用考查。2 .總成績評定:總成績=過程成績(平時成績)*50%碑終成績(期末成績)*50%(其中過程成績的占比由課程組根據(jù)課程實際提出并報二級學(xué)院決定)3 .過程成績(平時成績)評定:(1)課堂表現(xiàn)(5%):學(xué)生主動參與課堂練習(xí)、討論,創(chuàng)造性地提出問題的能力;(2)作業(yè)完成情況(10%):學(xué)生平時作業(yè)提交次數(shù)及完成質(zhì)量;(3)階段性測驗(10%):學(xué)生在平時測試、測驗中掌握課程的情況;(4)研究報告(10%:學(xué)生收集資料能力,研究設(shè)計能力,解決實際問題能力和合作研究能力;(5)實踐教學(xué)(10%);(6)考勤(5%)。4 .期末考試:期末考試主要考察對基本概念、操作程序和具體方法的理解與運用等。六、建議教材和主要參考書目(一)建議教材基于Clementine的數(shù)據(jù)挖掘,薛薇陳歡歌

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論