《新媒體數(shù)據(jù)分析與應(yīng)用》教學(xué)大綱_第1頁
《新媒體數(shù)據(jù)分析與應(yīng)用》教學(xué)大綱_第2頁
《新媒體數(shù)據(jù)分析與應(yīng)用》教學(xué)大綱_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

一、說明 (一)課程定義新媒體數(shù)據(jù)分析與應(yīng)用是XXXXXXX專業(yè)開設(shè)的一門重要的專業(yè)核心課程。本課程主要講授新媒體數(shù)據(jù)分析的基本概念,原理、方法和技術(shù),具體包括:數(shù)據(jù)的預(yù)處理、分類預(yù)測、關(guān)聯(lián)挖掘、聚類分析等內(nèi)容。通過學(xué)習(xí),使學(xué)生理解新媒體數(shù)據(jù)分析的基本流程,掌握新媒體數(shù)據(jù)分析的基本理論和技術(shù),熟悉新媒體數(shù)據(jù)分析成果的表達(dá);掌握新媒體數(shù)據(jù)分析的基本方法,能熟練地應(yīng)用數(shù)據(jù)挖掘技術(shù)對(duì)現(xiàn)實(shí)數(shù)據(jù)進(jìn)行有效的分析,能夠結(jié)合SPSSModeler軟件從大量統(tǒng)計(jì)數(shù)據(jù)中獲取有價(jià)值的信息。 (二)編寫依據(jù)根據(jù)《XXXXX學(xué)院XXXXX專業(yè)本科人才培養(yǎng)方案》(XXXX版)編寫。 (三)目的任務(wù)通過本課程學(xué)習(xí),使學(xué)生了解現(xiàn)代數(shù)據(jù)分析和知識(shí)挖掘方法的思想與技術(shù),了解數(shù)據(jù)分析的基本理論,掌握重要的數(shù)據(jù)分析方法,掌握如何利用SPSSModeler實(shí)現(xiàn)數(shù)據(jù)分析和挖掘,并使學(xué)生具有進(jìn)一步學(xué)習(xí)的基礎(chǔ)與能力。(四)學(xué)時(shí)數(shù)與學(xué)分?jǐn)?shù):本課程理論36學(xué)時(shí),實(shí)踐/實(shí)驗(yàn)36學(xué)時(shí),共72學(xué)時(shí),4學(xué)分。(五)適用對(duì)象:XXXX專業(yè),二年級(jí)學(xué)生。(六)課程編碼:KY1810C07二、教學(xué)內(nèi)容與學(xué)時(shí)分配教學(xué)基本內(nèi)容教學(xué)安排小計(jì)講授討論實(shí)驗(yàn)實(shí)踐第一章數(shù)據(jù)分析和Modeler使用概述224第二章數(shù)據(jù)讀入和數(shù)據(jù)集成448第三章數(shù)據(jù)理解和數(shù)據(jù)準(zhǔn)備448第四章基本分析和數(shù)據(jù)精簡448第五章決策樹和人工神經(jīng)網(wǎng)絡(luò)6612第六章支持向量機(jī)和貝葉斯網(wǎng)絡(luò)448第七章聚類分析6612第八章關(guān)聯(lián)分析448機(jī)動(dòng)224合計(jì)=SUM(ABOVE)3636=SUM(ABOVE)72三、教學(xué)內(nèi)容與知識(shí)點(diǎn)第一章數(shù)據(jù)分析和Modeler使用概述第一節(jié)數(shù)據(jù)分析的產(chǎn)生背景知識(shí)點(diǎn):數(shù)據(jù)庫與數(shù)據(jù)倉庫的定義、人工智能與機(jī)器學(xué)習(xí)的定義、統(tǒng)計(jì)學(xué)的定義第二節(jié)什么是數(shù)據(jù)分析知識(shí)點(diǎn):數(shù)據(jù)分析的定義、數(shù)據(jù)挖掘的定義、知識(shí)發(fā)現(xiàn)的定義第三節(jié)Modeler軟件概述知識(shí)點(diǎn):Modeler的數(shù)據(jù)流、窗口、數(shù)據(jù)流的基本管理第二章數(shù)據(jù)讀入和數(shù)據(jù)集成第一節(jié)變量類型知識(shí)點(diǎn):整數(shù)型、實(shí)數(shù)型、字符串型、時(shí)間型、日期型、時(shí)間戳型第二節(jié)讀入數(shù)據(jù)知識(shí)點(diǎn):讀文本文件、讀Excel電子表格、讀SPSS格式文件、讀數(shù)據(jù)庫文件第三節(jié)生成實(shí)驗(yàn)方案知識(shí)點(diǎn):挖掘?qū)嶒?yàn)數(shù)據(jù)中的規(guī)律性、探索影響實(shí)驗(yàn)結(jié)果的決定因素第四節(jié)數(shù)據(jù)集成知識(shí)點(diǎn):數(shù)據(jù)的縱向合并、數(shù)據(jù)的橫向合并、數(shù)據(jù)源替換第三章數(shù)據(jù)質(zhì)量的評(píng)估和調(diào)整第一節(jié)數(shù)據(jù)質(zhì)量的評(píng)估和調(diào)整知識(shí)點(diǎn):數(shù)據(jù)的基本特征與質(zhì)量評(píng)價(jià)報(bào)告、離群點(diǎn)和極端值的調(diào)整、數(shù)據(jù)質(zhì)量管理第二節(jié)數(shù)據(jù)的分類匯總知識(shí)點(diǎn):單變量分類匯總、多重分類匯總第三節(jié)變量變換知識(shí)點(diǎn):CLEM表達(dá)式、變量值的重新計(jì)算、變量類別值的調(diào)整第四節(jié)數(shù)據(jù)精簡知識(shí)點(diǎn):隨機(jī)抽樣、根據(jù)條件選取樣本、樣本的平衡處理第四章基本分析和數(shù)據(jù)精簡第一節(jié)數(shù)值型變量的基本分析知識(shí)點(diǎn):計(jì)算基本描述統(tǒng)計(jì)量、繪制散點(diǎn)圖、繪制線圖第二節(jié)兩分類型變量相關(guān)性的研究知識(shí)點(diǎn):兩分類型變量相關(guān)性的圖形分析、兩分類型變量相關(guān)性的數(shù)值分析第三節(jié)特征選擇知識(shí)點(diǎn):特征選擇的一般方法、特征選擇的應(yīng)用示例第四節(jié)因子分析知識(shí)點(diǎn):因子分析的定義、因子提取和因子載荷矩陣的求解、因子的命名第五章決策樹和人工神經(jīng)網(wǎng)絡(luò)第一節(jié)決策樹算法概述知識(shí)點(diǎn):決策樹的定義、決策樹的幾何理解、決策樹的核心問題第二節(jié)Modeler的C5.0算法及應(yīng)用知識(shí)點(diǎn):信息熵和信息增益、C5.0決策法的生長算法、修剪算法、基本應(yīng)用示例第三節(jié)人工神經(jīng)網(wǎng)絡(luò)算法概述知識(shí)點(diǎn):人工神經(jīng)網(wǎng)絡(luò)的概念和種類、人工神經(jīng)網(wǎng)絡(luò)建議的一般步驟第四節(jié)Modeler的BP反向傳播網(wǎng)絡(luò)的應(yīng)用知識(shí)點(diǎn):基本操作、結(jié)果說明、網(wǎng)絡(luò)中的隱節(jié)點(diǎn)和輸出節(jié)點(diǎn)第六章支持向量機(jī)和貝葉斯網(wǎng)絡(luò)第一節(jié)支持向量分類的基本思路知識(shí)點(diǎn):支持向量機(jī)的概念、支持向量分類的數(shù)據(jù)和目標(biāo)、支持向量分類的思路第二節(jié)支持向量機(jī)的應(yīng)用知識(shí)點(diǎn):確定超平面、基本操作、結(jié)果解讀第三節(jié)貝葉斯方法基礎(chǔ)知識(shí)點(diǎn):貝葉斯概率和貝葉斯公式、樸素貝葉斯分類法第四節(jié)貝葉斯網(wǎng)絡(luò)的應(yīng)用知識(shí)點(diǎn):基本操作、結(jié)果解讀、馬爾科夫毯網(wǎng)絡(luò)的案例、TAN貝葉斯網(wǎng)絡(luò)的案例第七章聚類分析第一節(jié)聚類分析的一般問題知識(shí)點(diǎn):聚類分析的提出、聚類分析的算法第二節(jié)Moderler的K-Means聚類及應(yīng)用知識(shí)點(diǎn):K-Means對(duì)“親疏程度”的測度、K-Means聚類過程、應(yīng)用示例第三節(jié)Modeler的兩步聚類及應(yīng)用知識(shí)點(diǎn):兩步聚類對(duì)“親疏程度”的測度、兩步聚類過程、聚類數(shù)目的確定第四節(jié)基于聚類分析的離群點(diǎn)探索知識(shí)點(diǎn):多維空間基于聚類的離群點(diǎn)診斷方法、應(yīng)用示例第八章關(guān)聯(lián)分析第一節(jié)簡單關(guān)聯(lián)規(guī)則及其有效性知識(shí)點(diǎn):簡單關(guān)聯(lián)規(guī)則的基本概念、簡單關(guān)聯(lián)規(guī)則的有效性和實(shí)用性第二節(jié)Modeler的Apriori算法及應(yīng)用知識(shí)點(diǎn):頻繁項(xiàng)集、依據(jù)頻繁項(xiàng)集產(chǎn)生簡單關(guān)聯(lián)規(guī)則、Apriori算法的應(yīng)用示例第三節(jié)Modeler的序列關(guān)聯(lián)及應(yīng)用知識(shí)點(diǎn):序列關(guān)聯(lián)中的基本概念、Sequence算法、序列關(guān)聯(lián)的時(shí)間約束四、考核(一)考核的形式:平時(shí)考核、平時(shí)實(shí)踐考核與期末綜合測試相結(jié)合。(二)成績的計(jì)算:績。五、教材與參考教材1、《數(shù)據(jù)分析與數(shù)據(jù)挖掘》,喻梅、于健主編,清華大學(xué)出版社,2018年3月第1版2、《基于SPSSModel

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論