《數(shù)據(jù)挖掘技術(shù)》教學(xué)大綱_第1頁
《數(shù)據(jù)挖掘技術(shù)》教學(xué)大綱_第2頁
《數(shù)據(jù)挖掘技術(shù)》教學(xué)大綱_第3頁
《數(shù)據(jù)挖掘技術(shù)》教學(xué)大綱_第4頁
《數(shù)據(jù)挖掘技術(shù)》教學(xué)大綱_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

《數(shù)據(jù)挖掘技術(shù)》教學(xué)大綱適用范圍:202X版本科人才培養(yǎng)方案課程代碼:08140201課程性質(zhì):專業(yè)必修課學(xué)分:4學(xué)分學(xué)時(shí):64學(xué)時(shí)(理論48學(xué)時(shí),實(shí)驗(yàn)16學(xué)時(shí))先修課程:高等數(shù)學(xué)、線性代數(shù)、概率論與數(shù)理統(tǒng)計(jì)后續(xù)課程:人工智能適用專業(yè):數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)開課單位:計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院一、課程說明《數(shù)據(jù)挖掘技術(shù)》課程是數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)的一門專業(yè)必修課。本課程的主要任務(wù)是讓學(xué)生掌握數(shù)據(jù)挖掘基本概念與算法,針對(duì)實(shí)際工作與應(yīng)用中產(chǎn)生的大數(shù)據(jù),用數(shù)據(jù)挖掘技術(shù)來發(fā)現(xiàn)數(shù)據(jù)中隱藏的知識(shí)或規(guī)律,從而為生產(chǎn)、生活、商務(wù)活動(dòng)、社會(huì)活動(dòng)等提供決策支持。要求學(xué)生通過本課程的學(xué)習(xí),認(rèn)識(shí)數(shù)據(jù)倉庫和數(shù)據(jù)挖掘在當(dāng)今大數(shù)據(jù)時(shí)代中的重要作用,了解數(shù)據(jù)倉庫的基本原理和實(shí)現(xiàn)方法,掌握數(shù)據(jù)預(yù)處理技術(shù)和數(shù)據(jù)挖掘常用算法(包括關(guān)聯(lián)分析、分類與預(yù)測、聚類分析、回歸分析、數(shù)據(jù)摘要等),為解決實(shí)際問題打下堅(jiān)實(shí)的知識(shí)基礎(chǔ)。二、課程目標(biāo)通過本課程的學(xué)習(xí),使學(xué)生達(dá)到如下目標(biāo):課程目標(biāo)1:能夠應(yīng)用數(shù)學(xué)、自然科學(xué)和工程科學(xué)的基本原理,進(jìn)行抽象分析與識(shí)別、建模表達(dá),并通過文獻(xiàn)研究分析數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)領(lǐng)域復(fù)雜工程問題,以獲得有效結(jié)論。課程目標(biāo)2:培養(yǎng)團(tuán)隊(duì)合作的能力,追求思維碰撞;學(xué)會(huì)主動(dòng)思考、思辨;培養(yǎng)自主學(xué)習(xí)的能力。小組合作完成設(shè)計(jì)開發(fā)解決方案,系統(tǒng)模塊化完成大數(shù)據(jù)分析的數(shù)據(jù)預(yù)處理、建模、分析、可視化等階段。課程目標(biāo)3:通過引入課程思政,讓學(xué)生明白工匠精神和精益求精的重要性。具備大數(shù)據(jù)思維,從數(shù)據(jù)挖掘與統(tǒng)計(jì)分析的角度分析未來的發(fā)展趨勢,主動(dòng)適應(yīng)社會(huì)發(fā)展,成為國之重器,做對(duì)社會(huì)對(duì)國家有用之人。三、課程目標(biāo)與畢業(yè)要求《數(shù)據(jù)挖掘技術(shù)》課程教學(xué)目標(biāo)對(duì)數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)畢業(yè)要求的支撐見表1。表1課程教學(xué)目標(biāo)與畢業(yè)要求關(guān)系畢業(yè)要求指標(biāo)點(diǎn)課程目標(biāo)支撐強(qiáng)度2.問題分析2.2能夠認(rèn)識(shí)到復(fù)雜工程問題有多種相互關(guān)聯(lián)和制約的因素,并通過分析文獻(xiàn)尋求最佳解決方法。課程目標(biāo)1:能夠應(yīng)用數(shù)學(xué)、自然科學(xué)和工程科學(xué)的基本原理,進(jìn)行抽象分析與識(shí)別、建模表達(dá),并通過文獻(xiàn)研究分析數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)領(lǐng)域復(fù)雜工程問題,以獲得有效結(jié)論。H3.設(shè)計(jì)/開發(fā)解決方案3.1能夠針對(duì)大數(shù)據(jù)應(yīng)用系統(tǒng)設(shè)計(jì)與開發(fā)滿足特定需求的模塊或算法。課程目標(biāo)2:培養(yǎng)團(tuán)隊(duì)合作的能力,追求思維碰撞;學(xué)會(huì)主動(dòng)思考、思辨;培養(yǎng)自主學(xué)習(xí)的能力。小組合作完成設(shè)計(jì)開發(fā)解決方案,系統(tǒng)模塊化完成大數(shù)據(jù)分析的數(shù)據(jù)預(yù)處理、建模、分析、可視化等階段。H5.使用現(xiàn)代工具5.2能夠選擇與使用恰當(dāng)?shù)募夹g(shù)、資源、現(xiàn)代工程工具和信息技術(shù)工具,對(duì)數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)領(lǐng)域復(fù)雜工程問題進(jìn)行預(yù)測與模擬。課程目標(biāo)1:能夠應(yīng)用數(shù)學(xué)、自然科學(xué)和工程科學(xué)的基本原理,進(jìn)行抽象分析與識(shí)別、建模表達(dá),并通過文獻(xiàn)研究分析數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)領(lǐng)域復(fù)雜工程問題,以獲得有效結(jié)論。課程目標(biāo)3:通過引入課程思政,讓學(xué)生明白工匠精神和精益求精的重要性。具備大數(shù)據(jù)思維,從數(shù)據(jù)挖掘與統(tǒng)計(jì)分析的角度分析未來的發(fā)展趨勢,主動(dòng)適應(yīng)社會(huì)發(fā)展,成為國之重器,做對(duì)社會(huì)對(duì)國家有用之人。H注:表中“H(高)、M(中)”表示課程與相關(guān)畢業(yè)要求的關(guān)聯(lián)度。四、教學(xué)內(nèi)容、基本要求與學(xué)時(shí)分配1.理論部分理論部分的教學(xué)內(nèi)容、基本要求與學(xué)時(shí)分配見表2。表2教學(xué)內(nèi)容、基本要求與學(xué)時(shí)分配教學(xué)內(nèi)容教學(xué)要求,教學(xué)重點(diǎn)難點(diǎn)理論學(xué)時(shí)實(shí)驗(yàn)學(xué)時(shí)對(duì)應(yīng)的課程目標(biāo)1.?dāng)?shù)據(jù)挖掘簡介1.1數(shù)據(jù)分析與數(shù)據(jù)挖掘1.2數(shù)據(jù)挖掘的主要任務(wù)1.3關(guān)聯(lián)分析1.4數(shù)據(jù)源1.5數(shù)據(jù)挖掘技術(shù)1.6數(shù)據(jù)挖掘的工具教學(xué)要求:使學(xué)生理解和掌握數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)的基本概念、數(shù)據(jù)挖掘過程、數(shù)據(jù)挖掘的主要任務(wù)以及數(shù)據(jù)挖掘使用的主要技術(shù)。了解數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)的應(yīng)用和面臨的問題。對(duì)數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)能夠解決的問題和解決問題思路有清晰的認(rèn)識(shí)。熟練應(yīng)用Jupyternotebook的開發(fā)環(huán)境。重點(diǎn):熟悉數(shù)據(jù)挖掘技術(shù)及其開源開發(fā)工具。難點(diǎn):Pyhton數(shù)據(jù)挖掘工具庫的配置。21、2、32.Python數(shù)據(jù)分析與挖掘基礎(chǔ)2.1Python程序概述2.2Pyhton內(nèi)建的數(shù)據(jù)結(jié)構(gòu)2.3Numpy數(shù)值計(jì)算基礎(chǔ)2.4Pandas數(shù)據(jù)分析基礎(chǔ)2.5Matplotlib數(shù)據(jù)可視化基礎(chǔ)2.6Scikit-learn基礎(chǔ)教學(xué)要求:使學(xué)生理解和掌握Python基礎(chǔ)語法、內(nèi)建的數(shù)據(jù)結(jié)構(gòu)、Numpy數(shù)值運(yùn)算基礎(chǔ)、Pandas統(tǒng)計(jì)分析基礎(chǔ)。掌握Matplotlib圖表繪制基礎(chǔ)等數(shù)據(jù)分析和可視化方法。重點(diǎn):Python基礎(chǔ)語法、內(nèi)建的數(shù)據(jù)結(jié)構(gòu)、Numpy數(shù)值運(yùn)算基礎(chǔ)、Pandas統(tǒng)計(jì)分析基礎(chǔ)。難點(diǎn):Matplotlib圖表繪制基礎(chǔ)等數(shù)據(jù)分析和可視化方法。61、2、33.認(rèn)識(shí)數(shù)據(jù)3.1數(shù)據(jù)對(duì)象與屬性類型3.2數(shù)據(jù)的基本統(tǒng)計(jì)描述3.3數(shù)據(jù)可視化3.4度量數(shù)據(jù)的相似性和相異性教學(xué)要求:使學(xué)生了解數(shù)據(jù)的屬性類型,理解數(shù)據(jù)的基本統(tǒng)計(jì)描述,掌握度量數(shù)據(jù)相似性和相異性的方法。重點(diǎn):理解和掌握數(shù)據(jù)對(duì)象和屬性類型,數(shù)據(jù)的基本統(tǒng)計(jì)描述,掌握度量數(shù)據(jù)相似性和相異性的方法。難點(diǎn):了解數(shù)據(jù)可視化的方法。41、2、34.數(shù)據(jù)預(yù)處理4.1數(shù)據(jù)預(yù)處理概念4.2數(shù)據(jù)清洗4.3數(shù)據(jù)集成4.4數(shù)據(jù)變化與離散化4.5數(shù)據(jù)歸約教學(xué)要求:使學(xué)生理解數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)規(guī)約、數(shù)據(jù)變換于數(shù)據(jù)離散化的方法,掌握數(shù)據(jù)預(yù)處理的基本方法。重點(diǎn):數(shù)據(jù)預(yù)處理的目的和意義,如何對(duì)數(shù)據(jù)進(jìn)行清理,如何對(duì)不同數(shù)據(jù)源的數(shù)據(jù)進(jìn)行合并,如何對(duì)數(shù)據(jù)進(jìn)行變換,使之適合建模的需要。難點(diǎn):如何對(duì)數(shù)據(jù)進(jìn)行消減,使得在消減后的數(shù)據(jù)集上挖掘更有效。利用Python進(jìn)行數(shù)據(jù)預(yù)處理的方法。441、2、35.回歸分析5.1回歸的概念;5.2一元線性回歸;5.3多元線性回歸;5.4邏輯回歸。教學(xué)要求:使學(xué)生了解掌握回歸的定義,各類回歸的原理及Python實(shí)現(xiàn)。重點(diǎn):回歸分析的原理。難點(diǎn):元線性回歸,邏輯回歸。41、2、36.關(guān)聯(lián)規(guī)則挖掘6.1關(guān)聯(lián)規(guī)則分析概述6.2頻繁項(xiàng)集挖掘方法6.3關(guān)聯(lián)規(guī)則評(píng)估方法教學(xué)要求:使學(xué)生了解頻繁項(xiàng)集、閉項(xiàng)集和關(guān)聯(lián)規(guī)則的概念,理解模式評(píng)估方法,掌握Apriori算法和挖掘頻繁項(xiàng)集的模式增長方法。重點(diǎn):關(guān)聯(lián)規(guī)則的基本思想、概念和意義關(guān)聯(lián)規(guī)則挖掘的應(yīng)用背景;掌握常用的關(guān)聯(lián)規(guī)則算法。難點(diǎn):利用Python實(shí)現(xiàn)關(guān)聯(lián)規(guī)則分析。441、2、37.分類7.1基本概念7.2決策樹歸約7.3K近鄰算法7.4支持向量機(jī)7.5貝葉斯分類7.6模型評(píng)估與選擇7.7組合分類教學(xué)要求:使學(xué)生了解分類的概念,理解評(píng)估分類器性能的度量方法,掌握決策樹分類算法、SVM、貝葉斯分類算法、模型評(píng)估與選擇、組合分類及利用Python實(shí)現(xiàn)分類的方法。重點(diǎn):常用的分類及預(yù)測算法。難點(diǎn):利用Python實(shí)現(xiàn)各種分類算法的方法。1041、2、38.聚類8.1聚類的概念8.2K-Means算法8.3層次聚類8.4基于密度的方法8.5聚類評(píng)估教學(xué)要求:了解聚類的概念,掌握k-Means和k-Medoids算法、層次方法和基于密度的方法等典型算法及其Python的實(shí)現(xiàn)方法。重點(diǎn):掌握K-Means聚類、層次聚類、基于密度的聚類和其他常用方法。難點(diǎn):掌握利用sklearn實(shí)現(xiàn)聚類的方法。841、2、39.神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)9.1基本原理9.2BP神經(jīng)網(wǎng)絡(luò)9.3深度學(xué)習(xí)教學(xué)要求:掌握神經(jīng)網(wǎng)絡(luò)基本原理;了解深度神經(jīng)網(wǎng)絡(luò)。重點(diǎn):神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)的原理。難點(diǎn):深度學(xué)習(xí)。21、2、310.離群點(diǎn)檢測9.1基本概述9.2離群點(diǎn)檢測9.3異常值檢測方法教學(xué)要求:了解離群點(diǎn)的概念、類型以及離群點(diǎn)檢測的常用方法,掌握sklearn中的異常值檢測方法。重點(diǎn):離群點(diǎn)的概念與檢測方法。難點(diǎn):sklearn中的異常值檢測方法。41、2、3合計(jì)48162.實(shí)驗(yàn)部分實(shí)驗(yàn)部分的教學(xué)內(nèi)容、基本要求與學(xué)時(shí)分配見表3。表3實(shí)驗(yàn)項(xiàng)目、實(shí)驗(yàn)內(nèi)容與學(xué)時(shí)實(shí)驗(yàn)項(xiàng)目實(shí)驗(yàn)內(nèi)容和要求實(shí)驗(yàn)學(xué)時(shí)對(duì)應(yīng)的課程目標(biāo)1.數(shù)據(jù)分析與可視化實(shí)驗(yàn)內(nèi)容:利用Python進(jìn)行數(shù)據(jù)分析與可視化。實(shí)驗(yàn)要求:熟悉數(shù)據(jù)挖掘開發(fā)環(huán)境Anaconda和Jupyter,利用Python進(jìn)行數(shù)據(jù)預(yù)處理,清洗,合并,變換,基本分析和可視化。41、2、32.關(guān)聯(lián)規(guī)則與回歸分析實(shí)驗(yàn)內(nèi)容:對(duì)數(shù)據(jù)文進(jìn)行關(guān)聯(lián)規(guī)則分析與回歸分析。實(shí)驗(yàn)要求:利用Python環(huán)境對(duì)數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則分析,多元線性回歸和邏輯回歸分析。41、2、33.數(shù)據(jù)的分類分析實(shí)驗(yàn)內(nèi)容:對(duì)數(shù)據(jù)進(jìn)行分類分析和算法應(yīng)用。實(shí)驗(yàn)要求:用不同的算法實(shí)現(xiàn)給定數(shù)據(jù)集的分類分析,利用Python處理分類分析的常用方法。41、2、34.數(shù)據(jù)的聚類分析實(shí)驗(yàn)內(nèi)容:對(duì)數(shù)據(jù)進(jìn)行聚類分析和算法應(yīng)用。實(shí)驗(yàn)要求:用不同的算法實(shí)現(xiàn)給定數(shù)據(jù)集的聚類分析,利用Python處理聚類分析的常用方法。41、2、3合計(jì)16五、教學(xué)方法及手段本課程以課堂講授為主,采用啟發(fā)式、討論式教學(xué)和案例教學(xué)等,促進(jìn)學(xué)生積極思考,開發(fā)學(xué)生的潛能,培養(yǎng)學(xué)生思考問題、分析問題和解決問題的能力;以“少而精”為原則,精選教學(xué)內(nèi)容,精講多練;安排習(xí)題課,鞏固課堂所學(xué)知識(shí);結(jié)合學(xué)習(xí)通超星平臺(tái),中國大學(xué)慕課網(wǎng),嗶哩嗶哩視頻網(wǎng)站等視頻資源提供靈活的自主的學(xué)習(xí)方式。六、課程資源1.推薦教材(1)魏偉一.Python數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)[M].北京:清華大學(xué)出版社,2021.(2)韓家煒.數(shù)據(jù)挖掘:概念與技術(shù)(第三版)[M].北京:機(jī)械工業(yè)出版社,2012.(3)王國胤等.大數(shù)據(jù)挖掘及應(yīng)用(第2版)[M].北京:清華大學(xué)出版社,2021.2.參考書(1)周志華.機(jī)器學(xué)習(xí)[M].北京:清華大學(xué)出版社,2016.(2)StevenBird,EwanKlein,EdwardLoper.NaturalLanguageProcessingwithPython[M].

Sevastopol:O'REILLY,

2009.(3)陳文偉.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘教程(第3版)[M].北京:機(jī)械工業(yè)出版社,2021.3.期刊(1)牛佳惠.數(shù)據(jù)挖掘在人力資源信息化管理中的運(yùn)用探析[J].數(shù)字通信世界,2022,(03):94-96.(2)陳新.論空間數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)的理論與方法[J].電腦知識(shí)與技術(shù),2021,17(33):20-21,31.(3)冀江瑀,陳秀波.上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)挖掘方法[J].計(jì)算機(jī)仿真,2022,39(06):386-390.(4)Sohail,M.N.,etal."Whyonlydatamining?Apilotstudyoninadequacyanddominationofdataminingtechnology."

Int.J.RecentSci.Res

9.10(2018):29066-29073.(5)Chhabra,VIIII.,andGunmalaSuri."DataScienceandKnowledgeDiscoverythroughDataMiningParadigms."

JournalofMechanicsofContinuaandMathematicalSciences

14.2(2019):167-173.4.網(wǎng)絡(luò)資源(1)ChristopherClifton.datamining[J/OL].Britannica,2019./technology/data-mining(2)王大寶的CD.數(shù)據(jù)挖掘(一)你真的了解什么是數(shù)據(jù)挖掘和數(shù)據(jù)本身嗎?[R/OL].CSDN文庫,2017./sinat_22594309/article/details/74923643.(3)術(shù)墻穿:喜茶廣州地區(qū)門店評(píng)價(jià)數(shù)據(jù)可視化與文本挖掘[R/OL].飛漿官網(wǎng),(2022-074-01)..七、課程考核對(duì)課程目標(biāo)的支撐課程成績由過程性考核成績和期末考核成績兩部分構(gòu)成,具體考核/評(píng)價(jià)細(xì)則及對(duì)課程目標(biāo)的支撐關(guān)系見表4。表4課程考核對(duì)課程目標(biāo)的支撐考核環(huán)節(jié)占比考核/評(píng)價(jià)細(xì)則課程目標(biāo)123過程性考核課堂表現(xiàn)15(1)根據(jù)課堂出勤情況和課堂回答問題情況進(jìn)行考核,滿分100分。(2)以平時(shí)考核成績乘以其在總評(píng)成績中所占的比例計(jì)入課程總評(píng)成績?!獭獭?55實(shí)驗(yàn)20(1)根據(jù)每個(gè)實(shí)驗(yàn)的實(shí)驗(yàn)操作完成情況和實(shí)驗(yàn)報(bào)告質(zhì)量單獨(dú)評(píng)分,滿分100分;(2)每次實(shí)驗(yàn)單獨(dú)評(píng)分,取各次實(shí)驗(yàn)成績的平均值作為此環(huán)節(jié)的最終成績。(3)以實(shí)驗(yàn)成績乘以其在總評(píng)成績中所占的比例計(jì)入課程總評(píng)成績?!獭獭?105作業(yè)15(1)主要考核學(xué)生對(duì)各章節(jié)知識(shí)點(diǎn)的復(fù)習(xí)、理解和掌握程度,滿分100分;(2)每次作業(yè)單獨(dú)評(píng)分,取各次成績的平均值作為此環(huán)節(jié)的最終成績。(3)以作業(yè)成績乘以其在總評(píng)成績中所占的比例計(jì)入課程總評(píng)成績?!獭獭?55期末考核50(1)卷面成績100分,以卷面成績乘以其在總評(píng)成績中所占的比例計(jì)入課程總評(píng)成績。(2)主要考核方式為機(jī)試。考核內(nèi)容為數(shù)據(jù)挖掘核心算法應(yīng)用。(3)考試題型為:數(shù)據(jù)分析程序設(shè)計(jì)等。√√2525合計(jì):100分402040八、考核與成績評(píng)定1.考核方式及成績評(píng)定考核方式:本課程主要以課堂表現(xiàn)、實(shí)驗(yàn)、作業(yè)、期末機(jī)試等方式對(duì)學(xué)生進(jìn)行考核評(píng)價(jià)??己嘶疽螅嚎己丝偝煽冇善谀C(jī)試成績和過

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論