《數(shù)據(jù)采集與挖掘》課程實驗教學(xué)大綱_第1頁
《數(shù)據(jù)采集與挖掘》課程實驗教學(xué)大綱_第2頁
《數(shù)據(jù)采集與挖掘》課程實驗教學(xué)大綱_第3頁
《數(shù)據(jù)采集與挖掘》課程實驗教學(xué)大綱_第4頁
《數(shù)據(jù)采集與挖掘》課程實驗教學(xué)大綱_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

《數(shù)據(jù)采集與挖掘》課程實驗教學(xué)大綱一、課程基本信息課程代碼:21020053課程名稱:《數(shù)據(jù)采集與挖掘》英文名稱:《DataAcquisitionandMining)》實驗總學(xué)時:48適用專業(yè):會計學(xué)、財務(wù)管理、審計學(xué)課程類別:專業(yè)選修課先修課程:《Python基礎(chǔ)》《初級財務(wù)會計學(xué)》、《會計學(xué)》、《數(shù)據(jù)庫管理系統(tǒng)》、《管理信息系統(tǒng)》、《財務(wù)管理》、《成本會計》等基礎(chǔ)課程實驗教學(xué)的性質(zhì)、目的與任務(wù)要求實驗教學(xué)的性質(zhì)和目的大數(shù)據(jù)時代已經(jīng)全面開啟,帶來了信息技術(shù)發(fā)展的巨大變革,并深刻影響著社會生產(chǎn)和人民生活的方方面面。了解大數(shù)據(jù)概念、具備大數(shù)據(jù)思維,是新時代對人才的新要求。本課程通過案例引入并探討大數(shù)據(jù)的實質(zhì),內(nèi)容深入淺出,通俗易懂,適合財會專業(yè)相關(guān)學(xué)生們學(xué)習(xí)。本課程闡述了培養(yǎng)具有數(shù)據(jù)素養(yǎng)的技術(shù)技能型人才所需要的大數(shù)據(jù)相關(guān)基礎(chǔ)知識。在確定知識布局時,秉持的一個基本原則是,緊緊圍繞大數(shù)據(jù)通識教育核心理念,培養(yǎng)學(xué)生的數(shù)據(jù)意識、數(shù)據(jù)思維、數(shù)據(jù)安全和數(shù)據(jù)分析能力。本實驗教學(xué)的內(nèi)容主要包括大數(shù)據(jù)概述,大數(shù)據(jù)思維,數(shù)據(jù)庫基礎(chǔ)知識,數(shù)據(jù)采集與挖掘相關(guān)應(yīng)用,數(shù)據(jù)可視化概論,大數(shù)據(jù)安全,大數(shù)據(jù)與云計算、物聯(lián)網(wǎng)、人工智能、數(shù)字貨幣、區(qū)塊鏈等新一代信息技術(shù)的融合應(yīng)用。為了避免陷入空洞的理論介紹,本實驗教學(xué)在很多章節(jié)都融入了豐富的案例,這些案例就發(fā)生在我們生活的大數(shù)據(jù)時代,很具有代表性和說服力,能夠讓學(xué)生直觀感受相應(yīng)理論的具體內(nèi)涵。實驗教學(xué)的任務(wù)要求1、對學(xué)生的要求高校課程建設(shè)要進一步打破學(xué)科、專業(yè)壁壘,推動文科專業(yè)之間的深度融通,以及文科與理工農(nóng)醫(yī)科的交叉融合,融入現(xiàn)代信息技術(shù),賦能文科教育,實現(xiàn)文科教育的自我革新?!稊?shù)據(jù)采集與挖掘》是培養(yǎng)德、智、體、美、勞全面發(fā)展,具有良好的政治素質(zhì)和道德修養(yǎng),掌握扎實的基礎(chǔ)理論和專業(yè)知識、良好的團隊意識和協(xié)作能力,打破局限的學(xué)科認知和專業(yè)限制,提升自身綜合素養(yǎng),提升新文科的通識傳承和知識創(chuàng)新能力。具備包括數(shù)據(jù)思維在內(nèi)的科學(xué)思維能力、解決財會等行業(yè)數(shù)據(jù)密集型問題為主的動手能力以及大數(shù)據(jù)分析或大數(shù)據(jù)應(yīng)用開發(fā)技能,在財會等相關(guān)行業(yè)數(shù)據(jù)分析系統(tǒng)的開發(fā)、部署與應(yīng)用等方面具有就業(yè)競爭力的高素質(zhì)復(fù)合型應(yīng)用人才。針對學(xué)生已經(jīng)具備《管理經(jīng)濟學(xué)》、《經(jīng)濟法》、《財務(wù)管理》等專業(yè)知識和能力的特點,《數(shù)據(jù)采集與挖掘》試圖采用理論分析與案例講解相結(jié)合的方法,使學(xué)生能夠全面深入地理解和掌握大數(shù)據(jù)技術(shù)的發(fā)展與演進過程,通過大數(shù)據(jù)應(yīng)用的場景介紹,熟悉大數(shù)據(jù)技術(shù)應(yīng)用的商業(yè)價值,介紹大數(shù)據(jù)常用編程軟件,了解大數(shù)據(jù)技術(shù)開源平臺和工具,拓展大數(shù)據(jù)應(yīng)用能力。本課程,側(cè)重實踐操作動手能力培養(yǎng)的一門課程。因此要求學(xué)生在深刻理解會計信息系統(tǒng)基本理論、基本方法和基本管理制度的基礎(chǔ)上,側(cè)重于具體軟件的操作和應(yīng)用。課程內(nèi)容分為數(shù)據(jù)采集與挖掘基本理論和Phython軟件應(yīng)用兩部分。2、對教師的要求教師要持續(xù)推動課程教育教學(xué)內(nèi)容更新迭代,培養(yǎng)學(xué)生的跨領(lǐng)域知識融通能力和實踐能力。針對學(xué)生已經(jīng)具備《管理經(jīng)濟學(xué)》、《經(jīng)濟法》、《財務(wù)管理》等專業(yè)知識和能力的特點,《數(shù)據(jù)采集與挖掘》試圖采用理論分析與案例講解相結(jié)合的方法,使學(xué)生能夠全面深入地理解和掌握大數(shù)據(jù)技術(shù)的發(fā)展與演進過程,通過大數(shù)據(jù)應(yīng)用的場景介紹,熟悉大數(shù)據(jù)技術(shù)應(yīng)用的商業(yè)價值,介紹大數(shù)據(jù)常用編程軟件,了解大數(shù)據(jù)技術(shù)開源平臺和工具,拓展大數(shù)據(jù)應(yīng)用能力。3、培養(yǎng)目標本課程旨在實現(xiàn)以下幾個培養(yǎng)目標:(1)引導(dǎo)學(xué)生步入大數(shù)據(jù)時代,積極投身大數(shù)據(jù)的變革浪潮之中;(2)了解大數(shù)據(jù)概念,培養(yǎng)大數(shù)據(jù)思維,養(yǎng)成數(shù)據(jù)安全意識;(3)掌握數(shù)據(jù)采集的基本流程、方法和基本技術(shù);(4)熟悉使用Python語言進行數(shù)據(jù)采集,能夠獨立設(shè)計、開發(fā)、測試和維護爬蟲程序等;(5)養(yǎng)成善于動腦、勤于思考的學(xué)習(xí)習(xí)慣;養(yǎng)成規(guī)范的軟件代碼編寫習(xí)慣;具有良好的溝通能力和團隊協(xié)作精神等。4、對實驗條件的相關(guān)要求實驗課程對計算機等教學(xué)環(huán)節(jié)的軟硬件條件要求如下。硬件要求:(1)計算機,P4-2.4,8G內(nèi)存,1TG硬盤;(2)自主上機機房管理信息系統(tǒng);開放機房;(3)網(wǎng)絡(luò)環(huán)境,每個小組局域網(wǎng)互通,使用教學(xué)系統(tǒng)管理軟件上課;(4)網(wǎng)絡(luò)硬盤FTP學(xué)生個人空間,方便學(xué)生存取個人賬套;(5)資源環(huán)境,專題實驗教學(xué)資源網(wǎng)站和實驗教學(xué)輔助系統(tǒng)。軟件要求:Python3.8(或更高版本)InternetExplorer6.0+SP1及更高版本IIS5.0及更高版本NETFramework2.0ServicePack1Dockers和Spark實驗教學(xué)內(nèi)容教學(xué)方法本課程以課程理論教學(xué)為主,并安排課堂討論,以深化學(xué)生對知識的理解。在理論教學(xué)層面,高屋建瓴地探討大數(shù)據(jù),超脫技術(shù)講解技術(shù),內(nèi)容深入淺出,通俗易懂,適合非計算機專業(yè)學(xué)生學(xué)習(xí);同時,在課堂上為學(xué)生展示豐富的實際應(yīng)用案例,激發(fā)學(xué)生學(xué)習(xí)興趣,開拓學(xué)生視野,培養(yǎng)學(xué)生大數(shù)據(jù)思維。教學(xué)內(nèi)容本課程的理論課程相關(guān)教學(xué)內(nèi)容如下表所示:項目(或章)主要內(nèi)容學(xué)時安排第1章大數(shù)據(jù)概論與python數(shù)據(jù)分析數(shù)據(jù)的概念、大數(shù)據(jù)時代到來的背景、大數(shù)據(jù)的發(fā)展歷程、世界各國的大數(shù)據(jù)發(fā)展戰(zhàn)略、大數(shù)據(jù)的概念與影響、大數(shù)據(jù)的應(yīng)用以及大數(shù)據(jù)產(chǎn)業(yè);Python的安裝;numpy、pandas庫的學(xué)習(xí)9第1次討論課numpy庫、pandas庫在財務(wù)上的應(yīng)用1第2章 大數(shù)據(jù)思維;爬蟲、可視化初體驗物聯(lián)網(wǎng)的概念和應(yīng)用、云計算的概念和應(yīng)用、大數(shù)據(jù)和云計算以及物聯(lián)網(wǎng)的相互關(guān)系;爬蟲學(xué)習(xí),爬取京東商品評論并可視化;爬取巨潮資訊網(wǎng)公司相關(guān)信息并可視化9第2次討論課信息獲取后的加工處理;小組展示1第3章爬蟲進階大數(shù)據(jù)分析全流程所涉及的各種技術(shù);爬取巨潮資訊網(wǎng)上市公司的股市行情pyecharts庫使用——制作股票價格折線圖9第3次討論課小組展示1第4章可視化進階大數(shù)據(jù)在各行各業(yè)的主要應(yīng)用;其他數(shù)據(jù)網(wǎng)站的爬??;pyecharts庫進階使用——制作3D圖8第4次討論課小組展示1第5章實戰(zhàn)訓(xùn)練大數(shù)據(jù)安全問題、數(shù)據(jù)保護原則、數(shù)據(jù)安全和隱私保護對策;例子:商協(xié)會政策查詢服務(wù)平臺;chatGPT在數(shù)據(jù)采集與挖掘上的應(yīng)用8第5次討論課小組展示1合計48本課程的實驗教學(xué)部分設(shè)計了部分實驗項目,具體如下:實驗項目一實驗名稱:Anaconda和Python安裝與配置實驗內(nèi)容:安裝Anaconda和Python實驗性質(zhì):驗證性實驗實驗學(xué)時:3學(xué)時實驗?zāi)康呐c要求:Hadoop單機和集群模式的配置或者jupyterhub集群實驗條件:計算機,P4-2.4,8G內(nèi)存,1TG硬盤;自主上機機房管理信息系統(tǒng)研究與思考:(1)安裝Anaconda和Python;(2)安裝系統(tǒng)的安裝包;(3)課程的思政內(nèi)容:立足學(xué)科分類和課程評價體系改革,系統(tǒng)推進各學(xué)科體系課程思政的科學(xué)化、專業(yè)化路徑建設(shè),為課程思政改革奠定學(xué)科和課程基礎(chǔ)。能為師生提供遠程高效計算存儲平臺。學(xué)生可以在線做練習(xí)寫代碼,不需要硬件,網(wǎng)頁即可支持R、java和Python語言,能省不少硬件成本。實驗項目二實驗名稱:應(yīng)用python爬取某政府部門規(guī)范性文件實驗內(nèi)容:在Hadoop平臺對某政府的部門規(guī)范性文件進行爬取實驗性質(zhì):驗證性實驗實驗學(xué)時:3學(xué)時實驗?zāi)康呐c要求:熟悉Python的NumPy、SciPy、Pandas和Matplotlib各種程序庫,使其在數(shù)據(jù)分析領(lǐng)域的廣泛應(yīng)用。能安裝爬蟲所需環(huán)境,創(chuàng)建簡單的爬蟲項目。成功完成爬蟲核心實現(xiàn)。實驗條件:廣東財經(jīng)大學(xué)大數(shù)據(jù)Hadoop平臺/同心樓實驗室研究與思考:(1)對Python的NumPy、SciPy、Pandas和Matplotlib各種數(shù)據(jù)庫進行熟悉;(2)創(chuàng)建簡單的爬蟲代碼;(3)運用Python對政府文件進行爬?。唬?)課程的思政內(nèi)容:通過“某政府部門設(shè)立小金庫的案例”,引導(dǎo)同學(xué)牢記初心使命、樹立政治能力過硬、敢于擔當作為、勇于糾錯防弊的正確價值觀,切實做到“清正廉潔”。python爬取某政府部門規(guī)范性文件,要學(xué)生們學(xué)習(xí)黨和國家的政策,鼓勵學(xué)生學(xué)好專業(yè)知識。實驗項目三實驗名稱:爬取豆瓣和貓眼電影影評及可視化分析實驗內(nèi)容:用Python對豆瓣或者貓眼網(wǎng)站中某部電影的影評進行爬取,并對數(shù)據(jù)進行可視化分析實驗性質(zhì):驗證性實驗實驗學(xué)時:3學(xué)時實驗?zāi)康呐c要求:熟悉Python的NumPy、SciPy、Pandas和Matplotlib各種程序庫,使其在數(shù)據(jù)分析領(lǐng)域的廣泛應(yīng)用。能安裝爬蟲所需環(huán)境,創(chuàng)建簡單的爬蟲項目,成功完成爬蟲核心實現(xiàn),再對爬取出來的影評進行可視化。實驗條件:廣東財經(jīng)大學(xué)大數(shù)據(jù)Hadoop平臺/同心樓實驗室研究與思考:(1)主要是基于豆瓣電影的數(shù)據(jù),進行分析,所以首先要爬取相關(guān)的電影數(shù)據(jù);(2)ETL預(yù)處理;(3)數(shù)據(jù)分析;(4)可視化;(5)課程的思政內(nèi)容:爬取數(shù)據(jù)時應(yīng)該要注意網(wǎng)絡(luò)上很多信息難辨真假,是否涉及商業(yè)機密或個人隱私,要遵紀守法,不濫用所學(xué)的技術(shù)。課程從現(xiàn)代影視企業(yè)(例如:博納、阿里巴巴影視等)的發(fā)展出發(fā),結(jié)合實證研究的成果和實際案例,探討企業(yè)財務(wù)會計信息如何影響資本市場的有效運作以及在公司治理中扮演的角色,幫助學(xué)生認識當前財務(wù)會計報告的環(huán)境。授課過程中結(jié)合課程教學(xué)內(nèi)容,提煉出“公正、誠信、責(zé)任感”三個關(guān)鍵的思政元素,并融入具體的案例中。實驗項目四實驗名稱:股票動態(tài)數(shù)據(jù)獲取及可視化分析實驗內(nèi)容:用Python對同花順網(wǎng)站中某支股票的數(shù)據(jù)進行爬取,并對數(shù)據(jù)進行可視化分析實驗性質(zhì):驗證性實驗實驗學(xué)時:3學(xué)時實驗?zāi)康呐c要求:熟悉Python的NumPy、SciPy、Pandas和Matplotlib各種程序庫,使其在數(shù)據(jù)分析領(lǐng)域的廣泛應(yīng)用。能安裝爬蟲所需環(huán)境,創(chuàng)建簡單的爬蟲項目,成功完成爬蟲核心實現(xiàn),再對爬取出來的股票動態(tài)進行可視化。實驗條件:廣東財經(jīng)大學(xué)大數(shù)據(jù)Hadoop平臺/同心樓實驗室研究與思考:(1)主要是基于股票的動態(tài)進行分析,所以首先要爬取相關(guān)的股票數(shù)據(jù);(2)ETL預(yù)處理;(3)數(shù)據(jù)分析;(4)可視化;(5)課程的思政內(nèi)容:用Python對有關(guān)金融和經(jīng)濟數(shù)據(jù)收集后進行整理和分析,動態(tài)數(shù)據(jù)呈現(xiàn),為學(xué)校重點學(xué)科服務(wù),滿足應(yīng)用型大學(xué)人才培養(yǎng)。通過剖析“控制權(quán)轉(zhuǎn)移中的內(nèi)幕交易監(jiān)管案例”,深入分析了內(nèi)幕交易如何違反“公開、公平、公正”原則而對投資者和資本市場造成不良影響,使學(xué)生樹立人格要正、自律要嚴的價值思想;通過引用“云南綠大地財務(wù)舞弊案例”,分析財務(wù)舞弊對投資者和資本市場造成的嚴重負面影響,告誡學(xué)生誠信從業(yè)不僅是每一位會計人必須承擔的社會責(zé)任,更是會計行業(yè)賴以生存和發(fā)展的基礎(chǔ)。實驗項目五實驗名稱:爬取京東商品評論數(shù)據(jù)并可視化實驗內(nèi)容:爬取京東商品評論數(shù)據(jù)并可視化實驗性質(zhì):驗證性實驗實驗學(xué)時:3學(xué)時實驗?zāi)康呐c要求:要求學(xué)生能夠熟悉Python的NumPy、SciPy、Pandas和Matplotlib各種程序庫,使其在數(shù)據(jù)分析領(lǐng)域的廣泛應(yīng)用。能安裝爬蟲所需環(huán)境,能夠熟練的運用pyecharts庫將數(shù)據(jù)可視化實驗條件:廣東財經(jīng)大學(xué)大數(shù)據(jù)Hadoop平臺/同心樓實驗室研究與思考:(1)主要是基于京東的json數(shù)據(jù),進行分析,所以首先要找到存儲相關(guān)json數(shù)據(jù)的網(wǎng)址;(2)ETL預(yù)處理;(3)數(shù)據(jù)分析;(4)可視化;(5)課程的思政內(nèi)容:爬取數(shù)據(jù)時應(yīng)該要注意網(wǎng)絡(luò)上很多信息難辨真假,是否涉及商業(yè)機密或個人隱私,要遵紀守法,不濫用所學(xué)的技術(shù)。課程從電商平臺(例如:京東、淘寶等)的發(fā)展出發(fā),結(jié)合實證研究的成果和實際案例,探討企業(yè)財務(wù)會計信息如何影響資本市場的有效運作以及在公司治理中扮演的角色,幫助學(xué)生認識當前財務(wù)會計報告的環(huán)境。授課過程中結(jié)合課程教學(xué)內(nèi)容,提煉出“公正、誠信、責(zé)任感”三個關(guān)鍵的思政元素,并融入具體的案例中。實驗項目六實驗名稱:商協(xié)會政策數(shù)據(jù)爬取及可視化分析實驗內(nèi)容:商協(xié)會政策數(shù)據(jù)爬取及可視化分析實驗性質(zhì):驗證性實驗實驗學(xué)時:3學(xué)時實驗?zāi)康呐c要求:要求學(xué)生能夠熟悉Python的NumPy、SciPy、Pandas和Matplotlib各種程序庫,使其在數(shù)據(jù)分析領(lǐng)域的廣泛應(yīng)用。能安裝爬蟲所需環(huán)境,能夠熟練的運用python把爬取商協(xié)會政策數(shù)據(jù)實驗條件:廣東財經(jīng)大學(xué)大數(shù)據(jù)Hadoop平臺/同心樓實驗室研究與思考:(1)熟悉Python的操作;(2)安裝所需環(huán)境;(3)創(chuàng)建爬取商協(xié)會政策數(shù)據(jù)的代碼;(4)課程的思政內(nèi)容:學(xué)習(xí)和工作中對學(xué)生都是非常重要的,引導(dǎo)學(xué)生樹立正確的職業(yè)目標,培養(yǎng)良好的職業(yè)素養(yǎng)和職業(yè)操守,努力學(xué)習(xí),成為對祖國有用的人。四、考核方式與標準最終成績由平時作業(yè)成績、平時測驗成績、期末成績和小論文成績等組合而成。各部分所占比例如下:平時考勤成績:10%。出勤以及課堂情況,主要考核對每堂課知識點的理解和掌握程度。實驗報告成績:50%。主要考核數(shù)據(jù)處理分析能力。平時作業(yè)成績:40%。主要考核對核心知識的理解程度,以小組作業(yè)或個人作業(yè)為考核依據(jù)。期末實驗報告或者期末考試成績:50%。主要考核應(yīng)用Python進行數(shù)據(jù)爬取,學(xué)會簡單的機器學(xué)習(xí)方法進行數(shù)據(jù)分析,懂得簡單的數(shù)據(jù)庫技術(shù),最后分析結(jié)果進行可視化。期末考核采用統(tǒng)一命題,分散式考核,最終提交實驗報告的形式。本大綱各部分所規(guī)定基本要求、知識點及知識點下的知識細目,都屬于考核的內(nèi)容??荚嚸}覆蓋到各部分,并適當突出重點部分,加大重點內(nèi)容的覆蓋密度。實驗報告中所涉及不同難度試題的分數(shù)比例適當。五、推薦實驗教材和教學(xué)參考書實驗教材:1.《Python應(yīng)用實戰(zhàn):爬蟲、文本分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論