![《大數(shù)據(jù)采集與預(yù)處理》課程標(biāo)準(zhǔn)_第1頁](http://file4.renrendoc.com/view12/M06/10/10/wKhkGWaEBROALUU0AAI3S3TaoOQ908.jpg)
![《大數(shù)據(jù)采集與預(yù)處理》課程標(biāo)準(zhǔn)_第2頁](http://file4.renrendoc.com/view12/M06/10/10/wKhkGWaEBROALUU0AAI3S3TaoOQ9082.jpg)
![《大數(shù)據(jù)采集與預(yù)處理》課程標(biāo)準(zhǔn)_第3頁](http://file4.renrendoc.com/view12/M06/10/10/wKhkGWaEBROALUU0AAI3S3TaoOQ9083.jpg)
![《大數(shù)據(jù)采集與預(yù)處理》課程標(biāo)準(zhǔn)_第4頁](http://file4.renrendoc.com/view12/M06/10/10/wKhkGWaEBROALUU0AAI3S3TaoOQ9084.jpg)
![《大數(shù)據(jù)采集與預(yù)處理》課程標(biāo)準(zhǔn)_第5頁](http://file4.renrendoc.com/view12/M06/10/10/wKhkGWaEBROALUU0AAI3S3TaoOQ9085.jpg)
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
《大數(shù)據(jù)采集與預(yù)處理》課程標(biāo)準(zhǔn)一、課程基本信息1、課程名稱:大數(shù)據(jù)采集與預(yù)處理2、課程類型:專業(yè)技能核心課3、學(xué)時(shí)學(xué)分:48學(xué)時(shí),3學(xué)分(其中:實(shí)踐24學(xué)時(shí))4、適用專業(yè):大數(shù)據(jù)二、課程定位本課程是大數(shù)據(jù)技術(shù)專業(yè)的一門重要的大數(shù)據(jù)專業(yè)核心課,主要定位于數(shù)據(jù)采集等相關(guān)崗位。本課程主要從爬蟲數(shù)據(jù)采集、日志數(shù)據(jù)采集等多個(gè)方向講解了不同類型數(shù)據(jù)的采集方法,從軟件數(shù)據(jù)預(yù)處理、Python數(shù)據(jù)預(yù)處理兩個(gè)方面講解了數(shù)據(jù)預(yù)處理的方式方法。通過學(xué)習(xí),使學(xué)生對數(shù)據(jù)采集與預(yù)處理有全面了解,系統(tǒng)學(xué)習(xí)和練習(xí)數(shù)據(jù)采集和數(shù)據(jù)預(yù)處理的操作,并具有相應(yīng)能力。三、課程目標(biāo)(一)總體目標(biāo)注重培養(yǎng)學(xué)生動(dòng)手能力,培養(yǎng)學(xué)生解決問題的能力,通過對本課程的學(xué)習(xí),學(xué)生能夠掌握數(shù)據(jù)采集和預(yù)處理的基本概念和方法。本課程主要包括數(shù)據(jù)采集與預(yù)處理的基本知識,態(tài)網(wǎng)頁數(shù)據(jù)采集、動(dòng)態(tài)網(wǎng)頁數(shù)據(jù)解析、基于框架實(shí)現(xiàn)動(dòng)態(tài)網(wǎng)頁數(shù)據(jù)采集與存儲、動(dòng)態(tài)網(wǎng)頁訪問日志數(shù)據(jù)采集和動(dòng)態(tài)網(wǎng)頁數(shù)據(jù)預(yù)處理的相關(guān)知識,為后續(xù)企業(yè)應(yīng)用做鋪墊。通過本課程的學(xué)習(xí)學(xué)生能夠掌握更多的數(shù)據(jù)采集方式和基本操作方法,可根據(jù)本課程的知識從事數(shù)據(jù)采集和預(yù)處理的相關(guān)工作。(二)具體目標(biāo)1、知識目標(biāo)通過本門課程的學(xué)習(xí)學(xué)生能夠了解數(shù)據(jù)采集與預(yù)處理的基本流程,熟悉Flume兩種文件通道的區(qū)別、熟悉Kafka集群環(huán)境搭建方法、掌握Scrapy框架配置及使用方法、熟悉ETL開源工具種類、熟悉Pandas的安裝方法。2、素質(zhì)目標(biāo)(1)具有發(fā)現(xiàn)問題、分析問題、解決問題的能力(2)具有良好的職業(yè)道德(3)具有吃苦耐勞和奉獻(xiàn)精神(4)具有愛崗敬業(yè)、誠信、務(wù)實(shí)、豁達(dá)、勤奮、謙虛好學(xué)的素質(zhì)(5)具有較強(qiáng)現(xiàn)場管理和組織能力,能較好地處理公共關(guān)系(6)具有較強(qiáng)的人際交流能力,能有效地進(jìn)行人際溝通以及團(tuán)隊(duì)協(xié)作(7)具有健康的體魄、健全的人格和健康的個(gè)性(8)具有良好的行為習(xí)慣和良好的心理素質(zhì)(9)具有較強(qiáng)的勞動(dòng)組織能力、集體意識和社會責(zé)任心四、教學(xué)內(nèi)容與要求(一)確定教學(xué)內(nèi)容的原則1、以學(xué)生為本由于大數(shù)據(jù)采集與預(yù)處理是一門理論與實(shí)際相結(jié)合的課程,需要學(xué)生動(dòng)手上機(jī)實(shí)操,在設(shè)計(jì)教學(xué)內(nèi)容時(shí)以操作為主,理論講解為輔,讓學(xué)生多動(dòng)手操作實(shí)踐。2、啟發(fā)創(chuàng)造原則最大限度地調(diào)動(dòng)學(xué)生學(xué)習(xí)的積極性和自覺性,激發(fā)他們的創(chuàng)造性思維,從而使學(xué)生在融會貫通地掌握知識和技能的同時(shí),引導(dǎo)學(xué)生發(fā)揮想象,在實(shí)例的基礎(chǔ)上進(jìn)行個(gè)性化地創(chuàng)作,充分發(fā)展自己的創(chuàng)造性能力。3、聯(lián)系實(shí)際原則教學(xué)內(nèi)容必須要與實(shí)際相結(jié)合,讓學(xué)生感受到課程的真實(shí)性,從而提高學(xué)生學(xué)習(xí)的積極性,激發(fā)學(xué)生的學(xué)習(xí)興趣。(二)課程學(xué)時(shí)安排本課程基本教學(xué)學(xué)時(shí)為48學(xué)時(shí),其中包括實(shí)踐學(xué)時(shí)24學(xué)時(shí),當(dāng)教學(xué)計(jì)劃安排的學(xué)時(shí)超出本課程的學(xué)時(shí)范圍時(shí),可根據(jù)就業(yè)面向的需要對超出部分的學(xué)時(shí)做適當(dāng)調(diào)整。(三)課程學(xué)習(xí)內(nèi)容設(shè)計(jì)與參考學(xué)時(shí)章節(jié)章節(jié)名稱教學(xué)內(nèi)容教學(xué)方法建議學(xué)時(shí)項(xiàng)目一初識動(dòng)態(tài)網(wǎng)頁數(shù)據(jù)采集與預(yù)處理1、3514認(rèn)識大數(shù)據(jù)采集與預(yù)處理1.1認(rèn)識數(shù)據(jù)來源181581.2認(rèn)識大數(shù)據(jù)采集181581.3認(rèn)識大數(shù)據(jù)預(yù)處理2、搭建數(shù)據(jù)采集與預(yù)處理開發(fā)環(huán)境2.1認(rèn)識PyCharm181582.2安裝PyCharm181582.3使用PyCharm教學(xué)方法:互動(dòng)提問,案例分析,視聽教學(xué)等理論4實(shí)踐4項(xiàng)目二動(dòng)態(tài)網(wǎng)頁數(shù)據(jù)采集1、使用Urllib模塊完成“新聞動(dòng)態(tài)”網(wǎng)頁數(shù)據(jù)采集1.1request模塊181581.2error模塊181581.3parse模塊2、使用Requests庫完成“浪潮云說”網(wǎng)頁數(shù)據(jù)采集2.1Requests簡介及安裝181582.2Requests基本使用181582.3Requests高級使用教學(xué)方法:互動(dòng)提問,實(shí)操體驗(yàn),案例分析、操作等理論4實(shí)踐4項(xiàng)目三動(dòng)態(tài)網(wǎng)頁數(shù)據(jù)解析1、使用Xpath解析“新聞動(dòng)態(tài)”網(wǎng)頁數(shù)據(jù)1.1Xpath簡介181581.2定位181581.3數(shù)據(jù)提取2、使用BeautifulSoup解析“浪潮云說”網(wǎng)頁數(shù)據(jù)2.1BeautifulSoup安裝181582.2BeautifulSoup使用教學(xué)方法:互動(dòng)提問、視聽教學(xué)、案例講解、操作等理論4實(shí)踐4項(xiàng)目四基于框架實(shí)現(xiàn)動(dòng)態(tài)網(wǎng)頁數(shù)據(jù)采集與存儲1、使用Scrapy框架完成新聞公告頁面數(shù)據(jù)采集與存儲1.1Scrapy簡介及安裝181581.2Scrapy操作指令181581.3字段定義及Scrapy設(shè)置181581.4文本解析1.5內(nèi)容存儲教學(xué)方法:互動(dòng)提問、視聽教學(xué)、案例講解、操作等理論4實(shí)踐4項(xiàng)目五動(dòng)態(tài)網(wǎng)頁訪問日志數(shù)據(jù)采集1、使用Flume采集某官網(wǎng)訪問日志數(shù)據(jù)1.1Flume簡介181581.2Flume數(shù)據(jù)采集配置1.3Flume啟動(dòng)1.4Flume攔截器配置2、使用Kafka消費(fèi)Flume中某官網(wǎng)訪問日志數(shù)據(jù)2.1Kafka簡介181582.2Kafka配置2.3Kafka腳本操作2.4KafkaPythonAPI教學(xué)方法:互動(dòng)提問、視聽教學(xué)、案例講解、操作等理論4實(shí)踐4項(xiàng)目六動(dòng)態(tài)網(wǎng)頁數(shù)據(jù)預(yù)處理1、使用Pandas實(shí)現(xiàn)新聞動(dòng)態(tài)網(wǎng)頁數(shù)據(jù)預(yù)處理1.1Pandas簡介及安裝181581.2Pandas數(shù)據(jù)結(jié)構(gòu)181581.3Pandas基本功能181581.4匯總和描述統(tǒng)計(jì)181581.5處理缺失數(shù)據(jù)2、使用Pig實(shí)現(xiàn)浪潮云說網(wǎng)頁數(shù)據(jù)預(yù)處理2.1Pig簡介181582.2Pig配置運(yùn)行2.3PigLatin執(zhí)行2.4運(yùn)算符2.5內(nèi)置函數(shù)3、使用ELK實(shí)現(xiàn)某官網(wǎng)日志數(shù)據(jù)預(yù)處理3.1Elasticsearch181583.2Logstash181583.3Kibana教學(xué)方法:互動(dòng)提問,案例分析,視聽教學(xué)、操作等。理論4實(shí)踐4五、課程標(biāo)準(zhǔn)適用范圍本課程標(biāo)準(zhǔn)適用于高職計(jì)算機(jī)應(yīng)用技術(shù)專業(yè)、大數(shù)據(jù)專業(yè)六、關(guān)于課程標(biāo)準(zhǔn)的說明1.該課程作為考試課,通過本課程的學(xué)習(xí)要求學(xué)生掌握大數(shù)據(jù)采集與預(yù)處理的基本操作,具備獨(dú)立分析業(yè)務(wù)需求并完成數(shù)據(jù)采集與處理的能力。2.本標(biāo)準(zhǔn)根據(jù)環(huán)境和條件變化可適時(shí)修訂。如有國家或行業(yè)出臺了新的課程標(biāo)準(zhǔn),以國家或行業(yè)標(biāo)準(zhǔn)為準(zhǔn)。七、考核及成績評定方式(一)考核方式:考試(二)成績評定辦法1、成績評定構(gòu)成:單元測驗(yàn)分?jǐn)?shù)/作業(yè)分?jǐn)?shù)*40%+實(shí)踐分?jǐn)?shù)*20%+期末考試分?jǐn)?shù)*40%=總成績(100分)2、成績評定細(xì)則:單元測驗(yàn)/作業(yè):4課時(shí)一次測驗(yàn)/作業(yè),根據(jù)完成情況給予評價(jià)。實(shí)踐:完成實(shí)訓(xùn)/實(shí)驗(yàn)指導(dǎo)書中規(guī)定的每個(gè)實(shí)訓(xùn)項(xiàng)目,根據(jù)實(shí)訓(xùn)/實(shí)驗(yàn)報(bào)告給予評價(jià)。期末考試:理論考試,覆蓋各教學(xué)單元的基本技術(shù)原理及應(yīng)用,著重考察對重點(diǎn)教學(xué)內(nèi)容的綜合掌握情況。鼓勵(lì)將過程考核、實(shí)際能力考核、全面考核等理念貫徹到課程考核中來,重點(diǎn)著眼于科學(xué)全面地評價(jià)學(xué)生綜合素質(zhì),強(qiáng)化知識應(yīng)用能力和創(chuàng)新
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 財(cái)務(wù)部年終報(bào)告開創(chuàng)新局面引領(lǐng)新風(fēng)尚
- 手工藝行業(yè)衛(wèi)生衛(wèi)生控制
- 2025-2030全球電子后視鏡系統(tǒng)行業(yè)調(diào)研及趨勢分析報(bào)告
- 2025-2030全球聯(lián)合收割機(jī)皮帶行業(yè)調(diào)研及趨勢分析報(bào)告
- 2025-2030全球3D 打印陶瓷絲行業(yè)調(diào)研及趨勢分析報(bào)告
- 2025年全球及中國智能睡眠盒行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報(bào)告
- 2025-2030全球IP65工業(yè)顯示器行業(yè)調(diào)研及趨勢分析報(bào)告
- 2025-2030全球機(jī)器人用立體攝像頭行業(yè)調(diào)研及趨勢分析報(bào)告
- 2025-2030全球不銹鋼面板安裝顯示器行業(yè)調(diào)研及趨勢分析報(bào)告
- 2025-2030全球全液壓解耦系統(tǒng)行業(yè)調(diào)研及趨勢分析報(bào)告
- 中國儲備糧管理集團(tuán)有限公司蘭州分公司招聘筆試真題2024
- 第1課 隋朝統(tǒng)一與滅亡 課件(26張)2024-2025學(xué)年部編版七年級歷史下冊
- 提高金剛砂地坪施工一次合格率
- 【歷史】唐朝建立與“貞觀之治”課件-2024-2025學(xué)年統(tǒng)編版七年級歷史下冊
- 產(chǎn)業(yè)園區(qū)招商合作協(xié)議書
- 2024年廣東省公務(wù)員錄用考試《行測》真題及答案解析
- 2025新譯林版英語七年級下單詞默寫表
- 盾構(gòu)標(biāo)準(zhǔn)化施工手冊
- 天然氣脫硫完整版本
- 中歐班列課件
- 2025屆高三數(shù)學(xué)一輪復(fù)習(xí)備考經(jīng)驗(yàn)交流
評論
0/150
提交評論