中職教育二年級上學(xué)期電子與信息《大數(shù)據(jù)導(dǎo)論3規(guī)范化處理》教學(xué)設(shè)計_第1頁
中職教育二年級上學(xué)期電子與信息《大數(shù)據(jù)導(dǎo)論3規(guī)范化處理》教學(xué)設(shè)計_第2頁
中職教育二年級上學(xué)期電子與信息《大數(shù)據(jù)導(dǎo)論3規(guī)范化處理》教學(xué)設(shè)計_第3頁
中職教育二年級上學(xué)期電子與信息《大數(shù)據(jù)導(dǎo)論3規(guī)范化處理》教學(xué)設(shè)計_第4頁
中職教育二年級上學(xué)期電子與信息《大數(shù)據(jù)導(dǎo)論3規(guī)范化處理》教學(xué)設(shè)計_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

PAGEPAGE1課題名稱:數(shù)據(jù)轉(zhuǎn)換之規(guī)范化處理授課班級:中職二年級專業(yè):大數(shù)據(jù)技術(shù)應(yīng)用授課時間:課型:理論教具:多媒體課時:1一、教學(xué)內(nèi)容分析教材是為高校大數(shù)據(jù)專業(yè)而編,對中職生偏難。掌握規(guī)范化處理的整體概念,理解并掌握三大常用方法及各子概念,培養(yǎng)研究性學(xué)習(xí)創(chuàng)新學(xué)習(xí)的能力與意識,形成數(shù)據(jù)轉(zhuǎn)換之規(guī)范化處理的意識及情感激勵。二、學(xué)情分析二年級大數(shù)據(jù)專業(yè)學(xué)生,已掌握部分計算機、網(wǎng)絡(luò)基礎(chǔ)理論及常識,但此前還沒有學(xué)習(xí)大數(shù)據(jù)專業(yè)基礎(chǔ)、核心課程,中職入學(xué)成績不夠好,可能學(xué)習(xí)方法不完善,紀律、習(xí)慣及上進心較差,對數(shù)據(jù)轉(zhuǎn)換之平滑處理有所了解。三、設(shè)計思路:由學(xué)情及教材和教學(xué)內(nèi)容知,教材是為高校大數(shù)據(jù)專業(yè)而編,對中職生來說過于精簡,需要整合實例及練習(xí)于教學(xué)過程以豐富教學(xué)過程,使明確及隱含的知識及能力更適宜中職生了解、理解、掌握。所以增加了一批數(shù)據(jù)以表或其他形式幫助學(xué)生學(xué)習(xí),并圍繞數(shù)據(jù)進行解析、練習(xí)。只是微課視頻的形式不利于交互,未來最好補充交互手段例如問卷交互,或以微課交互軟件呈現(xiàn),實現(xiàn)及時反饋適時評價學(xué)習(xí)過程與完善學(xué)習(xí)者累積數(shù)據(jù)維護。四、教學(xué)目標(biāo):(一)知識目標(biāo):掌握規(guī)范化處理常用方法有哪幾個,從數(shù)據(jù)直觀與抽象的角度探索三大種常用方法,形成規(guī)范化處理是數(shù)據(jù)轉(zhuǎn)換的子概念及規(guī)范化處理各方法子概念,從數(shù)據(jù)實例上理解規(guī)范化處理常用方法及優(yōu)缺點。(二)能力目標(biāo):(專業(yè)能力、方法能力、社會能力)培養(yǎng)數(shù)據(jù)轉(zhuǎn)換之規(guī)范化處理的研究性學(xué)習(xí)、創(chuàng)新學(xué)習(xí)相關(guān)的能力與意識,形成規(guī)范化處理的意識。(三)職業(yè)素養(yǎng):(情感體驗、態(tài)度和敬業(yè)精神)激勵愛國及為社會服務(wù)的精神,培養(yǎng)研究性學(xué)習(xí)、創(chuàng)新學(xué)習(xí)的專業(yè)思想與情感意識,形成規(guī)范化處理的意識及情感激勵。五、教學(xué)重點及難點重點:掌握規(guī)范化處理常用三種方法,從數(shù)據(jù)直觀與抽象的角度探索規(guī)范化處理方法,形成數(shù)據(jù)轉(zhuǎn)換之規(guī)范化處理的整體概念及各內(nèi)容子概念。難點:掌握并形成數(shù)據(jù)轉(zhuǎn)換之規(guī)范化處理的整體概念及各內(nèi)容子概念。六、教學(xué)過程教師活動學(xué)生活動設(shè)計意圖(一)導(dǎo)入思政及引入:同學(xué)們好,未來高素質(zhì)的勞動者,從小就應(yīng)當(dāng)培養(yǎng)一點數(shù)據(jù)處理分析的能力,我們培養(yǎng)的人才,這方面以前比較欠缺,但數(shù)據(jù)處理分析確實是研究、創(chuàng)新的基本素質(zhì),很難想象,研究、創(chuàng)新者不會利用信息設(shè)備幫助處理分析大量在實踐中遇到的數(shù)據(jù)。且人工智能與大數(shù)據(jù),是新興而關(guān)鍵的產(chǎn)業(yè)。本課討論數(shù)據(jù)轉(zhuǎn)換里的規(guī)范化處理問題。數(shù)據(jù)轉(zhuǎn)換是大數(shù)據(jù)導(dǎo)論第五章數(shù)據(jù)采集與預(yù)處理中的一個重要內(nèi)容,注意數(shù)據(jù)轉(zhuǎn)換而非數(shù)據(jù)類型轉(zhuǎn)換,數(shù)據(jù)類型轉(zhuǎn)換針對的是數(shù)值類型與文本、日期時間等相互間類型的轉(zhuǎn)換,而教材中數(shù)據(jù)轉(zhuǎn)換針對的是數(shù)值型數(shù)據(jù),是數(shù)值范圍、大小的變換、轉(zhuǎn)換。規(guī)范化處理還有另一課的平滑處理都是數(shù)據(jù)轉(zhuǎn)換的重要內(nèi)容,字面上理解,就是讓數(shù)據(jù)一起呈現(xiàn)時看起來變得規(guī)范,實質(zhì)是同一屬性的變量其變化調(diào)整規(guī)范到更合適的范圍。學(xué)好它,我們能更好的愛國,能將愛國,將提高國家、中華民族的核心競爭力落實到行動,讓我們從我做起,努力學(xué)習(xí),奮力拼搏。如交互功能完善,可問答交互激勵學(xué)生情感思政前后呼應(yīng)準備后續(xù)要點(二)教學(xué)活動教師講,與學(xué)生探討結(jié)合5.3.3規(guī)范化處理數(shù)據(jù)轉(zhuǎn)換之規(guī)范化處理——

常用:Min-Max、Z-Score、小數(shù)定標(biāo)等規(guī)范化進行分類、回歸或其他分析時,年齡、體重、身高數(shù)值范圍差異較大,相當(dāng)于權(quán)重、偏置相差太遠,體重的因素影響過大,分析評價時體重就有決定性影響。規(guī)范化對被轉(zhuǎn)換的某列數(shù)據(jù)進行一種投射轉(zhuǎn)換,變換到特定范圍,這樣各列取值范圍比較統(tǒng)一,后續(xù)處理時重要性變得一致,不會因為單位、屬性不同而在比較、訓(xùn)練、分析評價時人為引入重要程度、整體偏差的明顯差異。Min-Max規(guī)范化方法將被轉(zhuǎn)換的某列或說某個屬性的數(shù)據(jù)轉(zhuǎn)換到0與1之間,其轉(zhuǎn)換公式如下:轉(zhuǎn)換后的值=(待轉(zhuǎn)換值?最小值)/(最大值?最小值)注:所有參與運算的都是同一列或?qū)傩缘母髦?。Min-Max規(guī)范化比較簡單,但是也存在一些缺陷,當(dāng)有新的數(shù)據(jù)加入時,可能導(dǎo)致最大值和最小值的變化,需要重新定義屬性最大值和最小值。Z-Score規(guī)范化將不同量級的數(shù)據(jù)統(tǒng)一轉(zhuǎn)化為同一個量級正負都有的值,以保證數(shù)據(jù)之間的可比性及分析、訓(xùn)練時重要性的統(tǒng)一。其轉(zhuǎn)換公式如下:z=(待轉(zhuǎn)換屬性值?屬性平均值)/屬性標(biāo)準差Z-Score的優(yōu)點是不需要知道數(shù)據(jù)集的最大值和最小值,對離群點規(guī)范化效果好。此外,Z-Score能夠應(yīng)用于數(shù)值型的數(shù)據(jù),并且不受數(shù)據(jù)量級的影響,因為它本身的作用就是消除量級給分析帶來的不便。Z-Score也有一些缺陷。首先,Z-Score對于數(shù)據(jù)的分布有一定的要求,正態(tài)分布是最有利于Z-Score計算的。其次,Z-Score與Min-Max一樣,消除了數(shù)據(jù)具有的實際意義,因此,轉(zhuǎn)換后的結(jié)果用于比較、訓(xùn)練、分析后,如需使用數(shù)據(jù)的真實意義,還需要還原原值,再如需要將未轉(zhuǎn)換的數(shù)據(jù)加入到轉(zhuǎn)換后的比較、訓(xùn)練、分析中,同樣需要先轉(zhuǎn)換,要始終記得保持一致。小數(shù)定標(biāo)規(guī)范化方法通過移動屬性值的小數(shù)位置來達到規(guī)范化的目的。所移動的小數(shù)位數(shù)取決于屬性絕對值的最大值。其轉(zhuǎn)換公式為:x=待轉(zhuǎn)換屬性值/(10的k次方)其中,k為能夠使該屬性絕對值的最大值的轉(zhuǎn)換結(jié)果小于1的最小值。小數(shù)定標(biāo)法的優(yōu)點是直觀簡單,缺點是并沒有消除屬性間的權(quán)重差異。規(guī)范化處理常用三種方法記憶、理解,從數(shù)據(jù)直觀與抽象的角度探索三種常用方法及其優(yōu)缺點,形成規(guī)范化處理的整體概念及各內(nèi)容子概念。三種方法都整合數(shù)據(jù)實例進行理解并加以練習(xí)展示實例,激勵學(xué)習(xí)情感通過問答舉例、辨識,使學(xué)生對規(guī)范化處理的三種常用方法、子概念基本掌握、了解,并形成數(shù)據(jù)轉(zhuǎn)換之規(guī)范化處理的整體概念及了解優(yōu)缺點即時練習(xí)調(diào)動并在臨結(jié)束時幫助小結(jié)(三)學(xué)生練習(xí)或作業(yè)學(xué)生完成對應(yīng)附屬資源的練習(xí)P17412.請闡述數(shù)據(jù)規(guī)范化包含哪些

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論