版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
主講人:陳清華邏輯回歸分類任務(wù)實(shí)施【數(shù)據(jù)挖掘應(yīng)用】課程性別分類分析會(huì)使用sklearn第三方包實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法應(yīng)用;會(huì)應(yīng)用邏輯回歸算法實(shí)現(xiàn)分類分析;會(huì)使用LogisticRegression()對(duì)性別進(jìn)行分類分析與預(yù)測(cè)應(yīng)用。能力目標(biāo)主要內(nèi)容任務(wù)工單引導(dǎo)問(wèn)題任務(wù)評(píng)價(jià)標(biāo)準(zhǔn)任務(wù)解決方案代碼解析使用邏輯回歸實(shí)現(xiàn)性別分類hw.csv教學(xué)難點(diǎn)任務(wù)工單項(xiàng)目中使用的hw.csv文件中的數(shù)據(jù),包含了性別、年齡、身高、體重等數(shù)據(jù)項(xiàng)。性別項(xiàng)的值為字符類型,其中F代表女,M代表男。為了分析數(shù)據(jù),我們需要將兩者分別映射為1和0,再進(jìn)行邏輯回歸分類。任務(wù)概述
任務(wù)描述:從本地文件(hw.csv)中獲取數(shù)據(jù)并邏輯回歸分類分析。010010011001101010100100110110100101110101000100001011011101001010101101010011010010數(shù)據(jù)源hw.csv顯示結(jié)果
任務(wù)要求任務(wù)概述(1)性別與人的哪些生理特征是密切相關(guān)的?(2)男和女的映射值會(huì)不會(huì)對(duì)訓(xùn)練結(jié)果造成影響?(3)邏輯回歸的原理是什么?主要應(yīng)用在哪些方面?(4)sklearn中是如何實(shí)現(xiàn)邏輯回歸算法的?寫(xiě)出關(guān)鍵函數(shù)與實(shí)現(xiàn)步驟。(5)模型的輸入與輸出分別是什么?”
問(wèn)題引導(dǎo):任務(wù)概述
任務(wù)評(píng)價(jià):任務(wù)概述評(píng)價(jià)內(nèi)容評(píng)價(jià)要點(diǎn)分值分?jǐn)?shù)評(píng)定自我評(píng)價(jià)1.任務(wù)實(shí)施數(shù)據(jù)準(zhǔn)備2分?jǐn)?shù)據(jù)正確讀取得1分,數(shù)據(jù)標(biāo)簽映射正確得1分
模型訓(xùn)練2分模型初始化正確得1分,模型訓(xùn)練順利執(zhí)行得1分
模型預(yù)測(cè)2分模型能應(yīng)用得1分,模型預(yù)測(cè)結(jié)果可展現(xiàn)得1分
2.效果評(píng)估模型可視化并評(píng)估效果3分能正確展現(xiàn)模型得2分,模型準(zhǔn)確率90%以上得1分
3.任務(wù)總結(jié)依據(jù)任務(wù)實(shí)施情況總結(jié)結(jié)論1分總結(jié)內(nèi)容切中本任務(wù)的重點(diǎn)要點(diǎn)得1分
合計(jì)10分
任務(wù)解決方案一、數(shù)據(jù)讀取#coding:utf-8importpandasaspddf=pd.read_csv('hw.csv',delimiter=',')df.head()任務(wù)解決方案二、數(shù)據(jù)預(yù)處理fromsklearnimportpreprocessing#類型轉(zhuǎn)換df['Weight']=df['Weight'].astype(float)df['Height']=df['Height'].astype(float)#對(duì)性別進(jìn)行數(shù)值化處理le=preprocessing.LabelEncoder()df['Gender_2']=le.fit_transform(df['Gender'])df.head()任務(wù)解決方案三、數(shù)據(jù)可視化分析importmatplotlib.pyplotaspltX=df[['Height','Weight']]Y=df[['Gender_2']]plt.figure()plt.scatter(
df[['Height']],df[['Weight']],c=Y,s=80,edgecolors='black',linewidths=1,
cmap=plt.cm.Paired)plt.title('性別判定(實(shí)際值)')plt.xlabel('身高/厘米')plt.ylabel('體重/千克')plt.show()任務(wù)解決方案四、模型訓(xùn)練fromsklearnimportlinear_model#初始化回歸模型classifier=linear_model.LogisticRegression(solver='liblinear',C=100)#擬合classifier.fit(X,Y.values.ravel())#給出預(yù)測(cè)結(jié)果output=classifier.predict(X)output=output.reshape(len(output),1)任務(wù)解決方案五、模型應(yīng)用結(jié)果展現(xiàn)plt.figure()plt.scatter(
df[['Height']],df[['Weight']],c=output,s=80,edgecolors='black',
linewidths=1,cmap=plt.cm.Paired)plt.title('性別判定(線性分類器,預(yù)測(cè)值)')plt.xlabel('身高')plt.ylabel('體重')plt.show()任務(wù)解決方案五、模型應(yīng)用結(jié)果展現(xiàn):進(jìn)階x_min,x_max=df[['Height']].values.min()-1.0,df[['Height']].values.max()+1.0y_min,y_max=df[['Weight']].values.min()-1.0,df[['Weight']].values.max()+1.0step_size=0.2x_values,y_values=np.meshgrid(np.arange(x_min,x_max,step_size),np.arange(y_min,y_max,step_size))mesh_output=classifier.predict(np.c_[x_values.ravel(),y_values.ravel()])mesh_output=mesh_output.reshape(x_values.shape)plt.pcolormesh(x_values,y_values,mesh_output,cmap=plt.cm.gray)plt.scatter(df[['Height']],df[['Weight']],c=Y,s=80,edgecolors='black',linewidths
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年全球及中國(guó)牙釉質(zhì)粘結(jié)劑行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025年全球及中國(guó)塑料用群青紫行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025-2030全球健康飲食膳食計(jì)劃應(yīng)用程序行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025-2030全球大型掃描電子顯微鏡(SEM)行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025-2030全球螯合鋅鉀硼尿素行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025年全球及中國(guó)化學(xué)鍍化學(xué)品行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025年全球及中國(guó)危險(xiǎn)區(qū)域軌道衡行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025-2030全球磁性長(zhǎng)度和角度測(cè)量系統(tǒng)行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025-2030全球食用菌滅菌設(shè)備行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025-2030全球軍用航空平視顯示器行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 江蘇省泰州市靖江市2024屆九年級(jí)下學(xué)期中考一模數(shù)學(xué)試卷(含答案)
- 沐足店長(zhǎng)合同范例
- 《旅游資料翻譯》課件
- 《既有軌道交通盾構(gòu)隧道結(jié)構(gòu)安全保護(hù)技術(shù)規(guī)程》
- 2024年安徽省中考數(shù)學(xué)試卷含答案
- 2024年湖南省公務(wù)員錄用考試《行測(cè)》真題及答案解析
- 心尖球形綜合征
- DBJT 13-460-2024 既有多層住宅建筑增設(shè)電梯工程技術(shù)標(biāo)準(zhǔn)
- 中國(guó)證監(jiān)會(huì)證券市場(chǎng)交易結(jié)算資金監(jiān)控系統(tǒng)證券公司接口規(guī)范
- 2025屆天津市部分學(xué)校高三年級(jí)八校聯(lián)考英語(yǔ)試題含解析
- 微項(xiàng)目 探討如何利用工業(yè)廢氣中的二氧化碳合成甲醇-2025年高考化學(xué)選擇性必修第一冊(cè)(魯科版)
評(píng)論
0/150
提交評(píng)論