版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、數(shù)據(jù)挖掘算法實驗報告1) 實驗題目基于決策樹的分類算法,屬性的選擇采用ID3或C4.5策略,采用如下的數(shù) 據(jù)建立分類決策樹。ageincomestudentcredit ratingbuys computer=30highnofairno40mediumnofairves40lowyesrairyes4Qlowvesexcellentno31. .40lowvesexcellentves=30mediumnofairno40mediumyesfairyes40mediumnoexcelentno2)算法基本思想的描述ID3選擇具有最高信息熵增益的屬性作為分裂屬性,基于這種原則我們 首先可以算出
2、初始集合的熵,然后分別求出以各個屬性為分裂屬性時的熵, 然后將通過上面得到的數(shù)據(jù)算出以各個屬性為分裂屬性時的信心增益,選擇 具有最大的信息增益屬性作為我們的分裂屬性。3) 編程實現(xiàn)算法#include #include #include using namespace std;#define SIZE 14struct Data(char age10;char income10;char student10;char credit_rating20;char buys_computer10;;Data data SIZE=(=30,high,氣o,fair,氣o,40,medium,no,fa
3、ir,yes,40,low,yes,fair,yes,40,low,yes,excellent,no,31.40,low,yes,excellent,yes,=30,medium,no,fair,no,40,medium,yes,fair,yes,40,medium,no,excellent,no;double calculate(double a,double b);void origin_entropy(Data data,double &entropy);void age_entropy(Data data,double &entropy);void income_entropy(Dat
4、a data,double &entropy);void student_entropy(Data data,double &entropy);void credit_rating_entropy(Data data,double &entropy);int main()(double origin=0,age=0,student=0,credit_rating=0,income=0;origin_entropy(data,origin);age_entropy(data,age);student_entropy(data,student);income_entropy(data,income
5、);credit_rating_entropy(data,credit_rating);coutinfo(D)=originendl;cout用 age 作為分裂屬性時:偵熵 info(age)(D)=agett信息增益為:origin-ageendl;cout用 income 作為分裂屬性時:n熵 info(income)(D)=incomett 信 息 增 益 為:origin-incomeendl;cout用 student 作為分裂屬性時:n熵 info(student)(D)=):studenttt 信 息 增 益 為:origin-studentendl;cout用 credit_
6、rating 作為分裂屬性時:n 熵 info(credit_rating)(D)=credit_ratingt 信息增益 為:origin-credit_ratingendl;return 0;double calculate(double a,double b)(if(a=0)return 0;elsereturn (a/b)*log10(b/a)/log10(2);void origin_entropy(Data data,double &entropy)(int i;double yes=0, no=0;for( i=0;iSIZE;i+)(if(strcmp(datai.buys_c
7、omputer,yes)=0)yes+;elseno+;entropy二calculate(yes,SIZE)+calculate(no,SIZE);void age_entropy(Data data,double &entropy)(double youth3=0;double middle3=0;double old3 = 0;for (int i=0;iSIZE;i+)(if(strcmp(datai.age,=30)=0)(strcmp(datai.buys_computer,yes)=0)?youth0+:youth1+ ;youth2+;else if(strcmp(datai.
8、age,31.40)=0)(strcmp(datai.buys_computer,yes)=0)?middle0+:middle1 +;middle2+;else(strcmp(datai.buys_computer,yes)=0)?old0+:old1+;old 2+;entropy二youth2/SIZE*(calculate(youth0,youth2)+calculate( youth1,youth2)+middle2/SIZE*(calculate(middle0,middle2 )+calculate(middle1,middle2)+old2/SIZE*(calculate(ol
9、d0 ,old2)+calculate(old1,old2);void income_entropy(Data data,double &entropy)(double high3 = 0;double medium3=0;double low3 = 0;for (int i=0;iSIZE;i+)(if(strcmp(datai.income,high)=0)(strcmp(datai.buys_computer,yes)=0)?high0+:high1+;h igh2+;else if(strcmp(datai.income,medium)=0)(strcmp(datai.buys_com
10、puter,yes)=0)?medium0+:medium1 +;medium2+;else(strcmp(datai.buys_computer,yes)=0)?low0+:low1+;low 2+;entropy=high2/SIZE*(calculate(high0,high2)+calculate(hig h1,high2)+medium2/SIZE*(calculate(medium0,medium2)+ca lculate(medium1,medium2)+low2/SIZE*(calculate(low0,low 2)+calculate(low1,low2);void stud
11、ent_entropy(Data data,double &entropy)(double yes3 = 0;double no3 = 0;for (int i=0;iSIZE;i+)(if(strcmp(datai.student,yes)(strcmp(datai.buys_computer,yes)?yes0+:yes1+;yes2+7else(strcmp(datai.buys_computer,yes)?no0+:no1+;no2+;entropy=yes2/SIZE*(calculate(yes0,yes2)+calculate(yes1,yes2)+no2/SIZE*(calculate(no0,no2)+calculate(no1,no 2);void credit_rating_entropy(Data data,double &entropy)(double fair3 = 0;double excellent3=0;for (int i=0;iSIZE;i+)(if(strcmp(datai.credit_rating,fair)(strcmp(datai.buys_computer,yes)?fair0+:fair1+;fair2+;else(strcmp(datai.buys_computer,yes)?excellent0+:exce
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年財務(wù)咨詢服務(wù)條款3篇
- 2025年度智能電網(wǎng)關(guān)鍵設(shè)備變壓器安裝及運維服務(wù)承包合同3篇
- 2025年度倉儲設(shè)施建設(shè)與運營維護合同3篇
- 2024版貨運運輸合同范文
- 世界地理分區(qū)習(xí)題《帶答案》大全
- 2025年度數(shù)字工廠廠房出租居間服務(wù)協(xié)議3篇
- 馬良三夢好詞好句好段讀后感
- 2024年智能暖通系統(tǒng)節(jié)能優(yōu)化改造工程合同3篇
- 浙江水利水電學(xué)院《面向?qū)ο蟮某绦蛟O(shè)計》2023-2024學(xué)年第一學(xué)期期末試卷
- 湖南環(huán)境生物職業(yè)技術(shù)學(xué)院《生物醫(yī)用高分子村料》2023-2024學(xué)年第一學(xué)期期末試卷
- 實習(xí)終止及解除協(xié)議書
- 河南省信陽市浉河區(qū)9校聯(lián)考2024-2025學(xué)年八年級上學(xué)期12月月考地理試題(含答案)
- 中國冠心病康復(fù)循證實踐指南(2024版)解讀
- 2024-2030年中國再生水行業(yè)發(fā)展前景預(yù)測規(guī)劃分析報告
- 城市公益性公墓建設(shè)項目施工組織設(shè)計
- 2022-2024年江蘇中考語文試題匯編:名著閱讀(教師版)
- 2024年秋季新人教版七年級上冊數(shù)學(xué)全冊教案
- 快速康復(fù)在骨科護理中的應(yīng)用
- 國民經(jīng)濟行業(yè)分類和代碼表(電子版)
- 安全員年終總結(jié)報告
- 《客房服務(wù)與管理》課程標準課程內(nèi)容與要求
評論
0/150
提交評論