




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、K-均值聚類算法報(bào)告算法思想K-均值算法也稱C-均值算法,是根據(jù)函數(shù)準(zhǔn)則進(jìn)行分類的聚類算法,基于使聚類準(zhǔn)則函數(shù)最小化。K-均值算法的主要思想是先在需要分類的數(shù)據(jù)中尋找K組數(shù)據(jù)作為初始聚類中心,然后計(jì)算其他數(shù)據(jù)距離這三個聚類中心的距離,將數(shù)據(jù)歸入與其距離最近的聚類中心,之后再對這K個聚類的數(shù)據(jù)計(jì)算均值,作為新的聚類中心,繼續(xù)以上步驟,直到新的聚類中心與上一次的聚類中心值相等時結(jié)束算法。準(zhǔn)則函數(shù):聚類集中每一樣本點(diǎn)到該類中心的距離平方和。對于第j個聚類集,準(zhǔn)則函數(shù)定義為:Z=刃X,XeSjNiijji二1Sj:第j個聚類集(域)聚類中心為Zj;Nj:第j個聚類集Sj中所包含的樣本個數(shù)。對所有K個模
2、式類有:J=菖卩11X-ZIl2,XeSijijj=1i=1K-均值算法的聚類準(zhǔn)則:聚類中心的選擇應(yīng)使準(zhǔn)則函數(shù)J極小,即使Jj的值極小。即有:丄乞IIx-zii2=_L5L(x-z)t(x-z)=0宓ji=1#ijcZ1j1jji=1可解得:J=才11X-ZI|2,XeSjijiji=1上式表明,Sj類的聚類中心應(yīng)選為該類樣本的均值算法描述任選K個初始聚類中心:Zl(l),Z2(l),,ZK(1)括號內(nèi)序號:迭代運(yùn)算的次序號。按最小距離原則將其余樣品分配到K個聚類中心中的某一個,即:min|XZ(k)|,i=1,2,K丄XZ(k)=D(k)ijj則XeS(k)計(jì)算各個聚類中心的新向量值:Z(k
3、+1)j=1,2,KjNj:Z(k+1)=j第j類的樣本數(shù)。工XXeSj(k)j=12,K如果Z(k+1)豐Z(k)j=1,2,K則回到(2),將模式樣本逐個重新分類,重復(fù)迭代計(jì)算。j如果Z(k+1)=Z(k)j=1,2,K,則算法收斂,計(jì)算完畢。算法討論結(jié)果受到所選聚類中心的個數(shù)和其初始位置,以及模式樣本的幾何性質(zhì)及讀入次序等的影響。實(shí)際應(yīng)用中需要試探不同的K值和選擇不同的聚類中心起始值,一般可選擇樣本集中前K個樣本作為初始聚類中心。計(jì)算流程本次程序計(jì)算過程嚴(yán)格按照算法描述,通過選取初始聚類中心、計(jì)算距離、計(jì)算新的聚類中心、判斷結(jié)果的收斂性等迭代過程,最終得出聚類結(jié)果和聚類中心。具體流程如下
4、圖:分類結(jié)果讀取前50個數(shù)據(jù)時的兩類聚類中心矢量Z1和Z2,以及對應(yīng)的兩類數(shù)據(jù)集合G1和G2聚類結(jié)果如下:讀取前100個數(shù)據(jù)時的兩類聚類中心矢量Z1和Z2,以及對應(yīng)的兩類數(shù)據(jù)集合G1和G2聚類結(jié)果如下:讀取全部數(shù)據(jù)時的兩類聚類中心矢量Z1和Z2,以及對應(yīng)的兩類數(shù)據(jù)集合G1和G2聚類結(jié)果如下:附:源代碼#include#include#include#include#defineCOUNT150/數(shù)據(jù)個數(shù)structdatafloatdx;floatdy;floatdz;floatdm;intsymbol;/標(biāo)號data150,Zdata2,Cz2;inttime=0;/記錄迭代次數(shù)intjud
5、ge(floati,floatj)/判斷數(shù)據(jù)屬于哪個分類if(i=j)return1;elsereturn2;voidmain()intz1=0,z2=0;/存放每個聚類的元素個數(shù)floata=0,b=0,c=0,d=0,e2,t8;floatsum=0;intcount;fstreamoutputFile;outputFile.open(IrisData.txt,ios:in);/打開文件if(!outputFile)coutCantopentheFile!endl;exit(0);for(count=0;countdatacount.dx;outputFiledatacount.dy;ou
6、tputFiledatacount.dz;outputFiledatacount.dm;datacount.symbol=0;outputFile.close();for(count=0;count2;count+)/初始化聚類Zdatacount.dx=datacount.dx;Zdatacount.dy=datacount.dy;Zdatacount.dz=datacount.dz;Zdatacount.dm=datacount.dm;Zdatacount.symbol=datacount.symbol;do/初始化Cz0.dx=0;Cz0.dy=0;Cz0.dz=0;Cz0.dm=0;C
7、z1.dx=0;Cz1.dy=0;Cz1.dz=0;Cz1.dm=0;for(count=0;countCOUNT;count+)/判斷每個元素屬于哪個聚類a=(Zdata0.dx-datacount.dx);b=(Zdata0.dy-datacount.dy);c=(Zdata0.dz-datacount.dz);d=(Zdata0.dm-datacount.dm);e0=sqrt(a*a+b*b+c*c+d*d);/計(jì)算歐氏距離a=(Zdata1.dx-datacount.dx);b=(Zdata1.dy-datacount.dy);c=(Zdata1.dz-datacount.dz);d
8、=(Zdata1.dm-datacount.dm);e1=sqrt(a*a+b*b+c*c+d*d);datacount.symbol=judge(e0,e1);/比較到兩個聚類中心的距離z1=0;z2=0;for(count=0;countvCOUNT;count+)計(jì)算每個聚類的兀素個數(shù)if(datacount.symbol=1)Cz0.dx+=datacount.dx;Cz0.dy+=datacount.dy;Cz0.dz+=datacount.dz;Cz0.dm+=datacount.dm;z1+;elseif(datacount.symbol=2)Cz1.dx+=datacount.
9、dx;Cz1.dy+=datacount.dy;Cz1.dz+=datacount.dz;Cz1.dm+=datacount.dm;z2+;Cz0.dx=Cz0.dx/z1;/計(jì)算新的聚類中心Cz0.dy=Cz0.dy/z1;Cz0.dz=Cz0.dz/z1;Cz0.dm=Cz0.dm/z1;Cz1.dx=Cz1.dx/z2;Cz1.dy=Cz1.dy/z2;Cz1.dz=Cz1.dz/z2;Cz1.dm=Cz1.dm/z2;+time;sum=0;t0=(Zdata0.dx-Cz0.dx)*(Zdata0.dx-Cz0.dx);/新的聚類中心與前一次中心比較t1=(Zdata0.dy-Cz0
10、.dy)*(Zdata0.dy-Cz0.dy);t2=(Zdata0.dz-Cz0.dz)*(Zdata0.dz-Cz0.dz);t3=(Zdata0.dm-Cz0.dm)*(Zdata0.dm-Cz0.dm);t4=(Zdata1.dx-Cz1.dx)*(Zdata1.dx-Cz1.dx);t5=(Zdata1.dy-Cz1.dy)*(Zdata1.dy-Cz1.dy);t6=(Zdata1.dz-Cz1.dz)*(Zdata1.dz-Cz1.dz);t7=(Zdata1.dm-Cz1.dm)*(Zdata1.dm-Cz1.dm);for(count=0;count8;count+)sum+
11、=tcount;Zdata0.dx=Cz0.dx;Zdata0.dy=Cz0.dy;Zdata0.dz=Cz0.dz;Zdata0.dm=Cz0.dm;Zdata1.dx=Cz1.dx;Zdata1.dy=Cz1.dy;Zdata1.dz=Cz1.dz;Zdata1.dm=Cz1.dm;while(sum!=0);/分類結(jié)果與前一次迭代結(jié)果不同,繼續(xù)迭代coutvv下標(biāo)從1到150分類成功!vvendl;coutvvendlvv第一類數(shù)據(jù)集合G1下標(biāo)號為:vvendl;輸出第一類結(jié)果for(count=0;countvCOUNT;count+)if(datacount.symbol=1)coutvvcount+1vv;coutvvendlvv共vvzlvv個元素vvendl;coutvv中心矢量Z1是:(vvZdata0.dxvvvvZdata0.dyvvvvZdata0.dzvvvvZdata0.dmvv)vvendl;coutvvendlvv第二類數(shù)據(jù)集合G2下標(biāo)號為:vvendl;輸出第二類結(jié)果for(count=0;countvCOUNT;count+)if(d
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025【強(qiáng)化合同管理的緊迫性】合同管理為何重要
- 2025飲料供應(yīng)合同協(xié)議書范本
- 2024年電纜橋架項(xiàng)目資金籌措計(jì)劃書代可行性研究報(bào)告
- 2024年塑料加工專用設(shè)備項(xiàng)目資金籌措計(jì)劃書代可行性研究報(bào)告
- 2025建筑陶瓷采購合同模板
- 2025合作生產(chǎn)協(xié)議合同格式
- 《信息化時代的檔案管理:課件發(fā)展新篇章》
- 2025合作合同:加盟合同
- 2025電子產(chǎn)品買賣合同
- 2025授權(quán)銀行代繳醫(yī)療保險(xiǎn)費(fèi)合同樣本
- 施工員培訓(xùn)課件(PPT-54張)
- 廠家管道吹掃方案(參考)
- 軋鋼高線車間裝配工工藝規(guī)程
- 鋼板樁施工專項(xiàng)方案
- 水土保持常用監(jiān)測表格(共9頁)
- PPT翻書動畫效果的制作
- 病理學(xué)第十六章-神經(jīng)系統(tǒng)疾病
- 上海市南匯區(qū)醫(yī)院檢驗(yàn)科生物安全手冊
- 股權(quán)投資郵箱
- 消防設(shè)施移交和清單-(精編版)
- 隧道口輕型鋼棚洞防護(hù)高邊坡施工技術(shù)
評論
0/150
提交評論