版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
3.13.1數(shù)據(jù)說明3.本文實驗數(shù)據(jù)來自著名的UCI機(jī)器學(xué)習(xí)數(shù)據(jù)庫,該數(shù)據(jù)庫有大量的人工智能數(shù)據(jù)挖掘數(shù)據(jù),為:。該數(shù)據(jù)庫是不斷更新的,也接受數(shù)據(jù)的捐2010199本文選用的數(shù)據(jù)來類型為:BreastCancerWisconsin(Original)DataSet,中文名稱條數(shù)據(jù)具有11個屬性。下來的數(shù)據(jù)文件格式為“.data”,通過使用Excel和 下表是該數(shù)據(jù)集的11個屬性名稱及說明:3.2據(jù)預(yù)處理與程3.2據(jù)預(yù)處理與程本文在轉(zhuǎn)換數(shù)據(jù)后,首先進(jìn)行了預(yù)處理,由于本文的數(shù)據(jù)范圍都是1-10,因此不需要歸一 數(shù)據(jù)集特征提3.1ReliefF算法來計算各個特征的權(quán)重,權(quán)重小于某個閾值的特征將被移2-3種剔除。由于算法在運行過程中,會選擇R,隨機(jī)數(shù)的不同將導(dǎo)致結(jié)果權(quán)重有一定的出入,因此本文采取平均的方法,將20次,然后將結(jié)果匯總求出每種權(quán)重的平均值。如下所示,列為屬性編號,行0.02945從上面的特征權(quán)重可以看出,屬性6核大小是最主要的影響因素,說明患者的癥狀最先表現(xiàn)了核大小上,將直接導(dǎo)致核大小的變化,其次是屬性1和屬性8等,后幾面是著重對幾個重要的屬性進(jìn)行分析。下面是20次測試中,核大?。▽傩?)的權(quán)重變1 數(shù)據(jù)集聚類分塊厚度屬性的特征權(quán)重在0.19-25左右變動,也是權(quán)重極高的一個,說明該特征屬性在乳6,和 數(shù)據(jù)集聚類分ReliefF算法對數(shù)據(jù)集的分析,可以得到屬性權(quán)重的重要程度,這些可以對臨高診斷的速度和正確率。下面將通過K-menas聚類分析算法對數(shù)據(jù)進(jìn)行分析。本小節(jié)將分下面將采用Kmeans算法單獨對數(shù)據(jù)集進(jìn)行分析。中已經(jīng)包括了一些常規(guī)數(shù)據(jù)挖掘的算法,例如本文所用到的K-meanskmeans,可以對數(shù)據(jù)集進(jìn)行聚類分成了2類,總體的正確率為94.44%,其中第一類的正確率為93.56%,第二類的正確率96.31%。下面是分類后對按照不同屬性的繪制的屬性值分布圖:限于篇幅,只選擇了上述3個特征屬性進(jìn)行圖像繪制,從結(jié)果來看,可以很直觀的觀察K-means算法分類后的情況,第一類與第一類的分類界限比較清晰。但是不容易觀察到K-means算法的效果來看,能夠很準(zhǔn)確的將數(shù)據(jù)集進(jìn)行分類。一方面是由于該數(shù)據(jù)集,K-menas2類的作用較大。2.K-means2.K-meansReliefF單從分類正確率和結(jié)果方面來看,K-mens算法已經(jīng)完全可以對數(shù)據(jù)集做出非常準(zhǔn)確ReliefFReliefF算法和K-means3.2k-menas分類數(shù)據(jù)3.29<5<7<4<2<3<8<1<6,根ReliefF61重要的特征屬性,應(yīng)該對分類96最高,這與ReliefF算法測試的結(jié)果大致相似,但ReliefFar算法中間部分權(quán)重接近,所以也區(qū)分不明顯。說明特征屬性權(quán)重的判斷對K-means算法中即可。由于輸入數(shù)據(jù)的變化,K-means分類時結(jié)果肯定是有差距的,所以單獨從一個屬6個屬性,其正確率就達(dá)到選擇所有屬性的33K-means3還是采用中的kmeans函數(shù),將分類數(shù)改為3,由于分為3類后數(shù)據(jù)類型增多,683444239條:100%99條數(shù)據(jù),分類正確率為100136K-meansReliefF算法,先去掉一部分特征權(quán)重較小的特征屬性后,再
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 電豆?jié){機(jī)產(chǎn)業(yè)規(guī)劃專項研究報告
- 擋風(fēng)玻璃刮水器市場發(fā)展現(xiàn)狀調(diào)查及供需格局分析預(yù)測報告
- 醫(yī)用汞軟膏市場洞察報告
- 礦物質(zhì)膳食補(bǔ)充劑產(chǎn)業(yè)運行及前景預(yù)測報告
- 2024年范文物業(yè)委托經(jīng)營管理協(xié)議
- 項目經(jīng)理崗位聘用合同
- 礦車推桿產(chǎn)業(yè)規(guī)劃專項研究報告
- 新房裝修協(xié)議合同
- 電動頭發(fā)拉直器產(chǎn)品入市調(diào)查研究報告
- 經(jīng)典供貨合同范文經(jīng)典
- 當(dāng)代社會政策分析 課件 第二章 就業(yè)社會政策
- GB/T 19633.2-2024最終滅菌醫(yī)療器械包裝第2部分:成型、密封和裝配過程的確認(rèn)的要求
- 信息技術(shù)知識點
- 小班幼兒優(yōu)勢分析總結(jié)與反思
- 養(yǎng)老機(jī)構(gòu)照護(hù)機(jī)構(gòu)長期護(hù)理服務(wù)安全風(fēng)險評估、風(fēng)險防范記錄表1-3-5
- 信息化工程分包合同范本
- FZ∕T 71006-2021 山羊絨針織絨線
- 消防培訓(xùn)四懂四會
- 慢性創(chuàng)面的治療及護(hù)理課件
- 第9課發(fā)展全過程人民民主(課件+視頻)(高教版2023·基礎(chǔ)模塊)
- 高考高中語文必背古詩文72篇-必考古詩詞全總結(jié)
評論
0/150
提交評論