版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
人工智能技術(shù)與應(yīng)用13.集成算法概述課程概況—基本情況PART01集成算法什么是集成算法常用的集成算法集成算法的對比集成算法的概念集成算法(ensemblelearning):集成學(xué)習(xí):集成學(xué)習(xí)是通過構(gòu)建并結(jié)合多個學(xué)習(xí)器來完成學(xué)習(xí)任務(wù),如右圖所示,其過程是:先產(chǎn)生一組“個體學(xué)習(xí)器”,再用某種策略將它們結(jié)合起來。個體學(xué)習(xí)器:決策樹,神經(jīng)網(wǎng)絡(luò)等。同質(zhì)和異質(zhì)同質(zhì),個體學(xué)習(xí)器全是同一類型,這時個體學(xué)習(xí)器又稱“基學(xué)習(xí)器”;異質(zhì)是指個體學(xué)習(xí)器包含不同類型得學(xué)習(xí)算法。一般我們常用的都是同質(zhì)的,即個體學(xué)習(xí)器都是同一類型的參考:https:///u012328159/article/details/89740430
集成算法的概念Bagging模型Bagging模型(bootstrapaggregation):原理:并行訓(xùn)練多個分類器,相互獨立的隨機(jī)的建立多個模型典型應(yīng)用:隨機(jī)森林隨機(jī):特征隨機(jī)采樣、數(shù)據(jù)隨機(jī)采樣關(guān)注點:從偏差-方差分解的角度,關(guān)注降低方差Bagging模型(bootstrapaggregation):原理:并行訓(xùn)練多個分類器,相互獨立的隨機(jī)的建立多個模型自助采樣(bootstrapsampling):對數(shù)據(jù)集D做隨機(jī)采樣,每一個樣本每次被抽樣的概率相同,且每次抽完之后放回。包括隨機(jī)選擇數(shù)據(jù)和特征。
Bagging
Bagging基于自助采樣法,通過多次自助采樣得到不同的訓(xùn)練集,并基于訓(xùn)練集得到基學(xué)習(xí)器,最后再將這些基學(xué)習(xí)器的預(yù)測結(jié)果結(jié)合,得到最終的學(xué)習(xí)器的預(yù)測。一般在分類問題中,采用簡單投票法結(jié)合預(yù)測結(jié)果,在回歸問題中則采用簡單平均法。關(guān)注點:從偏差-方差分解的角度,關(guān)注降低方差Bagging模型Bagging實現(xiàn)步驟:實現(xiàn)步驟:輸入:數(shù)據(jù)集D,訓(xùn)練輪數(shù)T輸出:最終預(yù)測模型G(1)迭代訓(xùn)練基學(xué)習(xí)器:a.從數(shù)據(jù)集D中自助采樣得到訓(xùn)練集D'b.通過訓(xùn)練集D'訓(xùn)練得到基學(xué)習(xí)器C(2)組合預(yù)測結(jié)果:Bagging模型Random
Forest隨機(jī)森林(Random
Forest):隨機(jī)森林:隨機(jī)森林是一個包含多個決策樹的分類器,并且其輸出的類別是由個別樹輸出的類別的眾數(shù)而定。Treee:單個的決策樹絕對多數(shù)投票法Majorityvoting就是將樣本X,訓(xùn)練出不同的模型,然后進(jìn)行測試,進(jìn)行投票,得票最多的模型則被被認(rèn)為是最好.隨機(jī)森林(RandomForest):數(shù)據(jù)的隨機(jī)抽樣:從原始的數(shù)據(jù)集中采取有放回的抽樣,構(gòu)造子數(shù)據(jù)集,子數(shù)據(jù)集的數(shù)據(jù)量是和原始數(shù)據(jù)集相同的。不同子數(shù)據(jù)集的元素可以重復(fù),同一個子數(shù)據(jù)集中的元素也可以重復(fù)。第二,利用子數(shù)據(jù)集來構(gòu)建子決策樹,將這個數(shù)據(jù)放到每個子決策樹中,每個子決策樹輸出一個結(jié)果。如圖3,假設(shè)隨機(jī)森林中有3棵子決策樹,2棵子樹的分類結(jié)果是A類,1棵子樹的分類結(jié)果是B類,那么隨機(jī)森林的分類結(jié)果就是A類。Random
Forest隨機(jī)森林(RandomForest):特征的隨機(jī)抽樣:與數(shù)據(jù)集的隨機(jī)選取類似,隨機(jī)森林中的子樹的每一個分裂過程并未用到所有的待選特征,而是從所有的待選特征中隨機(jī)選取一定的特征,之后再在隨機(jī)選取的特征中選取最優(yōu)的特征。這樣能夠使得隨機(jī)森林中的決策樹都能夠彼此不同,提升系統(tǒng)的多樣性,從而提升分類性能。Random
Fores
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 負(fù)面情緒處理課程設(shè)計
- 2024年幼兒健康管理知識培訓(xùn)題庫(含答案)
- 二零二五版四荒地承包經(jīng)營權(quán)投資融資合同3篇
- 年度多用客房車市場分析及競爭策略分析報告
- 年度垃圾收轉(zhuǎn)裝備戰(zhàn)略市場規(guī)劃報告
- 2024版遠(yuǎn)程教育平臺搭建合同3篇
- 二零二五年度門店租賃合同范本:環(huán)保節(jié)能標(biāo)準(zhǔn)版4篇
- 室外電氣工程施工方案
- 送水泵房的課程設(shè)計
- 2025年度個人電子設(shè)備買賣合同模板2篇
- 《面神經(jīng)炎護(hù)理措施分析》3900字(論文)
- 城市微電網(wǎng)建設(shè)實施方案
- 企業(yè)文化融入中華傳統(tǒng)文化的實施方案
- 9.1增強(qiáng)安全意識 教學(xué)設(shè)計 2024-2025學(xué)年統(tǒng)編版道德與法治七年級上冊
- 《化工設(shè)備機(jī)械基礎(chǔ)(第8版)》全套教學(xué)課件
- 人教版八年級數(shù)學(xué)下冊舉一反三專題17.6勾股定理章末八大題型總結(jié)(培優(yōu)篇)(學(xué)生版+解析)
- 2024屆上海高考語文課內(nèi)古詩文背誦默寫篇目(精校版)
- DL-T5024-2020電力工程地基處理技術(shù)規(guī)程
- 初中數(shù)學(xué)要背誦記憶知識點(概念+公式)
- 駕照體檢表完整版本
- 農(nóng)產(chǎn)品農(nóng)藥殘留檢測及風(fēng)險評估
評論
0/150
提交評論