隨機(jī)森林在人體識別中的應(yīng)用_第1頁
隨機(jī)森林在人體識別中的應(yīng)用_第2頁
隨機(jī)森林在人體識別中的應(yīng)用_第3頁
隨機(jī)森林在人體識別中的應(yīng)用_第4頁
隨機(jī)森林在人體識別中的應(yīng)用_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、隨機(jī)森林在人體識別中的應(yīng)用陳楠 12J0030摘要人體識別是計(jì)算機(jī)視覺領(lǐng)域的一大類熱點(diǎn)問題,其研究內(nèi)容涵蓋了人體的監(jiān)測與跟蹤、手勢識 別、動作識別、人臉識別、性別識別和行為與事件識別等,有著非常廣泛的應(yīng)用價值。隨機(jī)森林以它自 身固有的特點(diǎn)和優(yōu)良的分類效果在眾多的機(jī)器學(xué)習(xí)算法中脫穎而出。隨機(jī)森林算法的實(shí)質(zhì)是一種樹預(yù)測 器的組合,其中每一棵樹都依賴于一個隨機(jī)向量,森林中的所有的向量都是獨(dú)立同分布的。本文簡單介 紹了隨機(jī)森林的原理,并對近幾年來隨機(jī)森林在姿勢識別和人臉識別中的應(yīng)用進(jìn)行討論。關(guān)鍵詞隨機(jī)森林;姿勢識別;人臉識別:人體識別概述人體識別是計(jì)算機(jī)視覺領(lǐng)域的一大類熱點(diǎn)問題,其研究內(nèi)容涵蓋了人體的

2、監(jiān)測與跟蹤、手勢識別、 動作識別、人臉識別、性別識別和行為與事件識別等。其研究方法幾乎囊括了所有的模式識別問題的理 論與技術(shù),例如統(tǒng)計(jì)理論,變換理論,上下文相關(guān)性,分類與聚類,機(jī)器學(xué)習(xí),模板匹配,濾波等。人 體識別有著非常廣泛的應(yīng)用價值。絕大多數(shù)人臉識別算法和人臉表情分析算法在提取人臉特征之前,需要根據(jù)人臉關(guān)鍵點(diǎn)的位置(如眼 角,嘴角)進(jìn)行人臉的幾何歸一化處理。即使在巳知人臉粗略位置的情況下,人臉關(guān)鍵點(diǎn)精確定位仍然是一 個很困難的問題,這主要由外界干擾和人臉本身的形變造成。當(dāng)前比較流行的算法有:基于啟發(fā)式規(guī)則的方法、主成分分析(PCA)、獨(dú)立元分析(ICA)、基于K-L變 換、彈性圖匹配等。隨

3、機(jī)森林綜述隨機(jī)森林顧名思義,使用隨機(jī)的方式建立一個森林,森林里面有很多的決策樹組成,隨機(jī)森林的每 一棵決策樹之間是沒有關(guān)聯(lián)的。在得到森林之后,當(dāng)有一個新的輸入樣本進(jìn)入的死后,就讓森林的每一 棵決策樹分別進(jìn)行一下判斷,看看這個樣本應(yīng)該屬于哪一類(對于分類算法),然后看看哪一類能被選擇 最多,就預(yù)測這個樣本為那一類。隨機(jī)森林是一種統(tǒng)計(jì)學(xué)習(xí)理論,其隨機(jī)有兩個方面:首先是在訓(xùn)練的每一輪中,都是對原始樣本集 有放回的抽取固定數(shù)目的樣本點(diǎn),形成k個互不相同的樣本集。第二點(diǎn)是:對于每一個決策樹的建立是 從總的屬性中隨機(jī)抽取一定量的屬性作分裂屬性集,這樣對于k個樹分類器均是不相同的。由隨機(jī)生成的k個決策樹組成

4、了隨機(jī)森林。對于每一個決策樹來講,其分裂屬性是不斷的選取具有最大信息增益的屬性進(jìn)行排列。整個隨機(jī)森 林建立后,最終的分類標(biāo)準(zhǔn)采用投票機(jī)制得到可能性最高的結(jié)果。卜圖是隨機(jī)森林構(gòu)建的過程:圖1隨機(jī)森林構(gòu)建過程隨機(jī)森林在人體識別中的應(yīng)用3 1隨機(jī)森林應(yīng)用于姿勢識別以1一文來討論,論文中所涉及到的人體識別過程主要分為兩步,首先是,身體部位標(biāo)記:對于從 單張景深圖像中對人體進(jìn)行分段,并標(biāo)記出關(guān)鍵節(jié)點(diǎn)。之后進(jìn)行身體關(guān)節(jié)定位,將標(biāo)記的各個人體部分 重新映射到三維空間中,對關(guān)鍵節(jié)點(diǎn)形成高可靠的空間定位。depth image body pa rts3D joint proposals圖2深度圖像-身體部位標(biāo)記

5、-關(guān)節(jié)投影本文的最主要貢獻(xiàn)在于將姿勢識別的問題轉(zhuǎn)化成了物體識別的問題,通過對身體不同部位的空間位 置的確定來實(shí)現(xiàn),做到了低計(jì)算消耗和高精確度。在身體部位標(biāo)記的過程中,將問題轉(zhuǎn)化成了對每個像 素的分類問題,對于每個像素點(diǎn),從景深的角度來確定該點(diǎn)的局域梯度特征。該特征是點(diǎn)特征與梯度特征的良好結(jié)合。舉個例子,對于不同點(diǎn)的相同屬性值的判別,如下圖,圖a中的兩個測量點(diǎn)的像素偏移間均具有較 大的景深差,而圖b中的景深差則明顯很小。由此看出,不同位置像素點(diǎn)的特征值是有明顯差別的,這 就是分類的基礎(chǔ)。圖3景深圖像特質(zhì)示例feQ,*) = dt(x + Ku) di (x + Kv)式 i文中對于決策樹的分裂屬

6、性的選擇來說。由于某兩個像素點(diǎn)、某些圖像特征選取的隨意性,將形成 大量的備選劃分形式,選擇對于所有抽樣像素對于不同的分裂屬性劃分前后的信息炳增益進(jìn)行比較,選 取最大的一組i|)=(e,T)作為當(dāng)前分裂節(jié)點(diǎn)。(信息增益與該圖像塊最終是否正確地分類相關(guān),即圖像塊歸 屬于正確的關(guān)鍵特征點(diǎn)區(qū)域的概率。)0 a)(L X)圖4決策時分類說明argmax決策樹的建立后,某個葉子節(jié)點(diǎn)歸屬于特定關(guān)鍵特征點(diǎn)區(qū)域的概率可以根據(jù)訓(xùn)練圖像最終分類的情況統(tǒng)計(jì)得到,這就是隨機(jī)森林在實(shí)際檢測特征點(diǎn)時的最重要依據(jù)。在人體關(guān)節(jié)分類中,我們由形成的決策森林,來對每一個像素點(diǎn)的具體關(guān)節(jié)屬性進(jìn)行判斷,并進(jìn)行 顏色分類。隨機(jī)森林這種基

7、于大量樣本統(tǒng)計(jì)的方法能夠?qū)τ捎诠庹?、變性等造成的影響,?shí)時地解決關(guān) 鍵特征點(diǎn)定位的問題。如圖所示,是對于景深圖像處理后的結(jié)果展示。圖5姿勢識別處理結(jié)果應(yīng)該這樣說,這篇文章在算法的層面對隨機(jī)森林沒有太大的貢獻(xiàn)。在劃分函數(shù)的形式上很簡單。這 個團(tuán)隊(duì)值得稱道的地方是通過計(jì)算機(jī)圖形學(xué)造出了大量的不同體型不同姿勢的各種人體圖像,用作訓(xùn)練 數(shù)據(jù),這也是成為2011年CVPR BestPaper的重要原因。正是因?yàn)檎撐牡某晒\(yùn)用于Kinect,在工業(yè)界有 著巨大的作用,落實(shí)到了商用的硬件平臺上,推動了隨機(jī)森林在計(jì)算機(jī)視覺、多媒體處理上的熱潮。3.2隨機(jī)森林應(yīng)用于人臉識別基于回歸森林的臉部特征檢測通過分析臉部

8、圖像塊來定位人臉的關(guān)鍵特征點(diǎn),在此基礎(chǔ)上條件回歸 森林方法考慮了全局的臉部性質(zhì)。對于進(jìn)行分析,這篇論文是2012年CVPR上的論文,本文考慮的是 臉部朝向作為全局性質(zhì)。其主要描述的問題是如何利用條件隨機(jī)森林,來確定面部10個關(guān)鍵特征點(diǎn)的位 置。與之前不同的是,在隨機(jī)森林的基礎(chǔ)上,加入了面部朝向的條件約束。對于面部特征標(biāo)記的問題轉(zhuǎn)化成了對大量圖像塊的分類問題。類似于人體識別中的局域梯度特征識 別。本文中,對于每一個圖像塊來說,從灰度值、光照補(bǔ)償、相位變換等圖像特征,以及該圖像塊中心 與各個特征點(diǎn)的距離來判斷圖像塊的位置特征。在決策樹的分裂屬性確定過程,依然使用“最大信息炳 增益”原則。Condi

9、tional Regression Forest Regression ForestTrainingAA圖7條件隨機(jī)森林算法說明文中提出了更進(jìn)一步基于條件隨機(jī)森林的分類方法,即通過設(shè)定臉部朝向的約束對決策樹分類,在 特征檢測階段能夠根據(jù)臉部朝向選擇與之相關(guān)的決策樹進(jìn)行回歸,提高準(zhǔn)確率和降低消耗。此論文還對 條件隨機(jī)森林,即如何通過臉部朝向?qū)Q策進(jìn)行分類進(jìn)行了說明,但這與隨機(jī)森林算法沒有太大關(guān)系, 這里就不再繼續(xù)討論了。隨機(jī)森林這種基于大量樣本統(tǒng)計(jì)的方法能夠?qū)τ捎诠庹?、變性等造成的影響?實(shí)時地解決關(guān)鍵特征點(diǎn)定位的問題。另一篇文章3對于臉部特征標(biāo)記,提出了精確度更高、成本更低的方法。艮股基于結(jié)構(gòu)

10、化輸出的隨 機(jī)森林的特征標(biāo)記方式。文中將面部劃分為20個特征點(diǎn),對于各個特征點(diǎn)來說,不僅有獨(dú)立的圖像塊分 類標(biāo)記,還加入了例如,點(diǎn)4,對于其他嘴唇特征點(diǎn)3,18,19的依賴關(guān)系的判斷。這樣的方法使特征點(diǎn)標(biāo) 記準(zhǔn)確率大大增加。該方法依然是使用隨機(jī)森林的方法,有所不同的是引入了如式中所示的與依賴節(jié)點(diǎn)之間的關(guān)系。對 于決策樹的建立依然是依賴信息炳增益原則來決定,葉子節(jié)點(diǎn)不僅能得到特征的獨(dú)立劃分還會得到該特 征對依賴特征的貢獻(xiàn),最終特征節(jié)點(diǎn)的判斷會綜合原始投票及空間約束。圖8臉部特征標(biāo)記圖9決策樹依賴關(guān)系例如當(dāng)對下圖中人臉特征點(diǎn)進(jìn)行分類時,使用簡單的隨機(jī)森林方法,經(jīng)過判斷會將各個點(diǎn)進(jìn)行標(biāo)注, 可以看到

11、紅色的點(diǎn),標(biāo)注出的鼻子特征。如果利用依賴節(jié)點(diǎn)進(jìn)行判斷,鼻子的點(diǎn)會被局限在其他鼻子特 征點(diǎn)的周圍,進(jìn)行疊加后,得到了這個結(jié)果。顯然,對于此節(jié)點(diǎn)的判斷,利用結(jié)構(gòu)輸出的方式,準(zhǔn)確度 更高了。隨機(jī)森林總結(jié)大量的理論和實(shí)證研究都證明了 RF具有很高的預(yù)測準(zhǔn)確率,對異常值和噪聲具有很好的容忍度,旦 不容易出現(xiàn)過擬合。可以說,RF是一種自然的非線性建模工具,是目前數(shù)據(jù)挖掘算法最熱門的前沿研究 領(lǐng)域之一。具體來說,它有以下優(yōu)點(diǎn):通過對許多分類器進(jìn)行組合,它可以產(chǎn)生高準(zhǔn)確度的分類器;它可以處理大量的輸入變量;它可以在決定類別時,評估變量的重要性;在建造森林時,它可以在內(nèi)部對于一般化后的誤差產(chǎn)生不偏差的估計(jì);它包

12、含一個好方法可以估計(jì)遺失的資料,并且,如果有很大一部分的資料遺失,仍可以維持準(zhǔn)確 度。它提供一個實(shí)驗(yàn)方法,可以去偵測變量之間的相互作用;學(xué)習(xí)過程是很快速的:對異常值和噪聲具有很好的容忍度,且不容易出現(xiàn)過擬合;隨機(jī)森林的缺點(diǎn):對于有不同級別的屬性的數(shù)據(jù),級別劃分較多的屬性會對隨機(jī)森林產(chǎn)生更大的影響,所以隨機(jī)森 林在這種數(shù)據(jù)上產(chǎn)出的屬性權(quán)值是不可信的;單棵決策樹的預(yù)測效果很差:由于隨機(jī)選擇屬性,使得單棵決策樹的預(yù)測效果很差。參考文獻(xiàn):Shotton, J., Fitzgibbon, A., Cook, M.; Shaip, T, Finocchio, Moore, R., Kipman, A.,

13、Blake, A., 11 Real-time human pose recognition in parts from single depth images,Computer Vision and Pattern Recognition (CVPR), 2011 IEEE Conference on , vol., no , pp. 1297,1304, 20-25 June 2011Dantone M, Gall J, Fanelli G, et al. Real-time facial feature detection using conditional regression forestsC/Comput

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論