版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
計(jì)算機(jī)視覺論文15篇
篇一:計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺下食品工業(yè)論文1計(jì)算機(jī)視覺技術(shù)概述1.1自動(dòng)化程度高計(jì)算機(jī)視覺可以實(shí)現(xiàn)對(duì)農(nóng)產(chǎn)品的多個(gè)外形和內(nèi)在品質(zhì)指標(biāo)進(jìn)行同時(shí)檢測(cè)分析,可以進(jìn)行整體識(shí)別、增強(qiáng)對(duì)目標(biāo)識(shí)別的準(zhǔn)確性。1.2實(shí)現(xiàn)無損檢測(cè)由于計(jì)算機(jī)視覺技術(shù)對(duì)農(nóng)產(chǎn)品的識(shí)別是通過掃描、攝像,而不需要直接接觸,可以減少對(duì)所檢測(cè)食品的傷害。1.3穩(wěn)定的檢測(cè)精度設(shè)計(jì)的運(yùn)行程序確定后,計(jì)算機(jī)視覺技術(shù)的識(shí)別功能就會(huì)具有統(tǒng)一的識(shí)別標(biāo)準(zhǔn),具有穩(wěn)定的檢測(cè)精度,避免了人工識(shí)別和檢測(cè)時(shí)主觀因素所造成的差異。2計(jì)算機(jī)視覺技術(shù)在食品檢測(cè)中的應(yīng)用20世紀(jì)70年代初,學(xué)者開始研究計(jì)算機(jī)視覺技術(shù)在食品工業(yè)中的應(yīng)用,近幾十年電子技術(shù)得到快速發(fā)展,計(jì)算機(jī)視覺技術(shù)也越來越成熟。國內(nèi)外學(xué)者在研究計(jì)算機(jī)視覺技術(shù)在食品工業(yè)中的應(yīng)用方面主要集中在該技術(shù)對(duì)果蔬的外部形態(tài)(如形狀、重量、外觀損傷、色澤等)的識(shí)別、內(nèi)部無損檢測(cè)等方面。國內(nèi)有關(guān)計(jì)算機(jī)視覺技術(shù)在食品業(yè)中的應(yīng)用研究起始于90年代,比國外發(fā)達(dá)國家晚20多年,但是發(fā)展很快。2.1計(jì)算機(jī)視覺技術(shù)在果蔬分級(jí)中的應(yīng)用研究計(jì)算機(jī)視覺技術(shù)在食品檢測(cè)中的應(yīng)用研究相當(dāng)廣泛,從外部直徑、成熟度的檢測(cè)到內(nèi)部腐爛程度的檢測(cè)都有研究。韓偉等[4]采用分割水果的拍攝圖像和新的計(jì)算機(jī)算法計(jì)算水果的半徑,進(jìn)而得出果蔬的最大直徑。研究表明,該算法不僅降低了計(jì)算量而且提高了計(jì)算精度,此方法用于水果分級(jí)的誤差不超過2mm,高于國際水果分級(jí)標(biāo)準(zhǔn)所規(guī)定的5mm分類標(biāo)準(zhǔn)差,可在工業(yè)生產(chǎn)中很好應(yīng)用。李慶中[5]也利用圖像的缺陷分割算法研究了計(jì)算機(jī)視覺技術(shù)在蘋果檢測(cè)與分級(jí)中的應(yīng)用,結(jié)果表明此算法能快速、有效地分割出蘋果的表面缺陷。孫洪勝等[6]以蘋果色澤特征比率的變化規(guī)律為理論基礎(chǔ),結(jié)合模糊聚類知識(shí)利用計(jì)算機(jī)視覺技術(shù)來檢測(cè)蘋果缺陷域,檢測(cè)不僅快速而且結(jié)果精確。劉禾等[7]通過研究認(rèn)為蘋果的表面缺陷可以利用計(jì)算機(jī)視覺技術(shù)進(jìn)行檢測(cè),計(jì)算機(jī)視覺技術(shù)還可以將蘋果按照檢測(cè)結(jié)果進(jìn)行分級(jí),把檢測(cè)過的蘋果分成裂果、刺傷果、碰傷果和蟲傷果等類別。梨的果梗是否存在是梨類分級(jí)的重要特征之一,應(yīng)義斌等[8]通過計(jì)算機(jī)視覺技術(shù)、圖象處理技術(shù)、傅立葉描述子的方法來描述和識(shí)別果形以及有無果柄,其識(shí)別率達(dá)到90%。楊秀坤等[9]綜合運(yùn)用計(jì)算機(jī)視覺技術(shù)、遺傳算法、多層前饋神經(jīng)網(wǎng)絡(luò)系統(tǒng),實(shí)現(xiàn)了具有精確度高、靈活性強(qiáng)和速度快等優(yōu)點(diǎn)的蘋果成熟度自動(dòng)判別。陳育彥等[10]采用半導(dǎo)體激光技術(shù)、計(jì)算機(jī)視覺技術(shù)和圖像分析技術(shù)相結(jié)合的方法檢測(cè)蘋果表面的機(jī)械損傷和果實(shí)內(nèi)部的腐爛情況,初步驗(yàn)證了計(jì)算機(jī)視覺技術(shù)檢測(cè)蘋果表面的損傷和內(nèi)部腐爛是可行的。馮斌等[11]通過計(jì)算機(jī)視覺技術(shù)對(duì)水果圖像的邊緣進(jìn)行檢測(cè),然后確定水果的大小用以水果分級(jí)。試驗(yàn)表明,該方法比傳統(tǒng)的檢測(cè)方法速度快、準(zhǔn)確率高,適用于計(jì)算機(jī)視覺的實(shí)時(shí)檢測(cè)。朱偉[12]在模糊顏色的基礎(chǔ)上,分析西紅柿損傷部分和完好部分模糊顏色的差別,用分割方法對(duì)西紅柿的缺陷進(jìn)行分割,結(jié)果顯示準(zhǔn)確率高達(dá)96%。曹樂平等[13]人研究了溫州蜜柑的果皮顏色與果實(shí)可滴定酸含量以及糖分含量之間的相關(guān)性,然而根據(jù)相關(guān)性,樣品檢測(cè)的正確識(shí)別率分別只有約74%和67%。劉剛等[14]從垂直和水平兩個(gè)方向獲取蘋果的圖像,并通過計(jì)算機(jī)自動(dòng)分析圖像數(shù)據(jù),對(duì)蘋果的外徑、體積、以及圓形度等參數(shù)進(jìn)行處理,與人工檢測(cè)相比,計(jì)算機(jī)視覺技術(shù)具有檢測(cè)效率高,檢測(cè)標(biāo)準(zhǔn)統(tǒng)一性好等優(yōu)點(diǎn)。Blasco.J[15]通過計(jì)算機(jī)視覺技術(shù)分析柑橘果皮的缺陷,進(jìn)而對(duì)其在線分級(jí),正確率約為95%。趙廣華等[16]人綜合計(jì)算機(jī)視覺識(shí)別系統(tǒng)、輸送轉(zhuǎn)換系統(tǒng)、輸送翻轉(zhuǎn)系統(tǒng)、差速勻果系統(tǒng)和分選系統(tǒng),研制出一款適于實(shí)時(shí)監(jiān)測(cè)、品質(zhì)動(dòng)態(tài)的智能分級(jí)系統(tǒng),能夠很好地實(shí)現(xiàn)蘋果分級(jí)。王江楓等[17]建立了芒果重量與攝影圖像的相互關(guān)系,應(yīng)用計(jì)算機(jī)視覺技術(shù)檢測(cè)桂香芒果和紫花芒果的重量和果面損傷,按重量分級(jí)其準(zhǔn)確率均為92%,按果面損傷分級(jí)的準(zhǔn)確率分別為76%和80%。2.2計(jì)算機(jī)視覺技術(shù)在禽蛋檢測(cè)中的應(yīng)用研究禽蛋企業(yè)在生產(chǎn)過程中,產(chǎn)品的分級(jí)、品質(zhì)檢測(cè)主要采用人工方法,不僅需要大量的物力人力,而且存在勞動(dòng)強(qiáng)度大、人為誤差大、工作效率低等缺點(diǎn),計(jì)算機(jī)視覺技術(shù)可以很好的解決這類產(chǎn)品工業(yè)生產(chǎn)中存在的困擾。歐陽靜怡等[18]利用計(jì)算機(jī)視覺技術(shù)來檢測(cè)雞蛋蛋殼裂紋,利用攝像機(jī)獲取雞蛋圖像后,采用fisher、同態(tài)濾波和BET算法等優(yōu)化后的圖像處理技術(shù),獲得裂紋形狀并判斷,試驗(yàn)結(jié)果表明,計(jì)算機(jī)視覺技術(shù)對(duì)雞蛋蛋殼裂紋的檢測(cè)準(zhǔn)確率高達(dá)98%。汪俊德等[19]以計(jì)算機(jī)視覺技術(shù)為基礎(chǔ),設(shè)計(jì)出一套雙黃雞蛋檢測(cè)系統(tǒng)。該系統(tǒng)獲取蛋黃指數(shù)、蛋黃特征和蛋形尺寸等特征,和設(shè)計(jì)的數(shù)學(xué)模型對(duì)比來實(shí)現(xiàn)雙黃雞蛋的檢測(cè)和識(shí)別,檢測(cè)準(zhǔn)確率高達(dá)95%。鄭麗敏等[20]人通過高分辨率的數(shù)字?jǐn)z像頭獲取雞蛋圖像,根據(jù)圖像特征建立數(shù)學(xué)模型來預(yù)測(cè)雞蛋的新鮮度和貯藏期,結(jié)果表明,計(jì)算機(jī)視覺技術(shù)對(duì)雞蛋的新鮮度、貯藏期進(jìn)行預(yù)測(cè)的結(jié)果準(zhǔn)確率為94%。潘磊慶等[21]通過計(jì)算機(jī)視覺技術(shù)和聲學(xué)響應(yīng)信息技術(shù)相結(jié)合的方法檢測(cè)裂紋雞蛋,其檢測(cè)準(zhǔn)確率達(dá)到98%。MertensK等[22]人基于計(jì)算機(jī)視覺技術(shù)研發(fā)了雞蛋的分級(jí)檢測(cè)系統(tǒng),該系統(tǒng)識(shí)別帶污漬雞蛋的正確率高達(dá)99%。2.3計(jì)算機(jī)視覺技術(shù)在檢測(cè)食品中微生物含量的應(yīng)用研究計(jì)算機(jī)技術(shù)和圖像處理技術(shù)在綜合學(xué)科中的應(yīng)用得到快速發(fā)展,在微生物快速檢測(cè)中的應(yīng)用也越來越多,主要是針對(duì)微生物微菌落的處理。食品工業(yè)中計(jì)算機(jī)視覺技術(shù)在微生物檢測(cè)方面的研究和應(yīng)用以研究單個(gè)細(xì)胞為主,并在個(gè)體細(xì)胞的研究上取得了一定的進(jìn)展。殷涌光等[23]以顏色特征分辨技術(shù)為基礎(chǔ),設(shè)計(jì)了一套應(yīng)用計(jì)算機(jī)視覺技術(shù)快速定量檢測(cè)食品中大腸桿菌的系統(tǒng),該系統(tǒng)檢測(cè)結(jié)果與傳統(tǒng)方法的檢測(cè)結(jié)果具有很好的相關(guān)性,但與傳統(tǒng)方法相比,可以節(jié)省5d時(shí)間,檢測(cè)時(shí)間在18h以內(nèi),并且能夠有效提高產(chǎn)品品質(zhì)。Lawless等[24]人等時(shí)間段測(cè)定培養(yǎng)基上的細(xì)胞密度,然后通過計(jì)算機(jī)技術(shù)建立時(shí)間和細(xì)胞密度之間的動(dòng)態(tài)關(guān)聯(lián),利用該關(guān)聯(lián)可以預(yù)測(cè)和自動(dòng)檢測(cè)微生物的生長情況,如通過計(jì)算機(jī)控制自動(dòng)定量采集檢測(cè)對(duì)象,然后分析菌落的邊緣形態(tài),根據(jù)菌落的邊緣形態(tài)計(jì)算機(jī)可以顯示被檢測(cè)菌落的具體位置,并且根據(jù)動(dòng)態(tài)關(guān)聯(lián)計(jì)算機(jī)視覺系統(tǒng)可以同時(shí)處理多個(gè)不同的樣品。郭培源等[25]人對(duì)計(jì)算機(jī)視覺技術(shù)用于豬肉的分級(jí)進(jìn)行了研究,結(jié)果顯示計(jì)算機(jī)視覺技術(shù)在識(shí)別豬肉表面微生物數(shù)量上與國標(biāo)方法檢測(cè)的結(jié)果顯著相關(guān),該技術(shù)可以有效地計(jì)算微生物的數(shù)量。Bayraktar.B等[26]人采用計(jì)算機(jī)視覺技術(shù)、光散射技術(shù)(BARDOT)和模式識(shí)別技術(shù)相結(jié)合的方法來快速檢測(cè)李斯特菌,在獲取該菌菌落中的形態(tài)特征有,對(duì)圖像進(jìn)行分析處理達(dá)到對(duì)該菌的分類識(shí)別。殷涌光等[27]人綜合利用計(jì)算機(jī)視覺、活體染色、人工神經(jīng)網(wǎng)絡(luò)、圖像處理等技術(shù),用分辨率為520萬像素的數(shù)字?jǐn)z像機(jī)拍攝細(xì)菌內(nèi)部的染色效果,并結(jié)合新的圖像處理算法,對(duì)細(xì)菌形態(tài)學(xué)的8個(gè)特征參數(shù)進(jìn)行檢測(cè),檢測(cè)結(jié)果與傳統(tǒng)檢測(cè)結(jié)果顯著相關(guān)(相關(guān)系數(shù)R=0.9987),和傳統(tǒng)檢測(cè)方法相比該方法具有操作簡(jiǎn)單、快速、結(jié)果準(zhǔn)確、適合現(xiàn)場(chǎng)快速檢測(cè)等特點(diǎn)。魯靜[28]和劉侃[29]利用顯微鏡和圖像采集儀器,獲取乳制品的掃描圖像,然后微生物的圖像特征和微生物數(shù)量進(jìn)行識(shí)別,并以此作為衡量乳制品質(zhì)量是否達(dá)標(biāo)的依據(jù),并對(duì)產(chǎn)品進(jìn)行分級(jí)。2.4計(jì)算機(jī)視覺技術(shù)在其他食品產(chǎn)業(yè)中的應(yīng)用研究里紅杰等[30]通過提取貝類和蝦類等海產(chǎn)品的形狀、尺寸、紋理、顏色等外形特征,對(duì)照數(shù)學(xué)模型,采用數(shù)字圖像處理技術(shù)、計(jì)算機(jī)識(shí)別技術(shù)實(shí)現(xiàn)了對(duì)貝類和蝦類等海產(chǎn)品的無損檢測(cè)和自動(dòng)化分類、分級(jí)和質(zhì)量評(píng)估,并通過實(shí)例詳細(xì)闡述了該技術(shù)的實(shí)現(xiàn)方法,證實(shí)了此項(xiàng)技術(shù)的有效性。計(jì)算機(jī)視覺技術(shù)還可以檢驗(yàn)玉米粒形和玉米種子質(zhì)量、識(shí)別玉米品種和玉米田間雜草[31]。晁德起等[32]通過x射線照射獲取毛葉棗的透視圖像后,運(yùn)用計(jì)算機(jī)視覺技術(shù)對(duì)圖像進(jìn)行分析評(píng)估,毛葉棗可食率的評(píng)估結(jié)果與運(yùn)用物理方法測(cè)得的結(jié)果平均誤差僅為1.47%,因此得出結(jié)論:計(jì)算機(jī)視覺技術(shù)可以應(yīng)用于毛葉棗的自動(dòng)分級(jí)。GokmenV等[33-34]通過對(duì)薯片制作過程中圖像像素的變化來研究薯片的褐變率,通過分析特色參數(shù)來研究薯片中丙烯酰胺的含量和褐變率的關(guān)系,結(jié)果顯示兩項(xiàng)參數(shù)相關(guān)性為0.989,從而可以應(yīng)用計(jì)算機(jī)視覺技術(shù)來預(yù)測(cè)加熱食品中丙烯酰胺的含量,該方法可以在加熱食品行業(yè)中得到廣泛應(yīng)用。韓仲志等[35]人拍攝和掃描11類花生籽粒,每類100顆不同等級(jí)的花生籽粒的正反面圖像,利用計(jì)算機(jī)視覺技術(shù)對(duì)花生內(nèi)部和外部采集圖像,并通過圖像對(duì)其外在品質(zhì)和內(nèi)在品質(zhì)進(jìn)行分析,并建立相應(yīng)的數(shù)學(xué)模型,該技術(shù)在對(duì)待檢樣品進(jìn)行分級(jí)檢測(cè)時(shí)的正確率高達(dá)92%。另外,郭培源等[36]人以國家標(biāo)準(zhǔn)為依據(jù),通過數(shù)字?jǐn)z像技術(shù)獲取豬肉的細(xì)菌菌斑面積、脂肪細(xì)胞數(shù)、顏色特征值以及氨氣等品質(zhì)指標(biāo)來實(shí)現(xiàn)豬肉新鮮程度的分級(jí)辨認(rèn)。3展望新技術(shù)的研究與應(yīng)用必然伴隨著坎坷,從70年代初計(jì)算機(jī)視覺技術(shù)在食品工業(yè)中進(jìn)行應(yīng)用開始,就遇到了很多問題。計(jì)算機(jī)視覺技術(shù)在食品工業(yè)中的研究及應(yīng)用主要存在以下幾方面的問題。3.1檢測(cè)指標(biāo)有限計(jì)算機(jī)視覺技術(shù)在檢測(cè)食品單一指標(biāo)或者以一個(gè)指標(biāo)作為分級(jí)標(biāo)準(zhǔn)進(jìn)行分級(jí)時(shí)具有理想效果,但以同一食品的多個(gè)指標(biāo)共同作為分級(jí)標(biāo)準(zhǔn)進(jìn)行檢測(cè)分級(jí),則分級(jí)結(jié)果誤差較大[37]。例如,Davenel等[38]通過計(jì)算機(jī)視覺對(duì)蘋果的大小、重量、外觀損傷進(jìn)行分析,但研究結(jié)果顯示,系統(tǒng)會(huì)把花萼和果梗標(biāo)記為缺陷,還由于蘋果表面碰壓傷等缺陷情況復(fù)雜,造成分級(jí)誤差很大,分級(jí)正確率只有69%。Nozer[39-40]等以計(jì)算機(jī)視覺為主要技術(shù)手段,獲取水果的圖像,進(jìn)而通過分析圖像來確定水果的形狀、大小、顏色和重量,并進(jìn)行分級(jí),其正確率僅為85.1%。3.2兼容性差計(jì)算機(jī)視覺技術(shù)針對(duì)單一種類的果蔬分級(jí)檢測(cè)效果顯著,但是,同一套系統(tǒng)和設(shè)備很難用于其它種類的果蔬,甚至同一種類不同品種的農(nóng)產(chǎn)品也很難公用一套計(jì)算機(jī)視覺設(shè)備。Reyerzwiggelaar等[41]利用計(jì)算機(jī)視覺檢查杏和桃的損傷程度,發(fā)現(xiàn)其檢測(cè)桃子的準(zhǔn)確率顯著高于杏的。Majumdar.S等[42]利用計(jì)算機(jī)視覺技術(shù)區(qū)分不同種類的麥粒,小麥、燕麥、大麥的識(shí)別正確率有明顯差異。3.3檢測(cè)性能受環(huán)境制約現(xiàn)階段的計(jì)算機(jī)視覺技術(shù)和配套的數(shù)學(xué)模型適用于簡(jiǎn)單的環(huán)境,在復(fù)雜環(huán)境下工作時(shí)會(huì)產(chǎn)生較大的誤差。Plebe等[43]利用計(jì)算機(jī)視覺技術(shù)對(duì)果樹上的水果進(jìn)行識(shí)別定位,但研究發(fā)現(xiàn)由于光照條件以及周邊環(huán)境的影響,水果的識(shí)別和定位精度不高,不能滿足實(shí)際生產(chǎn)的需要。綜上所述,可看出國內(nèi)外學(xué)者對(duì)計(jì)算機(jī)視覺技術(shù)在食品工業(yè)中的應(yīng)用進(jìn)行了大量的研究,有些研究從單一方面入手,有些研究綜合了多個(gè)學(xué)科,在研究和應(yīng)用的過程中,取得了較大的經(jīng)濟(jì)效益,也遇到了很多問題,在新的形勢(shì)下,計(jì)算機(jī)視覺技術(shù)和數(shù)碼拍攝、圖像處理、人工神經(jīng)網(wǎng)絡(luò),數(shù)學(xué)模型建設(shè)、微生物快速計(jì)量等高新技術(shù)相融合的綜合技術(shù)逐漸成為了各個(gè)領(lǐng)域?qū)W者的研究熱點(diǎn),以計(jì)算機(jī)視覺為基礎(chǔ)的綜合技術(shù)也將在食品工業(yè)中發(fā)揮更加重要的作用。
篇二:計(jì)算機(jī)視覺論文:基于計(jì)算機(jī)視覺的移動(dòng)機(jī)器人導(dǎo)航摘要:針對(duì)跟隨路徑導(dǎo)引的移動(dòng)機(jī)器人導(dǎo)航方式的靈活性較差、維護(hù)成本較高、功能單一的缺點(diǎn),將計(jì)算機(jī)視覺用于移動(dòng)機(jī)器人路徑識(shí)別。首先對(duì)視覺傳感器獲得的視頻圖像進(jìn)行處理,獲得有用的特征目標(biāo),實(shí)現(xiàn)機(jī)器人對(duì)當(dāng)前路徑信息的理解。然后調(diào)用直行或轉(zhuǎn)彎功能模塊對(duì)機(jī)器人進(jìn)行導(dǎo)航控制。實(shí)驗(yàn)結(jié)果表明,該導(dǎo)航方式具有較好的實(shí)時(shí)性和魯棒性。關(guān)鍵詞:計(jì)算機(jī)視覺;移動(dòng)機(jī)器人;路徑識(shí)別;自主導(dǎo)航現(xiàn)代機(jī)器人技術(shù)在人工智能、計(jì)算機(jī)技術(shù)和傳感器技術(shù)的推動(dòng)下獲得了飛速發(fā)展,其中移動(dòng)機(jī)器人因具有可移動(dòng)性和自治能力,能適應(yīng)環(huán)境變化被廣泛用于物流、探測(cè)、服務(wù)等領(lǐng)域[14]。移動(dòng)機(jī)器人的核心技術(shù)之一是導(dǎo)航技術(shù),特別是自主導(dǎo)航技術(shù)。由于環(huán)境的動(dòng)態(tài)變化和不可預(yù)測(cè)性、機(jī)器人感知手段的不完備等原因,使得移動(dòng)機(jī)器人的導(dǎo)航難度較大,一直是人們研究的重點(diǎn)[5]。目前常用的一種導(dǎo)航方式是“跟隨路徑導(dǎo)引”[6],即機(jī)器人通過對(duì)能感知到某些外部的連續(xù)路徑參考信息做出相應(yīng)的反應(yīng)來導(dǎo)航。如在機(jī)器人運(yùn)動(dòng)路徑上敷設(shè)金屬導(dǎo)線或磁釘,通過檢測(cè)金屬導(dǎo)線或磁釘?shù)奶卣餍畔泶_定機(jī)器人的位置。從導(dǎo)航的角度看,這種方法的優(yōu)點(diǎn)是可靠性較高,但功能單一,如不能在行進(jìn)的同時(shí)對(duì)目標(biāo)進(jìn)行識(shí)別、避障,對(duì)環(huán)境的適應(yīng)能力較弱、靈活性較差、維護(hù)成本較高,因此限制了其在移動(dòng)機(jī)器人中的應(yīng)用。隨著計(jì)算機(jī)技術(shù)、數(shù)字圖像處理技術(shù)及圖像處理硬件的發(fā)展,基于計(jì)算機(jī)視覺的導(dǎo)航方式在機(jī)器人導(dǎo)航中得到廣泛關(guān)注[68]。在實(shí)際應(yīng)用中,只需要在路面上畫出路徑引導(dǎo)線,如同在公共交通道路上畫的引導(dǎo)線一樣,機(jī)器人就可以通過視覺進(jìn)行自主導(dǎo)航。相對(duì)于敷設(shè)金屬導(dǎo)線、磁釘?shù)确椒?,這種方法增強(qiáng)了系統(tǒng)的靈活性,降低了維護(hù)成本。視覺信息中包含有大量的數(shù)據(jù),要從中提取有用的信息,需要復(fù)雜的算法及耗時(shí)的計(jì)算。如何保證視覺導(dǎo)航系統(tǒng)在正確理解路徑信息的前提下仍具有較好的實(shí)時(shí)性和魯棒性,是該方法要解決的核心問題。1視覺導(dǎo)航系統(tǒng)構(gòu)成及工作過程基于計(jì)算機(jī)視覺的移動(dòng)機(jī)器人導(dǎo)航實(shí)驗(yàn)系統(tǒng)的硬件部分由計(jì)算機(jī)、USB接口的攝像頭、LEGO實(shí)驗(yàn)用機(jī)器人組成。軟件分為2部分,即圖像處理和機(jī)器人運(yùn)動(dòng)控制。基于視覺導(dǎo)航的原始輸入圖像是連續(xù)的數(shù)字視頻圖像。系統(tǒng)工作時(shí),圖像預(yù)處理模塊首先對(duì)原始的輸入圖像進(jìn)行縮小、邊緣檢測(cè)、二值化等預(yù)處理。其次利用哈夫變換提取出對(duì)機(jī)器人有用的路徑信息。最后,運(yùn)動(dòng)控制模塊根據(jù)識(shí)別的路徑信息,調(diào)用直行或轉(zhuǎn)彎功能模塊使機(jī)器人做相應(yīng)的移動(dòng)。整個(gè)工作流程如圖1所示。1.1視覺導(dǎo)航的圖像預(yù)處理目前圖像采集設(shè)備都具有較高的空間和灰度分辨率,精度高、數(shù)據(jù)量大。實(shí)驗(yàn)中的原始輸入圖像是USB攝像頭采集320×240像素的RGB格式圖像,最大幀數(shù)30幀/s。圖像預(yù)處理的效果對(duì)后續(xù)哈夫變換檢測(cè)路徑信息的速度和準(zhǔn)確性有很大影響。對(duì)整幅圖像進(jìn)行抽取時(shí)計(jì)算量過大、也無必要,故先將彩色圖像轉(zhuǎn)換為灰度圖像,再將圖像的大小依據(jù)最近鄰域插值法原理[9]進(jìn)行縮小以節(jié)約后續(xù)計(jì)算時(shí)間。在實(shí)驗(yàn)室環(huán)境下,經(jīng)測(cè)試,將原始圖像縮小到30%仍然能滿足需要,處理時(shí)間縮短了72%。由于圖像傳感器從時(shí)間和空間上對(duì)介質(zhì)(光)采樣,其圖像質(zhì)量對(duì)現(xiàn)場(chǎng)的非均勻光場(chǎng)和其他干擾因素非常敏感,二值化時(shí),不同光照條件下閾值的確定是一件比較困難的工作。目前常用的閾值選取方法有雙峰法、迭代法和最大類間方差法[10]。從執(zhí)行時(shí)間和處理效果2方面考慮,對(duì)3種方法比較后(結(jié)果如表1所示),在優(yōu)先考慮實(shí)時(shí)性的前提下,選用雙峰法來求取閾值。在實(shí)驗(yàn)室條件下,路徑環(huán)境相對(duì)理想,黑色引導(dǎo)線與背景反差較大。在灰度直方圖上,引導(dǎo)線和背景都形成高峰,對(duì)這2個(gè)峰值及谷底的求取也可簡(jiǎn)化,使用灰度級(jí)的最大值和最小值代替2個(gè)峰值,那么這2個(gè)峰值的中間值即可作為谷底用作圖像的閾值。地面的反光和陰影,以及不均勻的光照都會(huì)導(dǎo)致同一幅圖像的二值化效果表現(xiàn)出很大差別,圖2和圖3是對(duì)同一幅圖像在不同光照條件下二值化的結(jié)果,可以看到在光照條件2下會(huì)出現(xiàn)大量的黑點(diǎn),這些黑點(diǎn)將嚴(yán)重影響提取路徑信息的速度并且可能導(dǎo)致錯(cuò)誤的路徑信息。然而,相對(duì)于灰度、顏色特征,邊緣特征受光照影響較小[11]。為此,對(duì)縮小后的圖像先進(jìn)行引導(dǎo)線的邊緣檢測(cè),邊緣檢測(cè)后圖像中引導(dǎo)線邊緣像素灰度的對(duì)比度得到增強(qiáng),通過實(shí)驗(yàn)確定合適的閾值,然后對(duì)圖像進(jìn)行二值化以提取路徑信息。1.2引導(dǎo)線角度檢測(cè)2視覺導(dǎo)航的機(jī)器人運(yùn)動(dòng)控制機(jī)器人運(yùn)動(dòng)控制部分分為直行控制和轉(zhuǎn)彎控制2部分。2.1直行控制如果哈夫變換的檢測(cè)結(jié)果表明是一條直線即機(jī)器人視野中只有1條主引導(dǎo)線時(shí),則運(yùn)行直行模塊。實(shí)際中有2種情況需要考慮:一是機(jī)器人的初始位置不一定正對(duì)引導(dǎo)線,二是在機(jī)器人的機(jī)電配置中,左右輪子的馬達(dá)運(yùn)動(dòng)不會(huì)絕對(duì)精確和對(duì)稱。這些會(huì)使機(jī)器人在運(yùn)動(dòng)中出現(xiàn)側(cè)偏??刹捎孟率龇椒ㄟM(jìn)行直行控制:根據(jù)引導(dǎo)線在圖像平面坐標(biāo)中的位置來判斷機(jī)器人的偏向。當(dāng)引導(dǎo)線位于圖像平面的左半邊,說明攝像頭的光軸與引導(dǎo)線不垂直且相對(duì)于引導(dǎo)線右偏,則命令機(jī)器人左轉(zhuǎn);當(dāng)引導(dǎo)線位于圖像平面的右半邊,說明攝像頭的光軸與引導(dǎo)線不垂直且相對(duì)于引導(dǎo)線左偏,則命令機(jī)器人右轉(zhuǎn);當(dāng)引導(dǎo)線在圖像平面兩邊均存在時(shí),則命令機(jī)器人不偏轉(zhuǎn)繼續(xù)直行。機(jī)器人在前進(jìn)過程中,根據(jù)圖像平面中引導(dǎo)線位置不斷調(diào)整方位,以一定的轉(zhuǎn)動(dòng)角度(轉(zhuǎn)動(dòng)角度盡量小,這樣機(jī)器人的擺動(dòng)幅度就會(huì)小)在直線路徑上行走。2.2轉(zhuǎn)彎控制如果哈夫變換的檢測(cè)結(jié)果表明是兩條相互垂直的直線,即機(jī)器人的視野中出現(xiàn)轉(zhuǎn)彎路口,則開始運(yùn)行轉(zhuǎn)彎模塊。機(jī)器人需要在距轉(zhuǎn)角合適的距離處開始運(yùn)行轉(zhuǎn)彎模塊,以保證機(jī)器人視野中始終具有引導(dǎo)線。如圖4所示,AB段表示攝像頭的縱向視野范圍,C點(diǎn)為轉(zhuǎn)角點(diǎn),機(jī)器人需要知道自身在實(shí)際二維平面中相對(duì)于轉(zhuǎn)角點(diǎn)C的距離即BC段距離。由圖像信息獲得現(xiàn)實(shí)世界坐標(biāo)系中的參數(shù),即所謂三維重建,這需要對(duì)基于計(jì)算機(jī)視覺的移動(dòng)機(jī)器人導(dǎo)航系統(tǒng)進(jìn)行攝像機(jī)標(biāo)定。鑒于移動(dòng)機(jī)器人識(shí)別的引導(dǎo)線在地面上這一限制條件,并且攝像頭固定在機(jī)器人上,可以選擇機(jī)器人坐標(biāo)系為世界坐標(biāo)系,即世界坐標(biāo)系與機(jī)器人同步移動(dòng)。坐標(biāo)原點(diǎn)為標(biāo)定模板的左下角標(biāo)定點(diǎn)的中心,Zw軸垂直地面,XwYw平面即為地面。在該坐標(biāo)系下地面目標(biāo)的坐標(biāo)可以表示為(Xw,Yw,0),П甓模板由直徑5mm、相距10mm共72個(gè)圓點(diǎn)構(gòu)成,如圖5所示。3實(shí)驗(yàn)結(jié)果及結(jié)論實(shí)驗(yàn)中選用的LEGO移動(dòng)機(jī)器人,其運(yùn)動(dòng)速度為8.57cm/s(指令設(shè)定Power=25RPM)。導(dǎo)航場(chǎng)地中畫有寬1cm的黑色引導(dǎo)線,實(shí)驗(yàn)要求中機(jī)器人完全根據(jù)引導(dǎo)線自主運(yùn)動(dòng)。實(shí)驗(yàn)中,識(shí)別1幀圖像并且機(jī)器人根據(jù)識(shí)別的路徑信息運(yùn)行直行或轉(zhuǎn)彎模塊共需0.311s,即機(jī)器人每處理1幀圖像移動(dòng)2.67cm。實(shí)驗(yàn)室中的光照條件是機(jī)器人移動(dòng)時(shí)的主要干擾,而銳利的引導(dǎo)線邊緣受光照影響較小,對(duì)這些干擾有較好的濾除作用。經(jīng)過在陰天白天、晴天白天以及開燈和不開燈的情況下、晚上開燈的情況下、遮蓋物位于攝像頭上方50cm處形成陰影情況下,機(jī)器人能正確的沿引導(dǎo)線移動(dòng)。同時(shí),當(dāng)攝像頭視野范圍內(nèi)引導(dǎo)線消失即認(rèn)為出現(xiàn)障礙物,機(jī)器人能發(fā)出前方有障礙物的報(bào)警信息??梢娚厦嫠龇椒ㄓ休^好的實(shí)時(shí)性和魯棒性有一定的通用性,使得該視覺導(dǎo)航方法具有一定的應(yīng)用價(jià)值。只要光照條件變化不是非常劇烈,在工廠、醫(yī)院、辦公樓等環(huán)境中,機(jī)器人根據(jù)路徑引導(dǎo)線可自主到達(dá)目的地。當(dāng)然,由于移動(dòng)機(jī)器人活動(dòng)場(chǎng)景的復(fù)雜性和動(dòng)態(tài)特性,以及視覺處理的復(fù)雜性,視覺導(dǎo)航還有很多需要解決的問題,例如當(dāng)導(dǎo)航場(chǎng)地出現(xiàn)較大面積的強(qiáng)烈反光、極暗的陰影時(shí)能否有效可靠的進(jìn)行移動(dòng)機(jī)器人的導(dǎo)航控制,這需要進(jìn)一步研究。另外,如何將視覺系統(tǒng)與本系統(tǒng)機(jī)器人平臺(tái)中的超聲波傳感器、光電傳感器及聲音傳感器在空間、時(shí)間及數(shù)據(jù)上進(jìn)行融合以提高系統(tǒng)的適應(yīng)性和環(huán)境識(shí)別能力也是一個(gè)研究方向。作者簡(jiǎn)介趙瑜女,1983年出生,陜西西安人,碩士研究生。主要研究方向?yàn)榉墙佑|測(cè)量與可視化計(jì)算。種蘭祥男,1960年出生,陜西合陽人,西北大學(xué)信息科學(xué)與技術(shù)學(xué)院副教授,中國科學(xué)院西安光學(xué)精密儀器研究所博士研究生。主要從事非接觸測(cè)量、光電子技術(shù)和可視化計(jì)算方面的研究。張萬緒男,1964年出生,山西運(yùn)城人,西北大學(xué)信息科學(xué)與技術(shù)學(xué)院副教授。主要研究方向?yàn)橹悄軆x器儀表。注:本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文
篇三:計(jì)算機(jī)視覺論文:談?dòng)?jì)算機(jī)視覺課程的教學(xué)創(chuàng)新摘要:近年來,隨著計(jì)算機(jī)視覺技術(shù)與應(yīng)用的飛速發(fā)展,越來越多學(xué)生對(duì)這門課產(chǎn)生了濃厚的興趣。文章是對(duì)我院計(jì)算機(jī)視覺課程教學(xué)經(jīng)驗(yàn)的總結(jié),討論我們?cè)诮虒W(xué)過程中遇到的一些具體問題,主要包括教學(xué)內(nèi)容和工程實(shí)例的選取、教學(xué)方法的幾個(gè)注意事項(xiàng),期待與同行們進(jìn)行交流探討。關(guān)鍵詞:計(jì)算機(jī)視覺;教學(xué)應(yīng)用;教學(xué)改革計(jì)算機(jī)視覺是人工智能學(xué)科中的一門重要課程。隨著相關(guān)應(yīng)用在多個(gè)領(lǐng)域中的出現(xiàn),越來越多的學(xué)生開始對(duì)這門課產(chǎn)生了濃厚的興趣。如何讓學(xué)生能夠在整個(gè)課程中保持盎然的興趣,并為有志于深入研究計(jì)算機(jī)視覺的學(xué)生指明方向,成為我們教師首先應(yīng)注重的問題。在實(shí)際的教學(xué)工作中,通過不斷摸索總結(jié),我們認(rèn)為,以實(shí)際應(yīng)用引導(dǎo)學(xué)生的學(xué)習(xí)興趣,既滿足了學(xué)生想了解計(jì)算機(jī)視覺實(shí)際應(yīng)用的需求,又加深了學(xué)生對(duì)于算法的理解,把算法放在一個(gè)實(shí)際應(yīng)用中,學(xué)生可以理解怎么用,為什么這么用。在這樣的目標(biāo)導(dǎo)引下,我們從選擇教材開始,準(zhǔn)備教學(xué)內(nèi)容(包括合理的應(yīng)用實(shí)例的選擇)、制作PPT、探索教學(xué)方法,形成了目前以實(shí)際應(yīng)用為主導(dǎo)的創(chuàng)新教學(xué)體系,非常受學(xué)生歡迎。在此,我們對(duì)這期間遇到的問題,解決方法、心得體會(huì)做一個(gè)總結(jié)和思考,希望能對(duì)同行有些許參考作用。1選擇教材在我們這個(gè)專業(yè),每年的上研率基本都保持在50%左右。在本專業(yè)的研究生階段,也開設(shè)了雙語教學(xué)的計(jì)算機(jī)視覺課程。另外,畢業(yè)后選擇參加工作的同學(xué)也基本都進(jìn)入和本專業(yè)非常相關(guān)的一些單位,所從事的工作,都是和在學(xué)校學(xué)習(xí)的知識(shí)密切相關(guān)。因此,如何讓這門課程的教學(xué)既兼顧本科畢業(yè)就參加工作的那部分同學(xué),又兼顧繼續(xù)深造的學(xué)生的需求,也是在這門課程講授的過程中,需要特別注意的一個(gè)問題。對(duì)于本科畢業(yè)就要參加工作的同學(xué)而言,需要“廣度”,需要了解計(jì)算機(jī)視覺這門課在各個(gè)領(lǐng)域中的應(yīng)用,在實(shí)際中接觸到相關(guān)的項(xiàng)目或工作時(shí),能夠知道去哪里可以找到自己需要的參考資料;而對(duì)于要進(jìn)一步深造的同學(xué)而言,則需要一定的“深度”,為研究生階段的研究打下基礎(chǔ)。全盤考慮到這些學(xué)生畢業(yè)之后的去向,我們選擇了兩本教材。一本是賈云得教授編著,科學(xué)出版社于2000年出版的《機(jī)器學(xué)習(xí)》[2],這是一部順應(yīng)了時(shí)代與教學(xué)發(fā)展要求的教材,對(duì)計(jì)算機(jī)視覺中的基本概念、基本算法、基本算法的應(yīng)用、經(jīng)典應(yīng)用進(jìn)行了由淺入深的介紹。內(nèi)容涵蓋了所有經(jīng)典的數(shù)字圖像處理與機(jī)器視覺方法,也對(duì)一些已經(jīng)得到非常好實(shí)際應(yīng)用的方法,如光流法等作了簡(jiǎn)要介紹。另外還選擇了一本英文原版的計(jì)算機(jī)視覺的經(jīng)典著作,RameshJain教授等所著的《MachineVision》[3],機(jī)械工業(yè)出版社于2003年出版。這是國內(nèi)外非常推崇的一本計(jì)算機(jī)視覺著作,該教材條理清晰,深入淺出,對(duì)計(jì)算機(jī)視覺的基本原理、算法、應(yīng)用的介紹非常詳盡。在教學(xué)中,我們采用了英文的PPT,但主要用的教材是賈云得教授的《機(jī)器視覺》,這樣中英文對(duì)照講解,一方面加深學(xué)生對(duì)教學(xué)內(nèi)容的理解,另一方面也為學(xué)生今后閱讀專業(yè)的英文論文做了相應(yīng)準(zhǔn)備。2教學(xué)內(nèi)容和工程實(shí)例的選取2.1選取教學(xué)內(nèi)容本課程之前,大學(xué)二年級(jí)的本科生已開設(shè)數(shù)字圖像處理課程,但所講的基本原理和算法都非常淺顯,所以在教學(xué)內(nèi)容的安排上,分為兩大部分:數(shù)字圖像處理部分和視覺部分。數(shù)字信號(hào)處理部分主要講解在視覺部分會(huì)用到的一些基本算法,為后面進(jìn)入計(jì)算機(jī)視覺部分打基礎(chǔ)。這部分約占總課時(shí)的1/3。視覺部分的課時(shí)也分為兩部分:算法講解與實(shí)例講解。在算法講解部分,對(duì)計(jì)算機(jī)視覺的基本算法、經(jīng)典算法都做了深入淺出的講解。實(shí)例部分則選擇了經(jīng)典的工業(yè)應(yīng)用,讓學(xué)生能夠?qū)λ鶎W(xué)算法進(jìn)一步加以理解。2.2選取適當(dāng)?shù)墓こ虒?shí)例就計(jì)算機(jī)視覺的教學(xué)內(nèi)容而言,各個(gè)孤立的算法和方法對(duì)本科生來講,有些抽象不好理解。如果在教學(xué)上僅僅通過老師在課堂上的講解,很難讓學(xué)生深入地理解相關(guān)的教學(xué)內(nèi)容,而選擇一個(gè)觸手可及且簡(jiǎn)單好理解的工程實(shí)例往往就會(huì)達(dá)到意想不到的教學(xué)結(jié)果,學(xué)生可以把課堂上所學(xué)的枯燥理論與現(xiàn)實(shí)中活生生的事物聯(lián)系起來,從而加深對(duì)教學(xué)內(nèi)容的理解。通過反復(fù)比對(duì)、反復(fù)論證,我們選擇了在講解基本原理和算法之后,在課程結(jié)束前,專門留出課時(shí)講解手機(jī)制造這個(gè)例子。手機(jī)現(xiàn)在是人手一部,是這些年青學(xué)子再熟悉不過的事物了,通過對(duì)手機(jī)主板、手機(jī)鍵盤的制造過程的講解,把所學(xué)的算法都融合進(jìn)來,學(xué)生在覺得有趣的同時(shí),不知不覺就加深了對(duì)所學(xué)算法的理解。另外,在教學(xué)的過程中,我們還不斷穿插其他學(xué)生耳熟能詳?shù)膶?shí)例,如數(shù)碼相機(jī)原理中的一些算法的講解,我們和學(xué)生一起探討應(yīng)該怎么選擇數(shù)碼相機(jī)。再有,濾波器算法、在課堂上對(duì)Photoshop功能的演示,與所學(xué)算法關(guān)聯(lián)起來,學(xué)生都很容易理解接受。3教學(xué)點(diǎn)滴3.1點(diǎn)睛之筆在第一節(jié)課的講述中,我們的重點(diǎn)不在于Marr理論,而是告訴學(xué)生:人工智能就是要讓計(jì)算機(jī)像人一樣,能夠會(huì)聽、會(huì)看……我們這門課程就是要讓計(jì)算機(jī)“會(huì)看”,要像人一樣會(huì)看。進(jìn)而展示給學(xué)生一些我們精心挑選的圖片,讓學(xué)生自己判斷,是不是自己的眼睛“騙了”自己,人眼和計(jì)算機(jī)看到的到底有什么不一樣。每次講到這里,學(xué)生都會(huì)進(jìn)行熱烈的討論,每個(gè)人都有不同的看法,每個(gè)人都有自己的堅(jiān)持,不知不覺中,對(duì)這門課就產(chǎn)生了濃厚的興趣,有了繼續(xù)深入學(xué)習(xí)下去的愿望。在課堂討論的最后,比較人眼對(duì)圖片的判斷以及計(jì)算機(jī)的判斷后,讓學(xué)生自己總結(jié)歸納,我們這門課到底要研究些什么,都有可能應(yīng)用在哪些方面,然后對(duì)爭(zhēng)議比較大的提議一一探討。每到這個(gè)時(shí)候,大家的積極性就都被激發(fā)出來,在不斷的爭(zhēng)論與思想碰撞中找出正確的結(jié)論。3.2拿身邊的事物說“事”計(jì)算機(jī)視覺課程的前半部分,多涉及到圖像處理的一些常見算法。在講授各種各樣的濾波器和算子時(shí),并沒有針對(duì)各個(gè)濾波器和算子擺出一堆示例圖片,讓學(xué)生比較濾波前后的差異,從而很生硬地理解濾波器與算子的功能。取而代之的,我們首先以現(xiàn)在人手一臺(tái)的數(shù)碼相機(jī)為例提出問題,你為什么要選擇你手里的這臺(tái)數(shù)碼相機(jī)?當(dāng)初選這個(gè)品牌和型號(hào)時(shí),你的考慮是什么?歷年學(xué)生的回答幾乎都是看網(wǎng)上測(cè)評(píng),或者在網(wǎng)上看別人怎么說。這時(shí)列出我們收集到的各個(gè)品牌相機(jī)的測(cè)評(píng)報(bào)告,列出它們的優(yōu)缺點(diǎn),然后引導(dǎo)學(xué)生去思考,例如這個(gè)品牌的相機(jī)的缺點(diǎn)是照片發(fā)灰,不是很鮮亮,而另一個(gè)品牌的相機(jī)則綠的特別綠,紅的特別紅,為什么?那么有可能是哪部分的算法不夠完善,為什么?通過如此簡(jiǎn)單的對(duì)比,學(xué)生的積極性被完全激發(fā)。原來,數(shù)碼相機(jī)這個(gè)幾乎人人都有,大家都熟悉的“玩具”竟然和自己在課堂上學(xué)到的知識(shí)這么密切相關(guān)。再有,就是利用學(xué)生們都熟悉的PS(Photoshop),演示現(xiàn)在所謂的“完美證件照”是怎么來的。為什么可以把疙疙瘩瘩的臉部皮膚變得光滑?在PS中,你就是點(diǎn)了一下鼠標(biāo),其實(shí)在后臺(tái),是加入了一個(gè)濾波器進(jìn)行了濾波。各種這樣的演示,學(xué)生都非常喜聞樂見。因?yàn)樗麄兺蝗话l(fā)現(xiàn),原來那些事物,和我自己接觸到這些看似枯燥的理論之間,還有這么深刻的聯(lián)系。還有一個(gè)很受學(xué)生歡迎的例子就是對(duì)于“鼓形失真”的講解。我們的老師每次講到這里,都不會(huì)簡(jiǎn)單告訴學(xué)生“鼓形失真”發(fā)生的原因是什么,應(yīng)該怎么解決?老師都會(huì)問學(xué)生,明星為什么都一窩蜂去減肥?現(xiàn)在的女明星為什么都要去弄個(gè)“錐子臉”?課堂上就會(huì)出現(xiàn)一個(gè)小高潮,男同學(xué)和女同學(xué)的看法各異,彼此之間開始爭(zhēng)論不休。此時(shí)再趁熱打鐵地問學(xué)生,如果拿著相機(jī),離自己的鼻子一公分,會(huì)拍出什么樣的效果?有學(xué)生開始拿出手機(jī)對(duì)著自己和別人開拍,有的學(xué)生開始頭頭是道地分析。每到這種學(xué)生都開始熱烈討論的時(shí)候,就可以適時(shí)引導(dǎo)學(xué)生往正確的方向去,讓他們自己找到正確的分析解決方法,往往這個(gè)時(shí)候,學(xué)生都會(huì)頗有成就感,對(duì)于問題的理解也會(huì)特別的深刻。3.3選擇合適的實(shí)際應(yīng)用在所有理論講解結(jié)束后,我們會(huì)留出2~4次課講述計(jì)算機(jī)視覺在工業(yè)上的應(yīng)用。這些年來,對(duì)于手機(jī)制造這樣一個(gè)工業(yè)應(yīng)用,非常受學(xué)生歡迎。正如“數(shù)碼相機(jī)”這個(gè)例子一樣,現(xiàn)在學(xué)生都是人手一部手機(jī),是大家再熟悉不過的東西。這個(gè)例子涉及到了在前面理論講述中的大部分算法,如二值圖像的處理、模板匹配、高斯濾波器等。學(xué)生通過對(duì)這個(gè)工業(yè)應(yīng)用的理解,更進(jìn)一步加深了對(duì)算法的理解。以講解手機(jī)鍵盤的制造過程為例,向?qū)W生提出和前面所講內(nèi)容相關(guān)的問題,引導(dǎo)學(xué)生自發(fā)思考,如為什么選擇模板匹配法,而不是采用其他更復(fù)雜更精確的方法等等。每到這個(gè)時(shí)候,課堂氣氛總是分外熱烈,學(xué)生各抒己見,在不斷爭(zhēng)論中,更進(jìn)一步加深對(duì)課本上枯燥理論的認(rèn)識(shí)。在這里需要注意的問題是一定要一步一步提出問題,循循善誘,引導(dǎo)學(xué)生一層一層地深入思考。如果問題的答案過于“深藏不露”,則有可能觸發(fā)學(xué)生的抵觸情緒,無法繼續(xù)深入地思考。4結(jié)語通過多年的教學(xué)摸索,我們認(rèn)為,在計(jì)算機(jī)視覺課程的講述中,以實(shí)際應(yīng)用引導(dǎo)學(xué)生這樣的教學(xué)方法非??扇?而且也收到了很好的效果。另外,除了制定好的教學(xué)大綱,并選擇合適的教材外,根據(jù)學(xué)校現(xiàn)在的時(shí)間情況,我們選擇了多媒體手段輔助教學(xué),充分利用Matlab和大屏幕投影等方方面面的優(yōu)勢(shì),結(jié)合多種方法進(jìn)行教學(xué),對(duì)講好計(jì)算機(jī)視覺這門課,非常有益。
篇四:計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺導(dǎo)航綜述摘要:導(dǎo)航技術(shù)是移動(dòng)機(jī)器人核心技術(shù),移動(dòng)機(jī)器人又有多種導(dǎo)航方式,本文對(duì)各種導(dǎo)航方式進(jìn)行了分析比較,提出由于計(jì)算機(jī)視覺理論及算法的發(fā)展,又由于和激光、雷達(dá)和超聲在導(dǎo)航方面相比,視覺導(dǎo)航具有很多優(yōu)點(diǎn),因此視覺導(dǎo)航被大量地采用。根據(jù)移動(dòng)機(jī)器人是在導(dǎo)航過程中對(duì)圖像進(jìn)行處理,實(shí)時(shí)性差始終是一個(gè)非常棘手的問題,提出解決該問題的關(guān)鍵在于設(shè)計(jì)一種快速圖像處理方法。關(guān)鍵詞:視覺導(dǎo)航;移動(dòng)機(jī)器人;圖像處理移動(dòng)機(jī)器人是一種在復(fù)雜的環(huán)境下工作的具有自規(guī)劃、自組織、自適應(yīng)能力的機(jī)器人。移動(dòng)機(jī)器人集人工智能、智能控制、信息處理、圖像處理、模式識(shí)別、檢測(cè)與轉(zhuǎn)換等專業(yè)技術(shù)為一體,跨計(jì)算機(jī)、自動(dòng)控制、模式識(shí)別、智能控制等多學(xué)科,成為當(dāng)前智能機(jī)器人研究的熱點(diǎn)之一。在移動(dòng)機(jī)器人的運(yùn)動(dòng)過程中始終要解決的是自身的導(dǎo)航與定位問題,相關(guān)技術(shù)研究中,導(dǎo)航技術(shù)可以說是其核心技術(shù),也是其實(shí)現(xiàn)真正的智能化和完全的自主移動(dòng)的關(guān)鍵技術(shù)。也就是DurrantWhyte提出的三個(gè)問題:(1)“我現(xiàn)在何處?”;(2)“我要往何處去?”;(3)“要如何到該處去?”[1]其中問題(1)是移動(dòng)機(jī)器人導(dǎo)航系統(tǒng)中的定位及跟蹤問題,問題(2)、(3)是移動(dòng)機(jī)器人導(dǎo)航系統(tǒng)中路徑規(guī)劃問題。導(dǎo)航研究的目標(biāo)就是沒有人的干預(yù)下使機(jī)器人有目的地移動(dòng)并完成特定任務(wù),進(jìn)行特定操作。機(jī)器人通過裝配的信息獲取手段,獲得外部環(huán)境信息,實(shí)現(xiàn)自我定位,判定自身狀態(tài),規(guī)劃并執(zhí)行下一步的動(dòng)作。移動(dòng)機(jī)器人的導(dǎo)航方式分為:基于環(huán)境信息的地圖模型匹配導(dǎo)航;基于各種導(dǎo)航信號(hào)的路標(biāo)導(dǎo)航、視覺導(dǎo)航和味覺導(dǎo)航等[2]。環(huán)境地圖模型匹配導(dǎo)航是機(jī)器人通過自身的各種傳感器,探測(cè)周圍環(huán)境,利用感知到的局部環(huán)境信息進(jìn)行局部地圖構(gòu)造,并與其內(nèi)部事先存儲(chǔ)的完整地圖進(jìn)行匹配。如兩模型相互匹配,機(jī)器人可確定自身的位置,并根據(jù)預(yù)先規(guī)劃的一條全局路線,采用路徑跟蹤和避障技術(shù),實(shí)現(xiàn)導(dǎo)航。它涉及環(huán)境地圖模型建造和模型匹配兩大問題。路標(biāo)導(dǎo)航是事先將環(huán)境中的一些特殊景物作為路標(biāo),機(jī)器人在知道這些路標(biāo)在環(huán)境中的坐標(biāo)、形狀等特征的前提下,通過對(duì)路標(biāo)的探測(cè)來確定自身的位置。同時(shí)將全局路線分解成為路標(biāo)與路標(biāo)間的片段,不斷地對(duì)路標(biāo)探測(cè)來完成導(dǎo)航。根據(jù)路標(biāo)的不同,可分為人工路標(biāo)導(dǎo)航和自然路標(biāo)導(dǎo)航。人工路標(biāo)導(dǎo)航是機(jī)器人通過對(duì)人為放置的特殊標(biāo)志的識(shí)別實(shí)現(xiàn)導(dǎo)航,雖然比較容易實(shí)現(xiàn),但它人為地改變了機(jī)器人工作的環(huán)境。自然路標(biāo)導(dǎo)航不改變工作環(huán)境,是機(jī)器人通過對(duì)工作環(huán)境中的自然特征的識(shí)別完成導(dǎo)航,但路標(biāo)探測(cè)的穩(wěn)定性和魯棒性是研究的主要問題[3]。視覺導(dǎo)航,計(jì)算機(jī)視覺具有信息量豐富,智能化水平高等優(yōu)點(diǎn),近年來廣泛應(yīng)用于移動(dòng)機(jī)器人的自主導(dǎo)航。視覺導(dǎo)航方式具有信號(hào)探測(cè)范圍廣,獲取信息完整等優(yōu)點(diǎn),是移動(dòng)機(jī)器人導(dǎo)航的一個(gè)主要發(fā)展方向[4]。目前國內(nèi)外主要采用在移動(dòng)機(jī)器人上安裝車載攝像機(jī)的基于局部視覺的導(dǎo)航方式,如文獻(xiàn)[4]中所提及的:D.L.Boley等研制的移動(dòng)機(jī)器人利用車載攝像機(jī)和較少的傳感器通過識(shí)別路標(biāo)進(jìn)行導(dǎo)航;A.Ohya等利用車載攝像機(jī)和超聲波傳感器研究了基于視覺導(dǎo)航系統(tǒng)中的避碰問題等。視覺導(dǎo)航中邊緣銳化、特征提取等圖像處理方法計(jì)算量大且實(shí)時(shí)性較差,解決該問題的關(guān)鍵在于設(shè)計(jì)一種快速的圖像處理方法或采取組合導(dǎo)航方式[4-5]。味覺導(dǎo)航是通過機(jī)器人配備的化學(xué)傳感器感知?dú)馕兜臐舛龋鶕?jù)氣味的濃度和氣流的方向來控制機(jī)器人的運(yùn)動(dòng)。由于氣味傳感器具有靈敏度高、響應(yīng)速度快以及魯棒性好等優(yōu)點(diǎn),近年來許多研究人員在氣味導(dǎo)航技術(shù)上做了許多研究工作。但該項(xiàng)技術(shù)能夠真正應(yīng)用到實(shí)際環(huán)境中的卻很少,仍處于試驗(yàn)研究階段。FigaroEngineeringInc.公司研制的氧化錫氣味傳感器,被廣泛用于氣味導(dǎo)航試驗(yàn)。石英晶體微平衡氣味傳感器、導(dǎo)電聚合物氣味傳感器和一種模仿哺乳動(dòng)物鼻子功能的電子鼻等用于移動(dòng)機(jī)器人味覺導(dǎo)航的傳感器都處于試驗(yàn)階段。目前的味覺導(dǎo)航試驗(yàn)多采用將機(jī)器人起始點(diǎn)和目標(biāo)點(diǎn)之間用特殊的化學(xué)藥品,如酒精和樟腦丸等,引導(dǎo)出一條無碰氣味路徑,機(jī)器人根據(jù)不同的道路跟蹤算法,用氣味傳感器感知?dú)馕兜臐獾蜌馕对吹姆较蜻M(jìn)行機(jī)器人導(dǎo)航試驗(yàn)。味覺導(dǎo)航的研究具有很好的研究?jī)r(jià)值,該種移動(dòng)機(jī)器人可用來尋找化學(xué)藥品泄露源。由于計(jì)算機(jī)視覺理論及算法的發(fā)展,又由于和激光、雷達(dá)和超聲在導(dǎo)航方面相比,視覺導(dǎo)航具有以下幾個(gè)優(yōu)點(diǎn):首先,即使在丟棄了絕大部分的視覺信息后,所剩下的關(guān)于周圍環(huán)境的信息仍然比激光雷達(dá)和超聲更多更精確;其次,激光雷達(dá)和超聲的原理都是通過主動(dòng)發(fā)射脈沖和接受反射脈沖來測(cè)距的,因此當(dāng)多個(gè)機(jī)器人同時(shí)工作時(shí),相互之間可能產(chǎn)生干擾,而視覺由于是被動(dòng)測(cè)量,因此多個(gè)機(jī)器人相互之間的干擾可以減少到最小;最后,激光雷達(dá)和超聲數(shù)據(jù)的采樣周期一般比攝像機(jī)長,不能及時(shí)對(duì)高速運(yùn)動(dòng)的機(jī)器人提供信息并作出規(guī)劃,因此視覺傳感器被大量地采用。目前移動(dòng)機(jī)器人的導(dǎo)航大都采用基于視覺或有視覺參與的導(dǎo)航技術(shù)。最近二十年來,在未知或部分未知環(huán)境中,基于自然路標(biāo)導(dǎo)航與定位技術(shù)的研究;視覺導(dǎo)航中路標(biāo)的識(shí)別以及圖像處理的新型快速算法的研究成為了計(jì)算機(jī)視覺的主要研究方向。視覺導(dǎo)航主要完成障礙物和路標(biāo)的探測(cè)及識(shí)別。國內(nèi)外應(yīng)用最多的是在機(jī)器人上安裝車載攝像機(jī)的基于局部視覺的導(dǎo)航方式。P.I.Corke等對(duì)有車載攝像機(jī)的移動(dòng)機(jī)器人視覺閉環(huán)系統(tǒng)的研究表明,這種控制方法可以提高路徑跟蹤精度。從視覺圖像中識(shí)別道路是影響移動(dòng)機(jī)器人導(dǎo)航性能的一個(gè)最重要因素。對(duì)于一般的圖像邊沿抽取而言,已有了許多方法,例如,局部數(shù)據(jù)的梯度法和二階微分法。Trahanias利用視覺探測(cè)路標(biāo)來完成機(jī)器人的導(dǎo)航。其中路標(biāo)不是預(yù)先定義的人工路標(biāo),而是在學(xué)習(xí)階段自動(dòng)提取的自然路標(biāo)。在視覺導(dǎo)航中邊緣銳化、特征提取等圖像處理方法的計(jì)算量大,移動(dòng)機(jī)器人是在運(yùn)動(dòng)中對(duì)圖像進(jìn)行處理,實(shí)時(shí)性差始終是一個(gè)非常棘手的問題。解決該問題的關(guān)鍵在于設(shè)計(jì)一種快速圖像處理方法。為了滿足速度的要求,基于統(tǒng)計(jì)計(jì)算的預(yù)值法被應(yīng)用于機(jī)器人的導(dǎo)航,但在實(shí)際應(yīng)用中發(fā)現(xiàn),它抑制噪聲的能力差,特別是預(yù)值的選取極大地依賴于環(huán)境,要想獲得理想的結(jié)果,僅在一幅圖像中的不同區(qū)域就要設(shè)置不同的預(yù)值。近些年,由于人工智能的發(fā)展,有很多好的算法被應(yīng)用到移動(dòng)機(jī)器人的視覺導(dǎo)航中去。比如,根據(jù)導(dǎo)航圖像的特點(diǎn)采用邊緣提取結(jié)合HOUGH變換的方法和帶濾波窗的區(qū)域掃描的方法,經(jīng)過檢驗(yàn),這兩種算法都具有較好的實(shí)時(shí)性,對(duì)于直線形態(tài)的各類導(dǎo)航線以及對(duì)于已知半徑的弧形導(dǎo)航線具有較高的可靠性,以上算法目前對(duì)于分支較多的直線形態(tài)的導(dǎo)航線以及未知半徑的弧形導(dǎo)航線的效果不佳,這是今后努力的方向。Stanley還提出了基于神經(jīng)網(wǎng)絡(luò)的機(jī)器人視覺導(dǎo)航技術(shù)。該技術(shù)中估算逆雅可比矩陣,并將圖像特征的變化與機(jī)器人的位置變化對(duì)應(yīng)起來,通過神經(jīng)網(wǎng)絡(luò)訓(xùn)練來近似特征雅可比矩陣的逆陣。該技術(shù),通過提取幾何特征、平均壓縮、向量量化和主成分提取來簡(jiǎn)化圖像處理,實(shí)現(xiàn)實(shí)時(shí)視覺導(dǎo)航。綜上所述,移動(dòng)機(jī)器人是在運(yùn)動(dòng)中對(duì)圖像進(jìn)行處理,實(shí)時(shí)性差始終是一個(gè)非常棘手的問題。解決該問題的關(guān)鍵在于設(shè)計(jì)一種快速圖像處理方法。將室內(nèi)地面作為機(jī)器人視覺導(dǎo)航的路標(biāo)。依據(jù)地面的顏色信息,將地面上沒有障礙物的區(qū)域識(shí)別并分割出來,機(jī)器人在可行走區(qū)域內(nèi)行走,這樣就可以實(shí)現(xiàn)機(jī)器人的自主導(dǎo)航。利用環(huán)境中地面的顏色特征,采用比較簡(jiǎn)單的圖像處理算法分割彩色圖像,經(jīng)實(shí)驗(yàn)證明可提高機(jī)器人導(dǎo)航的實(shí)時(shí)性、準(zhǔn)確性和魯棒性。
篇五:計(jì)算機(jī)視覺論文:基于計(jì)算機(jī)視覺的學(xué)生考試自動(dòng)監(jiān)考系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)摘要:針對(duì)當(dāng)前視頻監(jiān)控進(jìn)行考試監(jiān)考的丟包率大和智能化程度不高的問題,在計(jì)算機(jī)視覺下進(jìn)行學(xué)生考試自動(dòng)監(jiān)控系統(tǒng)優(yōu)化設(shè)計(jì),提出一種基于視頻幀循環(huán)糾錯(cuò)編碼的計(jì)算機(jī)視覺自動(dòng)監(jiān)考系統(tǒng)設(shè)計(jì)方法。系統(tǒng)設(shè)計(jì)分為硬件和軟件部分,包括A/D電路、時(shí)鐘電路、視頻幀循環(huán)糾錯(cuò)編碼電路、程序加載電路和輸出接口電路。實(shí)驗(yàn)測(cè)試結(jié)果表明,該系統(tǒng)能有效降低監(jiān)考過程中的視頻丟包,提高監(jiān)考區(qū)域的視覺覆蓋度,系統(tǒng)集成性和智能性較高。關(guān)鍵詞:計(jì)算機(jī)視覺;考試;自動(dòng)監(jiān)考;視頻幀0引言隨著視頻圖像處理技術(shù)的發(fā)展,采用計(jì)算機(jī)視頻監(jiān)測(cè)方法進(jìn)行現(xiàn)場(chǎng)O控設(shè)計(jì),提高對(duì)監(jiān)控區(qū)域的自動(dòng)化識(shí)別和管理能力[1]。學(xué)生考試自動(dòng)監(jiān)考系統(tǒng)是考試智能化管理系統(tǒng)的重要部分,采用計(jì)算機(jī)視覺分析方法進(jìn)行自動(dòng)監(jiān)考,首先采用計(jì)算機(jī)視頻監(jiān)控方法進(jìn)行考試現(xiàn)場(chǎng)的實(shí)時(shí)視覺畫面采集,從而實(shí)現(xiàn)對(duì)考試現(xiàn)場(chǎng)的檢驗(yàn)分析和指導(dǎo)。研究學(xué)生考試自動(dòng)監(jiān)考系統(tǒng),在促進(jìn)智能化考試管理和提高考場(chǎng)監(jiān)考的管控能力方面具有積極重要意義[2],對(duì)學(xué)生考試自動(dòng)監(jiān)考系統(tǒng)是建立在視頻圖像分析基礎(chǔ)上的,結(jié)合系統(tǒng)硬件設(shè)備設(shè)計(jì)和軟件開發(fā),采用計(jì)算機(jī)視覺分析方法進(jìn)行監(jiān)控現(xiàn)場(chǎng)的異常信息特征提取和分析,采用視頻幀循環(huán)糾錯(cuò)編碼避免監(jiān)控過程中的丟包和誤碼失真。首先進(jìn)行系統(tǒng)的總體構(gòu)架分析,然后進(jìn)行監(jiān)考系統(tǒng)的硬件模塊化設(shè)計(jì),最后進(jìn)行系統(tǒng)調(diào)試分析,得出有效性結(jié)論。1系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)1.1器件選擇根據(jù)上述設(shè)計(jì)思想和總體設(shè)計(jì)構(gòu)架,進(jìn)行基于計(jì)算機(jī)視覺的學(xué)生考試自動(dòng)監(jiān)考系統(tǒng)的硬件模塊化設(shè)計(jì),學(xué)生考試自動(dòng)監(jiān)考系統(tǒng)的數(shù)據(jù)采集系統(tǒng)是整個(gè)系統(tǒng)的基礎(chǔ)。通過PCI橋接芯片與PC機(jī)進(jìn)行數(shù)據(jù)通信,采用PCI9054的LOCAL總線設(shè)計(jì)方法,進(jìn)行數(shù)據(jù)特征采集,把學(xué)生考試監(jiān)考現(xiàn)場(chǎng)的視頻信息存儲(chǔ)到PCI總線上,在嵌入式RAM中對(duì)監(jiān)控視頻信息進(jìn)行收發(fā)轉(zhuǎn)換和視頻幀間編碼,基于視頻幀循環(huán)糾錯(cuò)編碼方法進(jìn)行視頻糾錯(cuò)。硬件設(shè)計(jì)主要包括如下幾個(gè)部分:學(xué)生考試監(jiān)考現(xiàn)場(chǎng)的視頻信息的DSP信號(hào)處理器、模擬信號(hào)預(yù)處理機(jī)、視頻信息的邏輯控制設(shè)備、外部I/O設(shè)備以及A/D設(shè)備和電源供電設(shè)備,用DSP控制A/D轉(zhuǎn)換FLASH寄存器寄存學(xué)生考試監(jiān)考現(xiàn)場(chǎng)的視頻視覺特征信息,同時(shí)DSP與PCI通信,DSP接收PCI總線的用戶信息,輸出多路視頻編碼到功率放大器。通過串行E2PROM進(jìn)行配置校驗(yàn),在C模式下通過PCI總線送采樣數(shù)據(jù)或處理結(jié)果到PC機(jī)進(jìn)行監(jiān)考現(xiàn)場(chǎng)的監(jiān)控信息分析。1.2監(jiān)考系統(tǒng)的電路設(shè)計(jì)根據(jù)上述總體設(shè)計(jì)要求,結(jié)合選擇的器件,采用可編程DSP芯片ADSP?BF537作為核心處理芯片,進(jìn)行學(xué)生考試自動(dòng)監(jiān)考系統(tǒng)的電路設(shè)計(jì),主要包括了A/D電路、時(shí)鐘電路、視頻幀循環(huán)糾錯(cuò)編碼電路、程序加載電路和輸出接口電路等,分別設(shè)計(jì)描述如下:(1)A/D電路。學(xué)生考試監(jiān)考系統(tǒng)的A/D電路是實(shí)現(xiàn)對(duì)輸入視頻采集信息的數(shù)/模轉(zhuǎn)換,提供給計(jì)算機(jī)和DSP芯片可識(shí)別的原始計(jì)算機(jī)視覺信息,結(jié)合視頻幀循環(huán)糾錯(cuò)編碼方法進(jìn)行可視化校對(duì)和視頻編碼。外部I/O設(shè)備包括A/D轉(zhuǎn)換器AD7864兩片,A/D電路的分辨率為12位,最大采樣頻率25kHz,采用AD7864(以下簡(jiǎn)稱7864)作為A/D芯片,它是4通道輸入、轉(zhuǎn)換速度1.65μs的高性能AD芯片,自動(dòng)監(jiān)考系統(tǒng)的A/D輸入電壓滿足:采樣通道數(shù)由DSP數(shù)據(jù)總線dspD[3:0]控制[3],A4~A0和譯碼,利用信號(hào)作讀數(shù)標(biāo)志信號(hào),得到A/D電路的接口硬件設(shè)計(jì)圖如圖1所示??紤]到系統(tǒng)處理視頻傳輸信息的時(shí)間和讀數(shù)匹配問題,在進(jìn)行A/D設(shè)計(jì)中,需要考慮7864模擬輸入/輸出對(duì)應(yīng)碼表,見表1。(2)時(shí)鐘電路。時(shí)鐘電路執(zhí)行學(xué)生考試自動(dòng)監(jiān)考系統(tǒng)的時(shí)鐘中斷控制功能[4],采用5409A作為自動(dòng)監(jiān)考系統(tǒng)的時(shí)鐘中斷的核心控制芯片,5409A有3個(gè)多通道緩沖串口McBSPs,提供串行A/D、D/A設(shè)備以及其他的串行器件直接接口,本地總線支持復(fù)用/非復(fù)用的32位地址/數(shù)據(jù),包括PCI總線操作和LOCAL總線操作,PC9054內(nèi)部CI9054的LOCAL總線與PCI總線通過異步操作實(shí)現(xiàn)兩個(gè)DMA數(shù)據(jù)的串行接口輸入和輸出。時(shí)鐘電路的引腳設(shè)計(jì)如圖2所示。(3)視頻幀循環(huán)糾錯(cuò)編碼電路。視頻幀循環(huán)糾錯(cuò)編碼電路是整個(gè)系統(tǒng)設(shè)計(jì)的核心模塊,視頻幀循環(huán)糾錯(cuò)編碼通過Emulator由JTAG(JointTestActionGroup)口下載到DSP中運(yùn)行,在IEEE1149.1標(biāo)準(zhǔn)協(xié)議下進(jìn)行5409A芯片器件的操作測(cè)試,芯片采用4通道高性能運(yùn)放,帶寬為10MHz。使用ADUM1201進(jìn)行幀同步信號(hào)設(shè)計(jì)[5],選擇Motorola公司高性能MPC850/86作為自動(dòng)監(jiān)考系統(tǒng)的三維特征分析模塊,從外部16位存儲(chǔ)器讀取監(jiān)測(cè)視頻圖像的編碼特征,引出雙排的14腳插針外接上拉或下拉電阻,選擇引腳、時(shí)鐘信號(hào)輸入引腳,數(shù)據(jù)總線LD9054與應(yīng)用電路連接,以串行E2PROM的配置電路作為I/O初始化控制寄存器模塊單元,直接從地址0x20000000執(zhí)行16位打包模式實(shí)現(xiàn)視頻糾錯(cuò)編碼,得到視頻幀循環(huán)糾錯(cuò)編碼電路設(shè)計(jì)如圖3所示。(4)程序加載電路。選擇Motorola公司高性能MPC850/86作為學(xué)生考試自動(dòng)監(jiān)考的可視化校驗(yàn)視覺分析的程序加載電路的核心處理芯片。在程序加載電路中,采用可編程邏輯芯片PLC進(jìn)行圖像信息分析,在程序加載中,從外部16位存儲(chǔ)器直接執(zhí)行16位打包模式,引導(dǎo)ROM配置異步存儲(chǔ)器空間,通過連續(xù)讀取0x00字節(jié)的個(gè)數(shù)來確定學(xué)生考試自動(dòng)監(jiān)考系統(tǒng)的SPI存儲(chǔ)器的片選[6],程序加載電路設(shè)計(jì)如圖4所示。圖4中,在VCC和地之間并聯(lián)1個(gè)電容,滿足程序加載電路的可編程的硬件寫保護(hù)和片內(nèi)的偶然性的寫保護(hù)功能。(5)輸出接口電路。輸出接口電路設(shè)計(jì)中,通過JTAG接口訪問CPU的內(nèi)部寄存器,通過串行E2PROM進(jìn)行配置校驗(yàn)。使用JTAG仿真器執(zhí)行12通道DMA異步串行口設(shè)計(jì),采用分立元件構(gòu)成串口復(fù)位電路,降低DSP的能耗。開關(guān)頻率也可在0~1間調(diào)節(jié),內(nèi)核電壓在0.8~1.2V間調(diào)整,內(nèi)核電源通過10和0.1電容濾波,以減少電源噪聲。實(shí)時(shí)時(shí)鐘電源與I/O電源采取分別供電策略,綜上分析,得到輸出接口電路見圖5。在上述進(jìn)行系統(tǒng)的硬件模塊化設(shè)計(jì)的基礎(chǔ)上,進(jìn)行系統(tǒng)集成設(shè)計(jì)與軟件開發(fā)。2實(shí)驗(yàn)測(cè)試分析對(duì)上述學(xué)生考試自動(dòng)監(jiān)考系統(tǒng)進(jìn)行軟件開發(fā)和系統(tǒng)調(diào)試分析。件開發(fā)建立在CCS2.20開發(fā)平臺(tái)下,借助于LabWindows/CVI,C/C++開發(fā)計(jì)算機(jī)視覺下的圖像和視頻信息處理程序。根據(jù)編寫的PCI卡驅(qū)動(dòng)程序進(jìn)行視頻信息采樣和監(jiān)考系統(tǒng)的原始數(shù)據(jù)采集,得到學(xué)生考試自動(dòng)監(jiān)考的視頻采集分析界面如圖6所示。從圖6可見,采用本文設(shè)計(jì)的考試自動(dòng)監(jiān)考系統(tǒng),能有效實(shí)現(xiàn)計(jì)算機(jī)視覺下的監(jiān)考視頻信息傳輸。為了定量測(cè)試系統(tǒng)的性能,圖7給出了不同方法進(jìn)行監(jiān)考視覺分析的視頻丟包率對(duì)比結(jié)果,從圖7得知,該系統(tǒng)能有效降低監(jiān)考過程中的視頻丟包,從而提高監(jiān)考區(qū)域的視覺覆蓋度。3結(jié)語本文提出一種基于視頻幀循環(huán)糾錯(cuò)編碼的計(jì)算機(jī)視覺自動(dòng)監(jiān)考系統(tǒng)設(shè)計(jì)方法。系統(tǒng)設(shè)計(jì)分為硬件和軟件部分,首先進(jìn)行了學(xué)生考試自動(dòng)監(jiān)考系統(tǒng)的總體設(shè)計(jì)構(gòu)架分析和功能指標(biāo)描述;然后以ADSP?BF537并行微處理芯片為核心進(jìn)行監(jiān)考系統(tǒng)的硬件設(shè)計(jì),包括A/D電路、時(shí)鐘電路、視頻幀循環(huán)糾錯(cuò)編碼電路、程序加載電路和輸出接口電路;最后在VisualDSP++集成開發(fā)環(huán)境中進(jìn)行自動(dòng)監(jiān)考系統(tǒng)的軟件開發(fā)設(shè)計(jì),結(jié)合視頻幀循環(huán)糾錯(cuò)編碼進(jìn)行程序加載,實(shí)現(xiàn)計(jì)算機(jī)視覺下的自動(dòng)監(jiān)考。實(shí)驗(yàn)測(cè)試結(jié)果表明,該系統(tǒng)能有效降低監(jiān)考過程中的視頻丟包,提高了監(jiān)考區(qū)域的視覺覆蓋度,具有優(yōu)越性能。篇六:計(jì)算機(jī)視覺論文:基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè)專利分析摘要對(duì)基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè)領(lǐng)域的專利申請(qǐng)趨勢(shì)、專利申請(qǐng)產(chǎn)出國和申請(qǐng)人分布進(jìn)行了統(tǒng)計(jì)分析,重點(diǎn)針對(duì)基于人眼、基于人臉、基于嘴巴的疲勞駕駛檢測(cè)這三個(gè)技術(shù)分支的發(fā)展脈絡(luò)進(jìn)行了梳理,并對(duì)基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè)的發(fā)展趨勢(shì)進(jìn)行了分析。關(guān)鍵詞疲勞駕駛?cè)搜邸⑷四樧彀蛯@?引言造成交通事故的原因25%-30%產(chǎn)生于疲勞駕駛,因此疲勞駕駛已成為誘發(fā)交通事故的重要因素。國內(nèi)外專家和學(xué)者針對(duì)疲勞駕駛的檢測(cè)開展了大量的研究工作,目前研究的重心主要集中在基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè),因此對(duì)基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè)的相關(guān)專利進(jìn)行分析尤為必要。1基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè)專利申請(qǐng)數(shù)據(jù)分析1.1全球?qū)@暾?qǐng)量趨勢(shì)從圖1可以看出,基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè)專利申請(qǐng)量從1990-2001年間處于技術(shù)研發(fā)初期,專利申請(qǐng)量相對(duì)較少。從2002年開始該領(lǐng)域的專利申請(qǐng)量逐漸呈現(xiàn)持續(xù)增長趨勢(shì),并在2014年達(dá)到最大值153件。由此可知,隨著疲勞駕駛的增多,人們對(duì)疲勞駕駛的檢測(cè)也越來越重視,相應(yīng)的研究也正不斷增加。基于此,在今后的一段時(shí)間內(nèi),相關(guān)的專利申請(qǐng)量有望繼續(xù)保持。1.2專利申請(qǐng)產(chǎn)出地區(qū)分布目前各領(lǐng)域的專利申請(qǐng)量主要集中在中國、美國、韓國、日本和歐洲,通過對(duì)該領(lǐng)域在中國、美國、韓國、日本和歐洲的專利申請(qǐng)量進(jìn)行統(tǒng)計(jì)分析發(fā)現(xiàn),中國的申請(qǐng)量以48%的占比雄居第一,其他幾個(gè)地區(qū)的申請(qǐng)量相差不大,具體如圖2所示。1.3在華專利申請(qǐng)量變化趨勢(shì)圖3為1990年至2014年基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè)在華的申請(qǐng)量變化趨勢(shì)圖,由該圖可以看出,1990-2002年是技術(shù)的萌芽期,在2003年以后申請(qǐng)量才呈現(xiàn)逐年增長的趨勢(shì),并且在2012年-2014年將均維持在較高的申請(qǐng)量。因此,該領(lǐng)域國內(nèi)雖然起步較晚,但是最近幾年申請(qǐng)量相對(duì)其他地區(qū)卻具有壓制性的優(yōu)勢(shì)。1.4在華主要申請(qǐng)人分析圖4展示了在華主要申請(qǐng)人的申請(qǐng)量份額,主要以科研院所和大型汽車企業(yè)為主,其中吉利汽車公司以領(lǐng)先優(yōu)勢(shì)排名第一。2主要技術(shù)分支的專利申請(qǐng)分析基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè)的主要技術(shù)分支有:基于人眼的駕駛疲勞檢測(cè)、基于人臉的駕駛疲勞檢測(cè)、基于嘴巴的疲勞檢測(cè)。下面從三個(gè)技術(shù)分支的發(fā)展概況、三個(gè)技術(shù)分支的主要工作原理及重點(diǎn)專利等方面進(jìn)行分析。2.1全球?qū)@暾?qǐng)主要技術(shù)分支的申請(qǐng)量趨勢(shì)圖由圖6可知,近年來基于人眼和人臉的駕駛疲勞檢測(cè)的申請(qǐng)量呈現(xiàn)較快增長,申請(qǐng)量也較基于嘴巴的疲勞檢測(cè)的申請(qǐng)量大,體現(xiàn)了該領(lǐng)域近年來的發(fā)展趨勢(shì),并體現(xiàn)出基于人眼和人臉的駕駛疲勞檢測(cè)的技術(shù)分支發(fā)展已較為成熟。三個(gè)技術(shù)分支在2006年之前,申請(qǐng)量的差別不大且數(shù)量均較小,顯示出在2006年以前三個(gè)分支的區(qū)別并不明顯,發(fā)展也較為緩慢,這說明基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè)也是近10年才興起的一項(xiàng)技術(shù),它依賴于圖像處理技術(shù)的發(fā)展水平。2.2在華專利申請(qǐng)主要技術(shù)分支的申請(qǐng)量趨勢(shì)圖由圖7可知,三個(gè)技術(shù)分支在2006年以前均只有零星的申請(qǐng)量,這與該領(lǐng)域在全球的發(fā)展情況相符合,基于人眼的疲勞駕駛檢測(cè)在華申請(qǐng)量自2006年以來呈現(xiàn)穩(wěn)步增長,且近年來申請(qǐng)量最大?;谌四樀钠隈{駛檢測(cè)申請(qǐng)量雖小于基于人眼的疲勞駕駛檢測(cè),但近年來的申請(qǐng)量也呈現(xiàn)出穩(wěn)步增長的勢(shì)頭。然而,基于嘴巴的疲勞駕駛檢測(cè)雖有增長趨勢(shì),但申請(qǐng)量一直都較小。由此可知,在國內(nèi)疲勞駕駛的檢測(cè)主要是采用人眼檢測(cè)和人臉檢測(cè),這兩個(gè)分支是國內(nèi)的研究的熱門,也是今后國內(nèi)在該領(lǐng)域的發(fā)展趨勢(shì)。3結(jié)語通過對(duì)基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè)專利的申請(qǐng)量的總體分析,以及基于人眼、基于人臉、基于嘴巴三個(gè)技術(shù)分支的申請(qǐng)量趨勢(shì)分析可知,基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè)在近10年取得了較快發(fā)展,這與計(jì)算機(jī)圖像處理技術(shù)的發(fā)展密不可分;同時(shí),科研院所作為該領(lǐng)域研究的主體,應(yīng)加強(qiáng)與中小企業(yè)的合作。國內(nèi)疲勞駕駛的檢測(cè)研究主要集中在人眼檢測(cè)和人臉檢測(cè),這兩個(gè)分支是國內(nèi)的研究的熱門,同時(shí),基于人眼的疲勞檢測(cè)其發(fā)展方向明確,后續(xù)發(fā)展將集中在眼睛定位算法的研究上,并且定位精度將越來越高,越來越滿足實(shí)際的要求。
篇七:計(jì)算機(jī)視覺論文:一種基于計(jì)算機(jī)視覺的手指特征識(shí)別算法研究及其FPGA實(shí)現(xiàn)摘要:為了提高視頻圖像中手指特征識(shí)別的精度和速度,提出一種基于矩形模板的動(dòng)態(tài)閾值算法。該算法采用矩形模板平滑圖像,用灰度閾值法提取目標(biāo)邊緣,實(shí)現(xiàn)對(duì)手指特征的準(zhǔn)確識(shí)別。Matlab仿真結(jié)果表明,該算法受環(huán)境噪聲影響較小,能清晰準(zhǔn)確地分割出手指邊緣。在FPGA平臺(tái)上設(shè)計(jì)了一套基于計(jì)算機(jī)視覺的手指特征識(shí)別系統(tǒng),并對(duì)該系統(tǒng)的實(shí)時(shí)性、手指識(shí)別精度等性能進(jìn)行了測(cè)試。測(cè)試結(jié)果表明,該系統(tǒng)的運(yùn)行速度與攝像頭攝取圖像的速度基本同步,可滿足系統(tǒng)對(duì)實(shí)時(shí)性要求。系統(tǒng)對(duì)手指位置識(shí)別的坐標(biāo)偏差約為3個(gè)像素,基本滿足系統(tǒng)對(duì)識(shí)別精度的要求。關(guān)鍵詞:計(jì)算機(jī)視覺;手指特征識(shí)別;動(dòng)態(tài)閾值算法;矩形模版S著科學(xué)技術(shù)的飛速發(fā)展,人與計(jì)算機(jī)之間的交互活動(dòng)越來越密切,并逐漸成為人們?nèi)粘I畹闹匾M成部分。傳統(tǒng)觸摸屏是現(xiàn)階段一種最常見,也是最重要的人機(jī)交互方式,其是通過一種附加在顯示器表面的透明介質(zhì),依賴使用者的手指觸摸該介質(zhì)來實(shí)現(xiàn)對(duì)計(jì)算機(jī)的輸入控制[1?2]。目前,這種觸摸屏技術(shù)已經(jīng)相當(dāng)成熟,但是,技術(shù)上不容易做到大尺寸,且成本相對(duì)較高,也易于破損。為了突破傳統(tǒng)觸摸屏這種人機(jī)交互方式的局限,把任何成像平面變成可用手指進(jìn)行交互的系統(tǒng),本文提出了一種基于計(jì)算機(jī)視覺的手指特征識(shí)別算法,并在FPGA平臺(tái)上建立了一套基于計(jì)算機(jī)視覺的手指特征識(shí)別硬件系統(tǒng)。這種基于計(jì)算機(jī)視覺的手指特征識(shí)別方法可為基于視覺的人機(jī)互動(dòng)提供一種新的技術(shù)解決途徑。其與傳統(tǒng)觸摸屏的區(qū)別在于,不需要在成像屏幕上安裝任何特殊介質(zhì),使用壽命得到大幅延長,應(yīng)用范圍有了很大擴(kuò)展。1圖像采集平臺(tái)本文所采用的圖像采集平臺(tái)如圖1所示,在任何與計(jì)算機(jī)連接的顯示設(shè)備(如投影屏幕、等離子電視等)的左上角、右上角安裝兩個(gè)攝像頭,通過這兩個(gè)攝像頭便可確定手指在屏幕上的二維坐標(biāo)信息(x1,x2)。然后,將此坐標(biāo)點(diǎn)傳至計(jì)算機(jī),并與Windows系統(tǒng)的鼠標(biāo)程序關(guān)聯(lián)即可實(shí)現(xiàn)人機(jī)交互功能。圖2是圖像采集平臺(tái)的側(cè)視圖。其中虛線框表示攝像頭視野中系統(tǒng)需要處理的區(qū)域,即手指出現(xiàn)的區(qū)域。2手指特征識(shí)別算法及仿真在系統(tǒng)實(shí)現(xiàn)過程中,如何從攝像頭所拍攝的畫面中準(zhǔn)確地識(shí)別并提取出手指信息是其難點(diǎn)之一。在目前的圖像處理技術(shù)中,用于識(shí)別背景圖案中目標(biāo)物體的算法很多,本文在分析基于色彩聚類的膚色識(shí)別算法的基礎(chǔ)上,結(jié)合課題特殊需求,提出一種基于矩形模板的動(dòng)態(tài)閾值算法,并在Matlab中對(duì)上述算法的處理效果進(jìn)行了仿真。從圖像采集平臺(tái)可以看出,本系統(tǒng)只關(guān)心距屏幕很近的小視野內(nèi)是否出現(xiàn)區(qū)別于背景的目標(biāo)物體。因此,只需從攝像頭拍攝的圖像當(dāng)中截取一部分,如圖3中的小矩形框所示。2.1基于色彩聚類的膚色識(shí)別算法膚色是人體區(qū)別于其他物體的一個(gè)重要特征,人體膚色特征不受位置、角度、大小等因素影響,具有較強(qiáng)的穩(wěn)定性。因此,本文首先選定基于色彩聚類的膚色提取識(shí)別算法進(jìn)行研究。在色彩聚類方法中,AnilK.Jain的Cb,Cr橢圓聚類方法最為典型[3?4]。采用非線性分段膚色分割得到的膚色區(qū)域在Cb,Cr空間中近似于橢圓,如下:由圖5可知,利用該算法分割手指信息的效果尚可,能從比較友好的環(huán)境中迅速準(zhǔn)確地識(shí)別出手指信息。圖6為利用橢圓聚類膚色分割算法對(duì)從圖像采集平臺(tái)讀取圖像的手指識(shí)別效果??梢?,該算法在普通環(huán)境下對(duì)手指的識(shí)別效果良好。但當(dāng)屏幕上的顏色影響手指膚色時(shí),該算法的識(shí)別能力就會(huì)有所降低。可見,該算法對(duì)皮膚顏色的純度要求較高,適用范圍受限。圖7為屏幕出現(xiàn)大面積藍(lán)色時(shí)對(duì)手指識(shí)別造成的影響效果。2.2基于正方形模板的動(dòng)態(tài)閾值算法基于正方形模板的動(dòng)態(tài)閾值算法,即采用灰度閾值法,用正方形模板平滑圖像[5?6]。圖8(a)是3×3模板動(dòng)態(tài)閾值算法平滑圖像的過程。應(yīng)用基于3×3模板的動(dòng)態(tài)閾值算法對(duì)原圖4進(jìn)行邊緣提取的仿真效果如圖9(a)所示??梢?,應(yīng)用3×3模板可以提取出目標(biāo)物體的邊緣,但不夠清晰。雖然可以通過增大模板取得比較理想的效果(圖9(b)為采用基于101×101模板的動(dòng)態(tài)閾值算法的處理效果),但會(huì)使計(jì)算量劇增,同時(shí)也縮小了模板所能完全覆蓋的范圍,使圖像邊緣產(chǎn)生無效的白色區(qū)域。2.3基于矩形模板的動(dòng)態(tài)閾值算法根據(jù)課題實(shí)際需要,即所要處理的目標(biāo)區(qū)域?yàn)殚L方形窄條區(qū)域(如圖3所示),本文提出一種基于矩形模板的動(dòng)態(tài)閾值算法。該算法與基于正方形模板算法的區(qū)別在于,平滑圖像時(shí)所用的模板為窄條形,如3×5模板,3×15模板,3×41模板等。圖8(b)是3×9模板動(dòng)態(tài)閾值算法平滑圖像的過程。圖10給出了采用基于3×9模板、3×14模板、3×81模板、3×101模板動(dòng)態(tài)閾值算法對(duì)原圖4進(jìn)行手部邊緣提取的仿真效果。由仿真效果可知,基于矩形模板的動(dòng)態(tài)閾值算法在模板取值為3×9的情況下,便能夠清晰提取出目標(biāo)物體的邊緣。而且,隨著模板取值的增加,目標(biāo)物體邊緣的提取效果更加清晰準(zhǔn)確。與基于正方形模板的動(dòng)態(tài)閾值算法相比,基于矩形模板的動(dòng)態(tài)閾值算法計(jì)算量較小,節(jié)約了系統(tǒng)的計(jì)算資源。3基于FPGA的手指特征識(shí)別算法的系統(tǒng)測(cè)試為了驗(yàn)證本文所提出的基于矩形模板的動(dòng)態(tài)閾值算法能否滿足屏幕交互系統(tǒng)的整體要求,本文通過編寫軟件程序在FPGA開發(fā)板上對(duì)這種算法進(jìn)行了硬件實(shí)現(xiàn)和系統(tǒng)測(cè)試。3.1硬件實(shí)現(xiàn)本文所采用的硬件實(shí)現(xiàn)系統(tǒng)主要是基于美國Altera公司生產(chǎn)的型號(hào)為EFA?CY1C12的“紅色颶風(fēng)”(RedCyclone)系列FPGA開發(fā)板,并另外集成了用Ommvison公司的型號(hào)為OV9655的CMOS數(shù)字?jǐn)z像頭,以及ISSI公司的型號(hào)為IS61LV25616AL的SRAM存儲(chǔ)器[7?10]。最終搭建的硬件系統(tǒng)如圖11所示。3.2系統(tǒng)測(cè)試本文主要對(duì)系統(tǒng)的實(shí)時(shí)性、手指提取精度、資源占用情況等影響系統(tǒng)運(yùn)行的重要技術(shù)指標(biāo)進(jìn)行了測(cè)試。(1)實(shí)時(shí)性O(shè)V9655攝像頭在1280×1024分辨率下,能提供15f/s的圖像采集速率,課題所設(shè)計(jì)的軟件程序可以在一幀圖像的處理時(shí)間內(nèi)完成了數(shù)據(jù)的采集、手指邊緣的識(shí)別等運(yùn)算,實(shí)現(xiàn)了系統(tǒng)執(zhí)行速度與攝像頭拍攝速度的同步,達(dá)到了系統(tǒng)對(duì)實(shí)時(shí)性要求。(2)手指識(shí)別精度由于課題在軟件設(shè)計(jì)過程中編入了圖像采集防抖動(dòng)處理程序,提高了圖像采集的穩(wěn)定性,也提高了手指識(shí)別的精度。經(jīng)過測(cè)試,本系統(tǒng)得到的手指位置信息的坐標(biāo)偏差為3個(gè)像素,基本滿足大屏幕交互系統(tǒng)對(duì)識(shí)別精度的需求。(3)資源占用情況從QuartusⅡ的編譯報(bào)告中可以看出,本系統(tǒng)的軟件運(yùn)行已占用FPGA的9702個(gè)邏輯單元,占邏輯單元總數(shù)的80%。可見,該硬件系統(tǒng)的FPGA運(yùn)算資源基本能滿足系統(tǒng)的實(shí)際需要。4結(jié)語本文通過對(duì)基于矩形模板的動(dòng)態(tài)閾值算法的研究和基于FPGA的手指特征識(shí)別硬件系統(tǒng)的實(shí)現(xiàn),建立了一套基于計(jì)算機(jī)視覺的手指特征識(shí)別系統(tǒng)。該算法受環(huán)境噪聲影響較小,能清晰準(zhǔn)確地分割出手指邊緣,且隨著矩形模版取值的增大,算法的識(shí)別效果會(huì)更加良好。該系統(tǒng)的實(shí)時(shí)性、手指識(shí)別精度及資源占用情況均可滿足系統(tǒng)要求。這種基于計(jì)算機(jī)視覺的手指識(shí)別方法成本低、靈活性好,為基于視覺的人機(jī)交互提供了一種新的技術(shù)途徑。
篇八:計(jì)算機(jī)視覺論文:基于計(jì)算機(jī)視覺的運(yùn)動(dòng)目標(biāo)跟蹤算法摘要截至目前,運(yùn)動(dòng)目標(biāo)跟蹤已經(jīng)歷經(jīng)了幾十年的發(fā)展研究,其作為當(dāng)前社會(huì)一項(xiàng)至關(guān)重要的先進(jìn)技術(shù),對(duì)于人們的日常工作生活以及社會(huì)經(jīng)濟(jì)、軍事政治等其他各領(lǐng)域均有著積極的幫助作用。特別是在計(jì)算機(jī)視覺技術(shù)逐漸發(fā)展成熟的今天,運(yùn)動(dòng)目標(biāo)跟蹤與計(jì)算機(jī)視覺技術(shù)的融合程度也越來越高?;诖耍疚膶⑦x擇當(dāng)前比較常見的一種目標(biāo)跟蹤算法即Kalmanfilter算法,并以運(yùn)動(dòng)的人臉作為跟蹤目標(biāo),著重圍繞基于計(jì)算機(jī)視覺的運(yùn)動(dòng)目標(biāo)跟蹤算法進(jìn)行簡(jiǎn)要分析研究。【關(guān)鍵詞】計(jì)算機(jī)視覺運(yùn)動(dòng)目標(biāo)跟蹤算法在計(jì)算機(jī)等現(xiàn)代科學(xué)技術(shù)尚未出現(xiàn)以前,人們?cè)讷@取外界信息時(shí)往往主要依賴視覺,而在我國計(jì)算機(jī)技術(shù)水平不斷發(fā)展提升的背景之下,計(jì)算機(jī)視覺技術(shù)的出現(xiàn)使得人類肉眼視覺得到了進(jìn)一步的發(fā)展延伸,尤其是在各種傳感器技術(shù)的幫助之下,使得人們能夠?qū)Ρ3诌\(yùn)動(dòng)狀態(tài)的目標(biāo)進(jìn)行實(shí)時(shí)跟蹤,從而準(zhǔn)確掌握目標(biāo)的具體形態(tài)屬性。在此背景之下,本文將運(yùn)動(dòng)目標(biāo)設(shè)定為運(yùn)動(dòng)的人臉,通過探究基于計(jì)算機(jī)視覺的運(yùn)動(dòng)目標(biāo)跟蹤算法,希望能夠?yàn)橄嚓P(guān)研究人員提供相關(guān)參考和幫助。1Kalmanfilter目標(biāo)跟蹤算法的簡(jiǎn)要概述Kalmanfilter目標(biāo)跟蹤算法是當(dāng)前眾多跟蹤算法當(dāng)中使用范圍較廣、使用頻率比較集中的一種跟蹤算法,這一算法最早可以追溯至上個(gè)世紀(jì)六十年代,人們通過將濾波理論與狀態(tài)空間模型相集合,從而得到的一種遞推估計(jì)的算法也就是卡爾曼濾波理論。其通過利用上一時(shí)刻獲取的預(yù)估值以及當(dāng)下獲取的實(shí)際觀測(cè)值,在信號(hào)與噪聲狀態(tài)空間模型當(dāng)中不斷更新狀態(tài)變量,進(jìn)而順利完成估計(jì)預(yù)測(cè)并獲得當(dāng)前時(shí)刻估計(jì)預(yù)測(cè)值。經(jīng)過不斷的發(fā)展,在計(jì)算機(jī)圖像處理以及其他運(yùn)動(dòng)目標(biāo)跟蹤當(dāng)中經(jīng)常會(huì)使用Kalmanfilter算法。如果在k時(shí)刻系統(tǒng)下的狀態(tài)向量用xk表示,那么在t0時(shí)刻下初始化的狀態(tài)預(yù)測(cè)方程為;在tk時(shí)刻下更新系統(tǒng)狀態(tài)的具體方程為,其中Hk、Zk分別表示測(cè)量矩陣m×n維以及轉(zhuǎn)移矩陣n×n維的狀態(tài)向量。但在跟蹤計(jì)算機(jī)視覺運(yùn)動(dòng)目標(biāo)譬如說視頻目標(biāo)時(shí),由于相鄰的兩幀視頻圖像本身時(shí)間間隔非常短,因此目標(biāo)在這一時(shí)間內(nèi)難以發(fā)生明顯的運(yùn)動(dòng)狀態(tài)變化,此時(shí)我們可以通過將此間隔時(shí)間設(shè)定為單位時(shí)間,同時(shí)目標(biāo)在單位時(shí)間內(nèi)一直保持勻速運(yùn)動(dòng)狀態(tài),這時(shí)我們可以得到一個(gè)狀態(tài)轉(zhuǎn)移矩陣且,定義系統(tǒng)觀測(cè)矩陣即為,定義噪聲Wk以及Vk協(xié)方差矩陣則可以分別用和表示。如果在濾波器在經(jīng)過若干次卡爾曼濾波后仍然能夠恢復(fù)至原始狀態(tài),則其具有較好的穩(wěn)定性,但如果在進(jìn)行運(yùn)動(dòng)目標(biāo)跟蹤實(shí)驗(yàn)的過程當(dāng)中,對(duì)于處于運(yùn)動(dòng)狀態(tài)的被跟蹤目標(biāo),一旦出現(xiàn)遮擋行為則將在第一時(shí)間內(nèi)暫停估計(jì)參數(shù),并將這一參數(shù)估計(jì)值直接代入到狀態(tài)方程當(dāng)中,使得運(yùn)動(dòng)目標(biāo)無論是否被遮擋均可以對(duì)其進(jìn)行精確跟蹤。2基于計(jì)算機(jī)視覺的運(yùn)動(dòng)目標(biāo)跟蹤算法2.1建立顏色概率模型顏色囊括了諸多的信息量光柱點(diǎn),尤其是在人類的視覺世界從本質(zhì)上來說也是一種用過感知自然界色彩以及明暗變化的世界,因此人們可以通過使用三基色原理獲得RGB顏色空間??紤]到顏色與計(jì)算機(jī)視覺場(chǎng)景當(dāng)中各個(gè)場(chǎng)景和目標(biāo)之間有著緊密的關(guān)系,同時(shí)不同于目標(biāo)的大小、形態(tài)等其他視覺特征,顏色特征鮮少會(huì)受到包括觀察視角等在內(nèi)各因素的干擾影響,從某種角度上來說基于顏色特征的運(yùn)動(dòng)目標(biāo)具有較好的穩(wěn)定性。為了能夠保障目標(biāo)跟蹤既穩(wěn)定又迅速,需要選擇合適的顏色特征,否則將極有可能導(dǎo)致出現(xiàn)跟蹤失敗。在這一環(huán)節(jié)當(dāng)中人們通常使用的是RGB顏色空間以及HSI顏色空間,但由于二者均具有一定的局限性,因此本文在對(duì)人臉特征尤其是顏色特征進(jìn)行選取時(shí),選擇了rgI顏色直方圖的方法,在解決兩N顏色空間自身缺陷的同時(shí),盡量避免目標(biāo)人臉運(yùn)動(dòng)位置以及尺寸等變化因素對(duì)目標(biāo)追蹤造成的干擾影響。在rgI顏色直方圖當(dāng)中其中R、G、B就是RGB顏色空間當(dāng)中的三原色,r、g、I有著相同的取值范圍即在0到1之間。保持間隔相等的情況下劃分L值即可得到rgI顏色直方圖。雖然rgI顏色直方圖與物體相對(duì)應(yīng),但如果目標(biāo)只是位置以及尺寸等出現(xiàn)變化,rgI顏色直方圖并不會(huì)受到任何實(shí)質(zhì)性影響,因此在理想情況下,利用rgI顏色直方圖能夠?qū)σ曨l圖像中不同運(yùn)動(dòng)位置以及不同尺寸的人臉進(jìn)行目標(biāo)追蹤。2.2跟蹤算法運(yùn)動(dòng)目標(biāo)的不斷變化將會(huì)使得模板圖像隨之發(fā)生相應(yīng)變化,因此需要不斷更新模板圖像才能夠有效完成對(duì)運(yùn)動(dòng)目標(biāo)的連續(xù)跟蹤,本文在對(duì)運(yùn)動(dòng)目標(biāo)的實(shí)際運(yùn)動(dòng)范圍進(jìn)行預(yù)測(cè)過程中選擇使用卡爾曼濾波,之后利用rgI顏色直方圖在預(yù)測(cè)運(yùn)動(dòng)范圍之內(nèi)搜索和匹配相應(yīng)目標(biāo),從而通過此舉獲得與目標(biāo)模板有著最小歐式距離的區(qū)域,在此過程當(dāng)中存在一個(gè)特定閾值T,如果兩者的歐氏距離在進(jìn)行相減時(shí)差值沒有超過這個(gè)特定閾值,那么此時(shí)該區(qū)域就是運(yùn)動(dòng)目標(biāo)所在的實(shí)際位置,利用在這一區(qū)域當(dāng)中的rgI顏色直方圖并將其充當(dāng)下一幀運(yùn)動(dòng)目標(biāo)的匹配模板,在不斷重復(fù)的過程中模板能夠?qū)崿F(xiàn)不間斷地更新。由于相鄰的兩幀視頻圖像之間,時(shí)間間隔并不長,因此目標(biāo)人臉在極短的時(shí)間間隔當(dāng)中基本上不會(huì)出現(xiàn)突然變化,此時(shí)我們可以認(rèn)為運(yùn)動(dòng)目標(biāo)人臉的運(yùn)動(dòng)連續(xù)性比較強(qiáng),此時(shí)利用公式可以進(jìn)行歐式距離的計(jì)算并用以衡量匹配的模板。其中匹配區(qū)域和模板的rgI顏色直方圖分別用l和l'表示,而rgI顏色直方圖中的維數(shù)則用n進(jìn)行表示。根據(jù)相關(guān)視頻圖像顯示,通過不斷更新模板確實(shí)可以對(duì)目標(biāo)運(yùn)動(dòng)人臉進(jìn)行實(shí)時(shí)跟蹤顯示。3結(jié)束語總而言之,本文通過選擇當(dāng)前比較常見的目標(biāo)跟蹤算法即Kalmanfilter算法,利用卡爾曼濾波以及rgI顏色直方圖完成對(duì)運(yùn)動(dòng)人臉的跟蹤。事實(shí)證明,Kalmanfilter算法確實(shí)能夠在對(duì)各目標(biāo)之間的干擾進(jìn)行明確區(qū)分的基礎(chǔ)之上,準(zhǔn)確描述運(yùn)動(dòng)人臉目標(biāo),從而較好地跟蹤運(yùn)動(dòng)目標(biāo),但由于人臉之間本身存在一定的相似性,因此本文只是對(duì)理想狀態(tài)下的運(yùn)動(dòng)人臉進(jìn)行跟蹤實(shí)驗(yàn),日后還需要對(duì)計(jì)算機(jī)視覺技術(shù)和Kalmanfilter算法進(jìn)行進(jìn)一步優(yōu)化以妥善解決多人臉目標(biāo)以及相似性問題。
篇九:計(jì)算機(jī)視覺論文:基于計(jì)算機(jī)視覺的室內(nèi)自主移動(dòng)機(jī)器人導(dǎo)航綜述摘要:計(jì)算機(jī)視覺在人工智能學(xué)科占據(jù)重要地位,為自主移動(dòng)機(jī)器人視覺導(dǎo)航做了深厚的理論鋪墊?;谟?jì)算機(jī)視覺的自主導(dǎo)航與路徑規(guī)劃是自主移動(dòng)機(jī)器人研究的關(guān)鍵技術(shù),計(jì)算機(jī)視覺室內(nèi)導(dǎo)航技術(shù)主要分為3類:第一類是環(huán)境地圖事先已知;第二類是同時(shí)定位與地圖構(gòu)建(simultaneouslocalizationandmapping,SLAM);第三類是不依賴環(huán)境地圖。詳細(xì)闡述了每種導(dǎo)航模型和技術(shù)方法,探討了基于計(jì)算機(jī)視覺導(dǎo)航的最新技術(shù)進(jìn)展,總結(jié)了目前國內(nèi)外計(jì)算機(jī)視覺導(dǎo)航的研究進(jìn)展。關(guān)鍵詞:計(jì)算機(jī)視覺;地圖匹配;SLAM;機(jī)器人導(dǎo)航;路徑規(guī)劃1概述計(jì)算機(jī)視覺在人工智能學(xué)科占據(jù)重要地位,為自主移動(dòng)機(jī)器人視覺導(dǎo)航做了深厚的理論鋪墊。目前,機(jī)器人導(dǎo)航技術(shù)有很多種,傳感器導(dǎo)航技術(shù)如里程計(jì)、激光雷達(dá)、超聲波、紅外線、微波雷達(dá)、陀螺儀、指南針、速度、加速度計(jì)或觸覺等得到了普遍應(yīng)用,與上述非計(jì)算機(jī)視覺導(dǎo)航技術(shù)相比較,計(jì)算機(jī)視覺導(dǎo)航技術(shù)如人眼般具有靈敏度高且可捕獲的信息量大以及成本低等優(yōu)點(diǎn)。由于室內(nèi)相對(duì)室外空間比較狹小且內(nèi)部環(huán)境復(fù)雜,所以普通移動(dòng)機(jī)器人在作業(yè)過程中,完成躲避眼前障礙物、自主導(dǎo)航以及為自身找出一條可行路徑等一系列操作會(huì)相對(duì)比較困難。計(jì)算機(jī)視覺導(dǎo)航技術(shù)可利用本身的攝像頭獲得室內(nèi)周圍的環(huán)境信息,實(shí)時(shí)對(duì)其周身的場(chǎng)景進(jìn)行快速反饋,對(duì)視野前方障礙物進(jìn)行快速識(shí)別和檢測(cè),從而確定一條高效的可行的安全路徑。本文對(duì)計(jì)算機(jī)視覺導(dǎo)航技術(shù)進(jìn)行分類研究,主要分為3類:第一類是環(huán)境地圖事先已知,提前對(duì)外界環(huán)境特征進(jìn)行提取和處理,建立全局地圖,并將地圖信息存儲(chǔ)在機(jī)器人內(nèi)存數(shù)據(jù)庫中,在導(dǎo)航的時(shí)候?qū)崟r(shí)進(jìn)行地圖匹配;第二類是同時(shí)定位與地圖構(gòu)建,移動(dòng)機(jī)器人在自身位置不確定的情況下根據(jù)自身的攝像頭獲取周圍未知環(huán)境信息,在作業(yè)時(shí)逐步構(gòu)建周圍的環(huán)境地圖,根據(jù)構(gòu)建的增量式地圖自主實(shí)時(shí)定位和導(dǎo)航;第三類是不依賴環(huán)境地圖,自主移動(dòng)機(jī)器人不需要依賴任何的環(huán)境地圖,其在作業(yè)活動(dòng)時(shí)的可行區(qū)域主要取決于攝像頭實(shí)時(shí)識(shí)別和檢測(cè)的環(huán)境相對(duì)信息。2環(huán)境地圖的表示方法目前,計(jì)算機(jī)視覺導(dǎo)航技術(shù)多采用柵格地圖、幾何地圖、拓?fù)涞貓D和混合地圖構(gòu)建環(huán)境地圖信息。2.1柵格地圖柵格地圖,將柵格圖像考慮為一矩形,均分為一系列柵格單元,將每個(gè)柵格單元賦予一個(gè)平均概率值,并利用傳感信息估計(jì)每個(gè)單元內(nèi)部?jī)?nèi)存障礙物的概率。構(gòu)建柵格地圖的優(yōu)點(diǎn)是其地圖表達(dá)形式直觀,創(chuàng)建和維護(hù)比較容易;但當(dāng)劃分的柵格單元數(shù)量不斷增多時(shí),實(shí)時(shí)性就會(huì)慢慢變差;當(dāng)劃分的柵格單元越大時(shí),環(huán)境地圖的分辨率越低。2.2幾何地圖幾何地圖利用幾何特征如點(diǎn)、直線、平面等來構(gòu)成環(huán)境主要框架,需要知道這些特征在環(huán)境中信息的具體位置,所以幾何地圖通常使用其對(duì)應(yīng)的三維空間坐標(biāo)來表示。幾何地圖構(gòu)建過程相對(duì)簡(jiǎn)單,保留了室內(nèi)環(huán)境的各種重要信息,是基于計(jì)算機(jī)視覺的定位與地圖構(gòu)建算法中最常用的一種表示方式。但是為了完成環(huán)境的建模需要標(biāo)記大量的特征,從而計(jì)算量也非常的大,降低了實(shí)時(shí)性,其重建的地圖也容易出現(xiàn)與全局不一致的情況。2.3拓?fù)涞貓D拓?fù)涞貓D用許多節(jié)點(diǎn)和連接這些節(jié)點(diǎn)的曲線來表示環(huán)境信息。其中,每個(gè)節(jié)點(diǎn)相對(duì)應(yīng)真實(shí)環(huán)境中的特征點(diǎn)(如門角、窗戶、椅子、桌子角及拐角等),而節(jié)點(diǎn)之間的曲線表示兩個(gè)節(jié)點(diǎn)對(duì)應(yīng)的地點(diǎn)是相聯(lián)通的。拓?fù)涞貓D把環(huán)境信息表上在一線圖上,不需要精確表示不同節(jié)點(diǎn)間的地理位置關(guān)系,圖像較為抽象,表示起來方便且簡(jiǎn)單。機(jī)器人首先識(shí)別這些節(jié)點(diǎn)進(jìn)而根據(jù)識(shí)別的節(jié)點(diǎn)選擇節(jié)點(diǎn)與節(jié)點(diǎn)間的曲線作為可作業(yè)的路徑。2.4混合地圖混合地圖主要包括3種形式:柵格一幾何地圖、幾何一拓?fù)涞貓D以及柵格一拓?fù)涞貓D?;旌系貓D采用多種地圖表示,可結(jié)合多種地圖的優(yōu)勢(shì),與單一的地圖表示相比更具有靈活性、準(zhǔn)確性和魯棒性,但其不同類別的地圖結(jié)合起來管理會(huì)比較復(fù)雜,難以協(xié)調(diào),增加了地圖構(gòu)建的難度。文獻(xiàn)針對(duì)室內(nèi)環(huán)境所建立的模型分為全局拓?fù)浜途植繋缀伪硎霾糠?,整體環(huán)境通過拓?fù)涔?jié)點(diǎn)串連起來,維護(hù)了整體環(huán)境表述的全局一致性;而以每個(gè)拓?fù)涔?jié)點(diǎn)為核心所采用的幾何表述則可確保局部精確定位的實(shí)現(xiàn),這樣建立的幾何一拓?fù)浠旌檄h(huán)境模型可將二者的優(yōu)勢(shì)都表現(xiàn)出來,使得移動(dòng)機(jī)器人定位和地圖構(gòu)建同時(shí)進(jìn)行,實(shí)現(xiàn)容易。3基于計(jì)算機(jī)視覺的室內(nèi)導(dǎo)航基于計(jì)算機(jī)視覺的室內(nèi)導(dǎo)航技術(shù)可利用攝像頭捕獲機(jī)器人周圍環(huán)境的全部信息,對(duì)其周身的場(chǎng)景進(jìn)行反饋,對(duì)障礙物進(jìn)行快速識(shí)別和檢測(cè),從而確定一條高效的可行的安全路徑。本文將計(jì)算機(jī)視覺室內(nèi)導(dǎo)航技術(shù)主要分為3類:第一類是環(huán)境地圖事先已知;第二類是定位與地圖構(gòu)建同時(shí)進(jìn)行;第三類是不依賴環(huán)境地圖。3.1環(huán)境地圖事先已知提前對(duì)外界環(huán)境特征進(jìn)行提取和處理,建立全局地圖,并將地圖信息存儲(chǔ)在機(jī)器人內(nèi)存數(shù)據(jù)庫中,在導(dǎo)航的時(shí)候?qū)崟r(shí)進(jìn)行地圖匹配,即預(yù)存環(huán)境地圖。在環(huán)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度有機(jī)肥料生產(chǎn)與銷售風(fēng)險(xiǎn)控制合作協(xié)議2篇
- 2025年度體育場(chǎng)館建設(shè)承包合同范本4篇
- 2025年度新能源汽車充電樁租賃合同書3篇
- 2024綠化項(xiàng)目勞務(wù)施工分包合同書版B版
- 2025年絕緣筒項(xiàng)目可行性研究報(bào)告
- 2025年模特選美賽事形象權(quán)保護(hù)與保密合同范本3篇
- 螺旋式除塵器行業(yè)市場(chǎng)發(fā)展及發(fā)展趨勢(shì)與投資戰(zhàn)略研究報(bào)告
- 2025年度個(gè)人留學(xué)貸款擔(dān)保合同范本12篇
- 2025年度室內(nèi)外景觀設(shè)計(jì)及施工合同樣本4篇
- 2025年度藝術(shù)品抵押借款咨詢合同范本3篇
- 2022年湖北省武漢市中考數(shù)學(xué)試卷含解析
- TLFSA 003-2020 危害分析與關(guān)鍵控制點(diǎn)(HACCP)體系調(diào)味面制品生產(chǎn)企業(yè)要求
- LY/T 2244.3-2014自然保護(hù)區(qū)保護(hù)成效評(píng)估技術(shù)導(dǎo)則第3部分:景觀保護(hù)
- 紀(jì)律教育月批評(píng)與自我批評(píng)五篇
- GB/T 26480-2011閥門的檢驗(yàn)和試驗(yàn)
- GB/T 13342-2007船用往復(fù)式液壓缸通用技術(shù)條件
- 藥店員工教育培訓(xùn)資料
- GB 20371-2016食品安全國家標(biāo)準(zhǔn)食品加工用植物蛋白
- 【英語手寫體】26英文字母手寫體描紅書寫字帖
- 實(shí)習(xí)護(hù)生壓瘡相關(guān)知識(shí)掌握情況及預(yù)防態(tài)度的調(diào)查問卷
- 《駱駝祥子》第(9、10、11、12)章檢測(cè)題
評(píng)論
0/150
提交評(píng)論