版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
工程圖紙識別技術(shù)研究
發(fā)展?fàn)顩r匯報
1工程圖紙識別技術(shù)研究
發(fā)展?fàn)顩r匯報
報告內(nèi)容研究意義發(fā)展現(xiàn)狀基本技術(shù)問題現(xiàn)有技術(shù)手段未來可能的著力點(diǎn)2報告內(nèi)容研究意義2研究意義工程圖是工程技術(shù)人員描述設(shè)計(jì)的對象、表達(dá)設(shè)計(jì)思想的主要工具?,F(xiàn)有的工程圖紙是長期以來人類智慧和勞動成果的結(jié)晶,據(jù)國際數(shù)據(jù)與文檔管理雜志估計(jì),在全世界現(xiàn)有的80億張工程圖紙中,超過85%以上是人工繪制的。但是,現(xiàn)在工程圖紙繪制的技術(shù)主要是使用計(jì)算機(jī)來進(jìn)行繪制,使用CAD技術(shù)。3研究意義工程圖是工程技術(shù)人員描述設(shè)計(jì)的對象
在大多數(shù)領(lǐng)域,成功使用過的工程圖紙就是一種寶貴的技術(shù)儲備資源,除了應(yīng)用于當(dāng)時工程的指導(dǎo),也是以后對產(chǎn)品進(jìn)行再設(shè)計(jì)、維護(hù),以及對于提高產(chǎn)品設(shè)計(jì)質(zhì)量、降低設(shè)計(jì)成本及縮短產(chǎn)品設(shè)計(jì)周期具有不可估量的作用。CAD技術(shù)可以極大地提高圖紙的生產(chǎn)和使用效率,當(dāng)我們想像使用CAD技術(shù)那樣來高效地利用以前的手繪圖紙時,這中間需要一個轉(zhuǎn)化技術(shù),以及一些更加智能的幫助[1]。4在大多數(shù)領(lǐng)域,成功使用過的工程圖紙就是一種寶貴發(fā)展現(xiàn)狀從80年代中期起,很多工業(yè)發(fā)達(dá)國家就開始著手圖紙輸入這一工作。起初方法是應(yīng)用某種CAD系統(tǒng)通過人機(jī)交互重畫一遍所有的藍(lán)圖,這樣可以使得圖面美觀統(tǒng)一,尺寸比例準(zhǔn)確。但是這種方法效率很低,繪制價格昂貴,工作既繁瑣又枯燥無味,造成人力物力資源的浪費(fèi)。5發(fā)展現(xiàn)狀從80年代中期起,很多工業(yè)發(fā)達(dá)國家就開近若干年來,CAD技術(shù)在工程設(shè)計(jì)領(lǐng)域得到普及性應(yīng)用,從而使工程圖紙矢量化技術(shù)的研究進(jìn)入高潮。目前國外己經(jīng)出現(xiàn)了一些商品化的矢量化軟件,比較著名的有德國Softelec公司的VPStudio/VPRasterPro,Able公司的R2V,挪威Rasterex公司的RxAutolmagePro2000,,華中科技大學(xué)的EDIS軟件、清華大學(xué)的ANNO等。這些軟件在一定程度上可以進(jìn)行圖紙的矢量化,但是它們通常都是針對某種專業(yè)圖紙,如機(jī)械圖紙、電子圖紙或地圖等,而且矢量化的準(zhǔn)確率也不是很高,例如對于交叉點(diǎn)多而復(fù)雜的圖紙,軟件自動跟蹤時可能會出現(xiàn)錯誤走向。6近若干年來,CAD技術(shù)在工程設(shè)計(jì)領(lǐng)域得到普及性基本問題圖像獲取與處理圖紙圖像的矢量化基本圖元和文字符號的識別工程圖形的2D理解面向工程圖形的二維重建7基本問題圖像獲取與處理7工程圖紙識別的基本過程預(yù)處理矢量化圖文分離圖形識別圖形重建8工程圖紙識別的基本過程預(yù)處理矢量化圖文分離圖形識別圖形重建8圖像的獲取與預(yù)處理由于工程圖紙一般較大,所以大多數(shù)情況下使用掃描儀掃描工程圖紙,最后將位圖格式的文件保存到計(jì)算機(jī)中。圖像預(yù)處理的質(zhì)量直接影響到后續(xù)工作,但在這個領(lǐng)域,技術(shù)相對成熟,根據(jù)工程圖紙的特性主要用到的圖像處理技術(shù)是消藍(lán)處理(濾色)、圖像去噪,邊緣提取。9圖像的獲取與預(yù)處理由于工程圖紙一般較大,所以大多數(shù)情況由于工程圖紙?jiān)诖娣诺倪^程中容易產(chǎn)生褶皺等損壞,圖紙上難免會出現(xiàn)一些非繪制的圖像元素,使用高斯濾波,中值濾波,以及數(shù)學(xué)形態(tài)學(xué)的方法都可以在一定程度上消除噪聲,改善圖像質(zhì)量。由于工程圖紙的特性,在矢量化之前,經(jīng)過邊緣提取處理的圖像最接近于矢量圖,也最容易進(jìn)行矢量化處理。這里實(shí)用的方法主要有Canny、Sobel、數(shù)學(xué)形態(tài)學(xué)、頻域變換(傅里葉、小波等)等方法進(jìn)行處理[2]。10由于工程圖紙?jiān)诖娣诺倪^程中容易產(chǎn)生褶皺等損壞,圖紙上難免會出圖紙圖像的矢量化[3]基于細(xì)化的矢量化方法基于輪廓匹配的矢量化方法基于鄰接圖的矢量化方法正交方向搜索法11圖紙圖像的矢量化[3]基于細(xì)化的矢量化方法11
智能算法在控制工程領(lǐng)域中有比較成功的應(yīng)用如模糊控制、遺傳算法、人工神經(jīng)網(wǎng)絡(luò)等,表現(xiàn)出非常好的魯棒性、自適應(yīng)性以及靈活的可擴(kuò)展性。在矢量化的過程中可以處理較復(fù)雜的情況。
模擬人工讀圖的的方式來進(jìn)行矢量化的過程可以使機(jī)器具備一些“常識”,先從整體上把握圖紙的宏觀特征然后由粗到細(xì)由拓?fù)浣Y(jié)構(gòu)到具體線型準(zhǔn)確有效地把握圖紙中各類線型之間的相互關(guān)系直接從圖像中提取出各類圖元[4]。12智能算法在控制工程領(lǐng)域中有比較成功的應(yīng)用如模糊控制圖文分離技術(shù)
圖形雖然是工程圖紙中最為重要的信息,但是如果缺少了一些必要的文字描述,工程圖也將變成不可理解的圖像,也無法用于工程指導(dǎo)。這其中主要有圖源,圖紙類型標(biāo)注,作者,尺寸標(biāo)注,材料標(biāo)注等。這些文字描述,對于快速使用工程圖紙進(jìn)行生產(chǎn)、修改、產(chǎn)品維護(hù)、查詢等起著至關(guān)重要的作用。工程圖紙自動化識別中有必要使用OCT技術(shù)將工程圖標(biāo)的信息提取出來[5]。13圖文分離技術(shù)圖形雖然是工程圖紙中最為重要的信息,但是工程圖形2D重建圖形經(jīng)矢量化處理后,圖素的尺寸和圖素間的拓?fù)潢P(guān)系都會產(chǎn)生一定誤差,為了使識別結(jié)果與各種CAD軟件繪制圖形的效果相近,提出對矢量圖實(shí)施“二維重構(gòu)”。包括兩部分[6]:
圖形結(jié)構(gòu)拓?fù)湫U龍D形輪廓的精確尺寸校正14工程圖形2D重建圖形經(jīng)矢量化處理后,圖素的尺
工程圖紙二維重建的前提是基本圖形元素的識別,基本可以分為兩大類[7][8][9][10]:基于統(tǒng)計(jì)的方法和基于知識表示的方法。
大多數(shù)基于統(tǒng)計(jì)的識別方法,圖形對象的特性是被事先定義的,然后設(shè)計(jì)一個使用邊界判定的分類器來進(jìn)行空間特性的決策。最典型的是模版匹配方法。
基于知識的識別方法,是將圖形對象表示為一些知識,比如規(guī)則或語法,依此來對圖形對象識別。對具代表性的是知識結(jié)構(gòu)表示與推理和知識語法的方法。15工程圖紙二維重建的前提是基本圖形元素的識別,基本圖素的拓?fù)漕愋椭本€圖素與其他類型的拓?fù)潢P(guān)系圓弧圖素與其他類型的拓?fù)潢P(guān)系
根據(jù)現(xiàn)有的兩大類識別方法,以及工程圖紙本身拓?fù)潢P(guān)系約束的特點(diǎn)。統(tǒng)計(jì)類識別方法較適合用于數(shù)目多,結(jié)構(gòu)簡單的工程圖識別。知識表示方法,由于知識推理方便,易于表達(dá)拓?fù)浼s束關(guān)系,在圖形對象多而復(fù)雜的情況下較適合。16圖素的拓?fù)漕愋椭本€圖素與其他類型的拓?fù)潢P(guān)系16
圖形拓?fù)潢P(guān)系表示的中不乏有各種新意的表示方法,但是使用最多也是最有效的表示方式就是使用圖。
工程圖紙本身就是一張圖,而且圖紙當(dāng)中很多的圖形基元或整體相對于基本圖元(直線、圓弧、圓、工程標(biāo)注符號)就類似于一張有著很強(qiáng)拓?fù)潢P(guān)系的圖。所以用圖來表示工程圖紙中的基本圖元是目前最流行的表示方法。而且在CAD繪圖中,基本的繪制操作(除了圖元的修改)都非常類似于對圖這種數(shù)據(jù)結(jié)構(gòu)的操作。17 圖形拓?fù)潢P(guān)系表示的中不乏有各種新意的表示方法,但
將工程圖中的每個圖素作為“圖”的頂點(diǎn),兩個頂點(diǎn)之間的關(guān)系可用弧來表示,屠蘇見的拓?fù)潢P(guān)系用權(quán)值來表示,將其數(shù)值化。根據(jù)事先定義的圖素間關(guān)系來選擇有向圖或無向圖。
圖的儲存一般使用鄰接表[6]。
18將工程圖中的每個圖素作為“圖”的頂點(diǎn),兩個頂點(diǎn)之間的
圖素的拓?fù)潢P(guān)系表示模型是一種動態(tài)表示模型,一般對該模型進(jìn)行如下操作[6]:
添加結(jié)點(diǎn):圖素增加,添加結(jié)點(diǎn),并添加該節(jié)點(diǎn)所對應(yīng)的關(guān)系。
刪除結(jié)點(diǎn):圖素被刪除,減少結(jié)點(diǎn),并在與其有拓?fù)潢P(guān)系的表中刪除該結(jié)點(diǎn)。
查詢:在帶權(quán)圖的中找到該圖素對應(yīng)的結(jié)點(diǎn),并提取該節(jié)點(diǎn)對應(yīng)的鄰接表。
結(jié)點(diǎn)拓?fù)潢P(guān)系修改:當(dāng)拓?fù)潢P(guān)系變動時,對圖素結(jié)點(diǎn)的鄰接表重寫,及向與改圖素有拓?fù)潢P(guān)系的其他圖素的鄰接表中添加該圖素結(jié)點(diǎn)。19圖素的拓?fù)潢P(guān)系表示模型是一種動態(tài)表示模型,一般對該模拓?fù)湫U幚?/p>
有了前面拓?fù)潢P(guān)系的正確表示,依據(jù)識別結(jié)果,對圖形對象進(jìn)行矯正[6]。主要方法有:
剪切和延伸平移和擴(kuò)展歸并20拓?fù)湫U幚碛辛饲懊嫱負(fù)潢P(guān)系的正確表示,依據(jù)識別結(jié)果尺寸校正處理[6]
這一階段的前提也是正確識別尺寸標(biāo)注線。在工程圖紙中的尺寸有各種類型,如水平尺寸,斜向尺寸,直徑尺寸,角度尺寸。尺寸標(biāo)注的結(jié)構(gòu)相對簡單,都是矢量箭頭和表示尺寸的字符組成,同時很多情況下,尺寸標(biāo)注,尤其是長度的表示,有很強(qiáng)的層次關(guān)系。所以可以采用樹類數(shù)據(jù)結(jié)構(gòu)來保存。每個方向的尺寸可以構(gòu)成一顆樹,所有方向的樹可以構(gòu)成森林。從而解決不同視圖間尺寸表達(dá)一致的的問題21尺寸校正處理[6] 這一階段的前提也是正確識別尺寸標(biāo)注線。2
樹的根節(jié)點(diǎn)為與根節(jié)點(diǎn)相連的葉子節(jié)點(diǎn)的尺寸基準(zhǔn),樹的每個節(jié)點(diǎn)都以他的父節(jié)點(diǎn)的一個尺寸界線作為它的基準(zhǔn)。校正時,都是以基準(zhǔn)所在的一段為固定端,而一零一段為活動端,保持固定端不動,校正活動端到相應(yīng)的位置。
其中主要過程有生成尺寸樹,確定約束域,定義約束屬關(guān)系,圖形元素及尺寸標(biāo)注的精確位置校正。22樹的根節(jié)點(diǎn)為與根節(jié)點(diǎn)相連的葉子節(jié)點(diǎn)的尺寸基準(zhǔn),樹的每相關(guān)工作1[11]
來自印度的學(xué)者SekharMandal采用了比較系統(tǒng)的圖像處理方法
來進(jìn)行工程圖紙的重建
,具體流程如下:1.使用OCR類軟件將圖中所有字符探測出,進(jìn)行圖文分離工作。
2.使用Canny邊緣提取算法,將光柵圖中所有的輪廓表示出來,二值化處理之后就將整幅圖的骨架細(xì)化出來。
23相關(guān)工作1[11]來自印度的學(xué)者SekharMand3.采用數(shù)學(xué)形態(tài)學(xué)中的開啟運(yùn)算來提取特定方向的的圖形元素;采用1×4的結(jié)構(gòu)元素來提取水平線段,4×1的結(jié)構(gòu)元素來提取垂直線段
用原圖將提取出來的兩幅圖減掉,就可以得到其他任意方向上的線段和弧線。4.采用鏈?zhǔn)酱a(行程編碼)的方式將圖中的所有點(diǎn)陣圖表示出來,使用和弦特性將圖中所有的直線判斷出而且所有的弧線被當(dāng)成是多個小線段組成,記錄線段的拐點(diǎn)。提取后的水平線段提取后的垂直線段243.采用數(shù)學(xué)形態(tài)學(xué)中的開啟運(yùn)算來提取特定方向的的圖形5.利用鏈?zhǔn)酱a信息來構(gòu)建矢量格式圖。然后,根據(jù)兩線段之間相間距離的關(guān)系來判斷兩條直線是否屬于原來同一直線的兩條邊緣,設(shè)定閾值進(jìn)行判斷
如果兩條直線滿足閾值限定,就將兩條線段間的部分進(jìn)行填充,從而進(jìn)行矢量圖的重建。重構(gòu)圖形的閾值化判定過程以及重構(gòu)線寬信息255.利用鏈?zhǔn)酱a信息來構(gòu)建矢量格式圖。然后,根據(jù)兩線段相關(guān)工作2.1[7][8][9]
識別領(lǐng)域比較有代表性的工作就是香港城市大學(xué)——劉文印使用基于知識表示的識別方法。
首先,在預(yù)處理階段,使用開源軟件Res2Vec進(jìn)行矢量化,然后使用閾值去噪的方法清除被判斷為噪聲的小短線。
其次,定義了四種拓?fù)潢P(guān)系,分別為直線的相交、平行、垂直(不相交)以及弧線與直線;分別都有精確量化了的參數(shù)來表示。26相關(guān)工作2.1[7][8][9]識別領(lǐng)域比較有代表性再次,提出了一種屬性樹的知識表示方法;同時,提出了KAA(KnowledgeAcquisitionAlgorithm)——用于知識提取與表示和KGRA(KnowledgeGraphRecognitionAlgorithm)用于知識推理與識別。KAA的基本流程如下:27再次,提出了一種屬性樹的知識表示方法;同時,提出了KAA(KKAA算法描述:輸入:組成圖形對象的向量集(用戶提供的示例)。輸出:圖形化知識(一顆儲存著每兩個結(jié)點(diǎn)間的幾何約束關(guān)系和訪問順序的樹)流程:1.提取所有的相交幾何約束關(guān)系同時構(gòu)造屬性樹G(V,E);2.如果G是連通的,轉(zhuǎn)到第6步;3.將G分割成G1,G2,G3……
Gn顆連通的子樹;4.搜尋節(jié)點(diǎn)間可以將字?jǐn)?shù)連接起來的平行和垂直關(guān)系;5.如果上述關(guān)系找到了就將它們加入G,同時轉(zhuǎn)到第2步,否則停止(F)。6.加入弧線和圓的拓?fù)潢P(guān)系到圖中;7.在G的基礎(chǔ)上構(gòu)造生成樹ST,用廣度優(yōu)先的原則遍歷ST,獲取約束順序K(c1,c2……cn);8.停止(S),同時將G和K作為這種對象的知識儲存到知識庫中。28KAA算法描述:28
由于在識別過程中不可能將向量和已有的知識表示100%的匹配,所以定義了關(guān)于直線和直線,弧線和弧線以及由直線構(gòu)成的類弧線之間的相似因子的定義。KGRA算法描述如下:輸入:SV:向量集(構(gòu)成待識別對象的向量集)KD:知識庫TL:閾值集,其中包含了長度和數(shù)量的容忍范圍變量:CT:識別過程中臨時構(gòu)造的的樹SM:標(biāo)識集(用來標(biāo)識識別過程中被使用過的向量)輸出:RR:識別結(jié)果——用SV來表示的圖形對象的類型。29由于在識別過程中不可能將向量和已有的知識表示100%算法過程:1.從KD當(dāng)中選擇知識樹K,如果所有的知識都已經(jīng)試驗(yàn)過就停止(F)2.清空CT,初始化SM3.從SV中選擇下一個向量V,要求這個V實(shí)在沒有在SM中被標(biāo)注的。加入V到CT中作為根;同時,將V在SM中標(biāo)注,表示V已經(jīng)在識別過程中使用過了。4.從遍歷順序K中選擇下一條邊E。如果所有的邊已經(jīng)被訪問過了,而且冗余向量的個數(shù)沒有超過容忍限度,就停止(S),同時將RR標(biāo)示為由當(dāng)前K來指示的對象類型5.否則,將V標(biāo)記為以E為邊的父節(jié)點(diǎn),使用V和E來計(jì)算V’6.搜尋V”,在空間上沿著兩個方向搜尋,使用TL中的容忍限度來檢測在SV中與V’相似的向量。7.如果V”找到了,就將它設(shè)為CT中V的子節(jié)點(diǎn),在SM中將V”標(biāo)記為已使用過,同時轉(zhuǎn)到第4步8.如果沒有找到V”,而且向量的缺損數(shù)量超過了容忍的范圍,就轉(zhuǎn)到第1步,否則轉(zhuǎn)到第4步30算法過程:30
由于目前完全由計(jì)算機(jī)進(jìn)行識別還不能達(dá)到較高的精度和理想的理解結(jié)果,往往在經(jīng)過一些幾何變換(尺寸、方向、圖層交疊等)之后,就不能得出很好地識別結(jié)果。這時需要用戶交互的來審查正確、錯誤、遺漏這樣的識別結(jié)果。給出新的指導(dǎo)來引導(dǎo)知識庫的更新;知識庫的更新,最直接的體現(xiàn)就是對其中閾值庫(或容忍庫)中關(guān)于長度、角度、向量個數(shù)的閾值范圍進(jìn)行動態(tài)的調(diào)整。在用戶給與反饋之后系統(tǒng)將根據(jù),正確識別保持原有閾值,遺漏識別更新閾值,錯誤識別被忽略掉的原則進(jìn)行閾值調(diào)整。這樣就是整個系統(tǒng)形成一個閉環(huán)反饋來提高系統(tǒng)性能。31由于目前完全由計(jì)算機(jī)進(jìn)行識別還不能達(dá)到較高的精度和理相關(guān)工作2.2[10]
清華大學(xué)的——郭田田,在劉文印工作的基礎(chǔ)上進(jìn)行了進(jìn)一步的發(fā)展[16]。主要創(chuàng)新點(diǎn)如下:1.把注釋作為一種新的基本圖素,由此主要圖素分為三大類:直線、弧線和文本;并且由此定義了五種拓?fù)潢P(guān)系:直線相交、直線平行、直線與圓弧、直線與文本、圓弧與文本。2.在知識提取和識別的階段都設(shè)置了優(yōu)先級,優(yōu)先級概念的引入提高了知識提取和識別的效率。在知識提取階段,按照統(tǒng)計(jì)數(shù)據(jù)顯示,按照直線相交-直線平行-直線與圓弧-直線與文本-圓弧與文本這樣由高到低的優(yōu)先級來提取拓?fù)潢P(guān)系,這樣可以節(jié)約大量的計(jì)算時間。知識提取過程與劉文印相似。32相關(guān)工作2.2[10]清華大學(xué)的——郭田田,在劉文印
識別的過程中,基本思路和劉文印非常相似,但是應(yīng)用了優(yōu)先級的概念,可以提高識別效率。作者認(rèn)為,一個圖形對象如果特征越明顯,由于其差別大,所以在統(tǒng)計(jì)上的特性就是分布的比較少,所以在識別階段,搜尋基本圖素的優(yōu)先級就由統(tǒng)計(jì)分布特性少到多,優(yōu)先級由高到低。
這樣,首先開始搜尋特征明顯的部分,如果在沒有用到優(yōu)先級最低的一級就可以將目標(biāo)識別出來,就可以節(jié)省大量的計(jì)算時間,同時也在一定程度上降低了搜尋目標(biāo)時的復(fù)雜度。在本文中識別過程的優(yōu)先級正好和知識提取階段相反:文本與圓弧-文本與直線-弧線與直線-直線平行-直線相交的順序又高到低進(jìn)行探測。33識別的過程中,基本思路和劉文印非常相似,但是應(yīng)用了優(yōu)3.重復(fù)模式的預(yù)處理
在工程師繪圖的過程中,在規(guī)范允許的范圍內(nèi),不用的繪圖工程師可能會有不同的繪制風(fēng)格,相同的事物在人看來被歸為一類,而對于對一切認(rèn)知事物都精確表示的機(jī)器來說就被歸到不同的分類,例如:
以上兩幅圖都代表樓梯,但是由于在樓梯的表示中平行的線條樹木不一樣,在機(jī)器看來就是分為兩類,由此我們可以想到,重復(fù)模式的表示盡管符合規(guī)范,但是會導(dǎo)致大量識別結(jié)果的冗余分類。所以作者將重復(fù)模式處理為實(shí)際關(guān)系塊:在實(shí)際關(guān)系塊的處理中,只保留第一個和最后一個圖素的拓?fù)潢P(guān)系,來代表所包含的塊中的表現(xiàn)形式。從而使識別過程具有一定的智能性。343.重復(fù)模式的預(yù)處理34相關(guān)工作3[12][13]
南京大學(xué)——路通,使用約束網(wǎng)絡(luò)來進(jìn)行識別。其主要特色有:1.使用了更加精確地特征表示方法,初步的有定義了CGF(CommonGraphicsFeature),其中有基本圖素、屬性、關(guān)系、優(yōu)先級、閾值范圍這5個屬性來描述一個圖形對象。為了提高識別效果和體現(xiàn)出大類與小類的層次關(guān)系,在CGF的基礎(chǔ)之上定義了定義了靜態(tài)特性,其中包括:積極特性、消極特性、輔助特性和關(guān)系。前三個特性都是CGF集,關(guān)系描述的就是這三個集中兩兩之間的關(guān)系。作者同樣采用了優(yōu)先級策略來對識別匹配過程中的候選特性進(jìn)行排序,表示為文本-圓-弧-直線這樣由高到低的優(yōu)先級。2.用戶初始化系統(tǒng)階段對將要識別的工程圖設(shè)定領(lǐng)域知識背景。在作者看來,由于規(guī)范不同沒有一種規(guī)則是所有工程圖紙之間共有的,所以指定領(lǐng)域知識可以將識別率提高。35相關(guān)工作3[12][13]南京大學(xué)——路通,使用約束3.表述拓?fù)潢P(guān)系時,作者使用字符號表示,其間可以使用+、!、>、&、|、(等計(jì)算機(jī)運(yùn)算符號進(jìn)行連接,這樣,規(guī)則都是以字符串的型式表現(xiàn)的。到了識別的時候,就會轉(zhuǎn)化稱約束網(wǎng)絡(luò),進(jìn)行逐步的測試
約束網(wǎng)絡(luò)中每個節(jié)點(diǎn)都是根據(jù)約束條件建立的測試函數(shù),每個節(jié)點(diǎn)得到的測試結(jié)果是一個布爾值。4.建立一個指明領(lǐng)域的規(guī)則庫,規(guī)則庫在識別的過程中動態(tài)的調(diào)整規(guī)則構(gòu)成、規(guī)則候選排序、自動閾值調(diào)節(jié);而且,將人機(jī)互動的調(diào)整,和機(jī)器自動識別結(jié)果的調(diào)整分別對待。5.將文字的語義理解結(jié)果和圖形對象的識別過程融合起來,使之成為同時進(jìn)行的互動指導(dǎo)過程,而不是簡單地進(jìn)行圖文分離和圖形識別這樣順序且分離的過程。363.表述拓?fù)潢P(guān)系時,作者使用字符號表示,其間可以使用現(xiàn)存問題[3][4]缺乏對工程圖建立完整意義的信息表示方法,表達(dá)能力不是足夠的強(qiáng)。工程圖進(jìn)行理解的針對性強(qiáng)的領(lǐng)域知識還不能給予準(zhǔn)確地表示。對工程圖進(jìn)行理解的實(shí)施表達(dá)方法能力還不是非常強(qiáng)。缺乏對工程圖進(jìn)行深層次理解的有效的實(shí)現(xiàn)方法。只能處理單張圖紙內(nèi)容。37現(xiàn)存問題[3][4]缺乏對工程圖建立完整意義的信息表示方法,未來展望提高圖像預(yù)處理質(zhì)量,采用更加有效的去噪、重建和圖像分割算法;從而提高矢量化的結(jié)果,減少重建時的難度。使用一種評價機(jī)制,減少誤校正發(fā)生。提高知識表示能力,發(fā)展專用性更強(qiáng)的圖形理解知識系統(tǒng)。加強(qiáng)專業(yè)領(lǐng)域知識指導(dǎo)知識表示和推理,提高機(jī)器學(xué)習(xí)能力和圖形對象的識別能力。圖像重建時,可以將同一系列不同張圖紙之間建立聯(lián)系,從而進(jìn)行成套產(chǎn)品重建。38未來展望提高圖像預(yù)處理質(zhì)量,采用更加有效的去噪、重建和圖像分參考文獻(xiàn)1.工程圖紙矢量化的研究與實(shí)現(xiàn)(上海海運(yùn)學(xué)院碩士論文),2004。2.數(shù)字圖像的邊緣檢測,陳啟祥,2006。3.工程圖紙矢量化方法研究,丁偉東,2006。4.工程圖紙識別與理解的研究現(xiàn)狀分析,董玉德,2006。5.AStudyonInformationExtractionMethodofEngineeringDrawingTables,RizaSulaiman(Malaysia),20126.基于質(zhì)量評價的矢量化工程圖后處理技術(shù)研究(西北工業(yè)大學(xué)博士學(xué)位論文),2004。7.EngineeringDrawingsRecognitionUsingaCase-basedApproach,WenyinLiu,2003。8.InteractiveRecognitionofGraphicObjectsinEngineeringDrawings,WenyinLiu,2004。9.Aninteractiveexample-drivenapproachtographicsrecognitioninengineeringdrawing,WenyinLiu,2007。10.Aimprovedexample-drivensymbolrecognitionapproachinengineeringdrawings,TiantianGuo(China),201211.AFastTechniqueforVectorizationofEngineeringDrawingsusingMorphologyandDigitalStraightness,SekharMandal(India),2010。12.ADynamic-Rule–BasedFrameworkofEngineeringDrawingRecognitionandInterpretationSystem,TongLu,2007。13.Researchofthestructural-learning-basedsymbolrecognitionmechanismforengineeringdrawings,TLu,2009。X.基于拓?fù)潢P(guān)系的矢量化后處理技術(shù)研究,宋曉宇,何斌,2009。X.NewMethodofFeatureRecognitionformEngineeringDrawingsbasedonMulti-GranularityInformationAcquisitionBangyanYe(China),2009。X.融合視覺認(rèn)知的工程圖理解方法,耿衛(wèi)東,2001。39參考文獻(xiàn)1.工程圖紙矢量化的研究與實(shí)現(xiàn)(上海海運(yùn)學(xué)院碩士論文謝謝!4040演講完畢,謝謝觀看!演講完畢,謝謝觀看!工程圖紙識別技術(shù)研究
發(fā)展?fàn)顩r匯報
42工程圖紙識別技術(shù)研究
發(fā)展?fàn)顩r匯報
報告內(nèi)容研究意義發(fā)展現(xiàn)狀基本技術(shù)問題現(xiàn)有技術(shù)手段未來可能的著力點(diǎn)43報告內(nèi)容研究意義2研究意義工程圖是工程技術(shù)人員描述設(shè)計(jì)的對象、表達(dá)設(shè)計(jì)思想的主要工具?,F(xiàn)有的工程圖紙是長期以來人類智慧和勞動成果的結(jié)晶,據(jù)國際數(shù)據(jù)與文檔管理雜志估計(jì),在全世界現(xiàn)有的80億張工程圖紙中,超過85%以上是人工繪制的。但是,現(xiàn)在工程圖紙繪制的技術(shù)主要是使用計(jì)算機(jī)來進(jìn)行繪制,使用CAD技術(shù)。44研究意義工程圖是工程技術(shù)人員描述設(shè)計(jì)的對象
在大多數(shù)領(lǐng)域,成功使用過的工程圖紙就是一種寶貴的技術(shù)儲備資源,除了應(yīng)用于當(dāng)時工程的指導(dǎo),也是以后對產(chǎn)品進(jìn)行再設(shè)計(jì)、維護(hù),以及對于提高產(chǎn)品設(shè)計(jì)質(zhì)量、降低設(shè)計(jì)成本及縮短產(chǎn)品設(shè)計(jì)周期具有不可估量的作用。CAD技術(shù)可以極大地提高圖紙的生產(chǎn)和使用效率,當(dāng)我們想像使用CAD技術(shù)那樣來高效地利用以前的手繪圖紙時,這中間需要一個轉(zhuǎn)化技術(shù),以及一些更加智能的幫助[1]。45在大多數(shù)領(lǐng)域,成功使用過的工程圖紙就是一種寶貴發(fā)展現(xiàn)狀從80年代中期起,很多工業(yè)發(fā)達(dá)國家就開始著手圖紙輸入這一工作。起初方法是應(yīng)用某種CAD系統(tǒng)通過人機(jī)交互重畫一遍所有的藍(lán)圖,這樣可以使得圖面美觀統(tǒng)一,尺寸比例準(zhǔn)確。但是這種方法效率很低,繪制價格昂貴,工作既繁瑣又枯燥無味,造成人力物力資源的浪費(fèi)。46發(fā)展現(xiàn)狀從80年代中期起,很多工業(yè)發(fā)達(dá)國家就開近若干年來,CAD技術(shù)在工程設(shè)計(jì)領(lǐng)域得到普及性應(yīng)用,從而使工程圖紙矢量化技術(shù)的研究進(jìn)入高潮。目前國外己經(jīng)出現(xiàn)了一些商品化的矢量化軟件,比較著名的有德國Softelec公司的VPStudio/VPRasterPro,Able公司的R2V,挪威Rasterex公司的RxAutolmagePro2000,,華中科技大學(xué)的EDIS軟件、清華大學(xué)的ANNO等。這些軟件在一定程度上可以進(jìn)行圖紙的矢量化,但是它們通常都是針對某種專業(yè)圖紙,如機(jī)械圖紙、電子圖紙或地圖等,而且矢量化的準(zhǔn)確率也不是很高,例如對于交叉點(diǎn)多而復(fù)雜的圖紙,軟件自動跟蹤時可能會出現(xiàn)錯誤走向。47近若干年來,CAD技術(shù)在工程設(shè)計(jì)領(lǐng)域得到普及性基本問題圖像獲取與處理圖紙圖像的矢量化基本圖元和文字符號的識別工程圖形的2D理解面向工程圖形的二維重建48基本問題圖像獲取與處理7工程圖紙識別的基本過程預(yù)處理矢量化圖文分離圖形識別圖形重建49工程圖紙識別的基本過程預(yù)處理矢量化圖文分離圖形識別圖形重建8圖像的獲取與預(yù)處理由于工程圖紙一般較大,所以大多數(shù)情況下使用掃描儀掃描工程圖紙,最后將位圖格式的文件保存到計(jì)算機(jī)中。圖像預(yù)處理的質(zhì)量直接影響到后續(xù)工作,但在這個領(lǐng)域,技術(shù)相對成熟,根據(jù)工程圖紙的特性主要用到的圖像處理技術(shù)是消藍(lán)處理(濾色)、圖像去噪,邊緣提取。50圖像的獲取與預(yù)處理由于工程圖紙一般較大,所以大多數(shù)情況由于工程圖紙?jiān)诖娣诺倪^程中容易產(chǎn)生褶皺等損壞,圖紙上難免會出現(xiàn)一些非繪制的圖像元素,使用高斯濾波,中值濾波,以及數(shù)學(xué)形態(tài)學(xué)的方法都可以在一定程度上消除噪聲,改善圖像質(zhì)量。由于工程圖紙的特性,在矢量化之前,經(jīng)過邊緣提取處理的圖像最接近于矢量圖,也最容易進(jìn)行矢量化處理。這里實(shí)用的方法主要有Canny、Sobel、數(shù)學(xué)形態(tài)學(xué)、頻域變換(傅里葉、小波等)等方法進(jìn)行處理[2]。51由于工程圖紙?jiān)诖娣诺倪^程中容易產(chǎn)生褶皺等損壞,圖紙上難免會出圖紙圖像的矢量化[3]基于細(xì)化的矢量化方法基于輪廓匹配的矢量化方法基于鄰接圖的矢量化方法正交方向搜索法52圖紙圖像的矢量化[3]基于細(xì)化的矢量化方法11
智能算法在控制工程領(lǐng)域中有比較成功的應(yīng)用如模糊控制、遺傳算法、人工神經(jīng)網(wǎng)絡(luò)等,表現(xiàn)出非常好的魯棒性、自適應(yīng)性以及靈活的可擴(kuò)展性。在矢量化的過程中可以處理較復(fù)雜的情況。
模擬人工讀圖的的方式來進(jìn)行矢量化的過程可以使機(jī)器具備一些“常識”,先從整體上把握圖紙的宏觀特征然后由粗到細(xì)由拓?fù)浣Y(jié)構(gòu)到具體線型準(zhǔn)確有效地把握圖紙中各類線型之間的相互關(guān)系直接從圖像中提取出各類圖元[4]。53智能算法在控制工程領(lǐng)域中有比較成功的應(yīng)用如模糊控制圖文分離技術(shù)
圖形雖然是工程圖紙中最為重要的信息,但是如果缺少了一些必要的文字描述,工程圖也將變成不可理解的圖像,也無法用于工程指導(dǎo)。這其中主要有圖源,圖紙類型標(biāo)注,作者,尺寸標(biāo)注,材料標(biāo)注等。這些文字描述,對于快速使用工程圖紙進(jìn)行生產(chǎn)、修改、產(chǎn)品維護(hù)、查詢等起著至關(guān)重要的作用。工程圖紙自動化識別中有必要使用OCT技術(shù)將工程圖標(biāo)的信息提取出來[5]。54圖文分離技術(shù)圖形雖然是工程圖紙中最為重要的信息,但是工程圖形2D重建圖形經(jīng)矢量化處理后,圖素的尺寸和圖素間的拓?fù)潢P(guān)系都會產(chǎn)生一定誤差,為了使識別結(jié)果與各種CAD軟件繪制圖形的效果相近,提出對矢量圖實(shí)施“二維重構(gòu)”。包括兩部分[6]:
圖形結(jié)構(gòu)拓?fù)湫U龍D形輪廓的精確尺寸校正55工程圖形2D重建圖形經(jīng)矢量化處理后,圖素的尺
工程圖紙二維重建的前提是基本圖形元素的識別,基本可以分為兩大類[7][8][9][10]:基于統(tǒng)計(jì)的方法和基于知識表示的方法。
大多數(shù)基于統(tǒng)計(jì)的識別方法,圖形對象的特性是被事先定義的,然后設(shè)計(jì)一個使用邊界判定的分類器來進(jìn)行空間特性的決策。最典型的是模版匹配方法。
基于知識的識別方法,是將圖形對象表示為一些知識,比如規(guī)則或語法,依此來對圖形對象識別。對具代表性的是知識結(jié)構(gòu)表示與推理和知識語法的方法。56工程圖紙二維重建的前提是基本圖形元素的識別,基本圖素的拓?fù)漕愋椭本€圖素與其他類型的拓?fù)潢P(guān)系圓弧圖素與其他類型的拓?fù)潢P(guān)系
根據(jù)現(xiàn)有的兩大類識別方法,以及工程圖紙本身拓?fù)潢P(guān)系約束的特點(diǎn)。統(tǒng)計(jì)類識別方法較適合用于數(shù)目多,結(jié)構(gòu)簡單的工程圖識別。知識表示方法,由于知識推理方便,易于表達(dá)拓?fù)浼s束關(guān)系,在圖形對象多而復(fù)雜的情況下較適合。57圖素的拓?fù)漕愋椭本€圖素與其他類型的拓?fù)潢P(guān)系16
圖形拓?fù)潢P(guān)系表示的中不乏有各種新意的表示方法,但是使用最多也是最有效的表示方式就是使用圖。
工程圖紙本身就是一張圖,而且圖紙當(dāng)中很多的圖形基元或整體相對于基本圖元(直線、圓弧、圓、工程標(biāo)注符號)就類似于一張有著很強(qiáng)拓?fù)潢P(guān)系的圖。所以用圖來表示工程圖紙中的基本圖元是目前最流行的表示方法。而且在CAD繪圖中,基本的繪制操作(除了圖元的修改)都非常類似于對圖這種數(shù)據(jù)結(jié)構(gòu)的操作。58 圖形拓?fù)潢P(guān)系表示的中不乏有各種新意的表示方法,但
將工程圖中的每個圖素作為“圖”的頂點(diǎn),兩個頂點(diǎn)之間的關(guān)系可用弧來表示,屠蘇見的拓?fù)潢P(guān)系用權(quán)值來表示,將其數(shù)值化。根據(jù)事先定義的圖素間關(guān)系來選擇有向圖或無向圖。
圖的儲存一般使用鄰接表[6]。
59將工程圖中的每個圖素作為“圖”的頂點(diǎn),兩個頂點(diǎn)之間的
圖素的拓?fù)潢P(guān)系表示模型是一種動態(tài)表示模型,一般對該模型進(jìn)行如下操作[6]:
添加結(jié)點(diǎn):圖素增加,添加結(jié)點(diǎn),并添加該節(jié)點(diǎn)所對應(yīng)的關(guān)系。
刪除結(jié)點(diǎn):圖素被刪除,減少結(jié)點(diǎn),并在與其有拓?fù)潢P(guān)系的表中刪除該結(jié)點(diǎn)。
查詢:在帶權(quán)圖的中找到該圖素對應(yīng)的結(jié)點(diǎn),并提取該節(jié)點(diǎn)對應(yīng)的鄰接表。
結(jié)點(diǎn)拓?fù)潢P(guān)系修改:當(dāng)拓?fù)潢P(guān)系變動時,對圖素結(jié)點(diǎn)的鄰接表重寫,及向與改圖素有拓?fù)潢P(guān)系的其他圖素的鄰接表中添加該圖素結(jié)點(diǎn)。60圖素的拓?fù)潢P(guān)系表示模型是一種動態(tài)表示模型,一般對該模拓?fù)湫U幚?/p>
有了前面拓?fù)潢P(guān)系的正確表示,依據(jù)識別結(jié)果,對圖形對象進(jìn)行矯正[6]。主要方法有:
剪切和延伸平移和擴(kuò)展歸并61拓?fù)湫U幚碛辛饲懊嫱負(fù)潢P(guān)系的正確表示,依據(jù)識別結(jié)果尺寸校正處理[6]
這一階段的前提也是正確識別尺寸標(biāo)注線。在工程圖紙中的尺寸有各種類型,如水平尺寸,斜向尺寸,直徑尺寸,角度尺寸。尺寸標(biāo)注的結(jié)構(gòu)相對簡單,都是矢量箭頭和表示尺寸的字符組成,同時很多情況下,尺寸標(biāo)注,尤其是長度的表示,有很強(qiáng)的層次關(guān)系。所以可以采用樹類數(shù)據(jù)結(jié)構(gòu)來保存。每個方向的尺寸可以構(gòu)成一顆樹,所有方向的樹可以構(gòu)成森林。從而解決不同視圖間尺寸表達(dá)一致的的問題62尺寸校正處理[6] 這一階段的前提也是正確識別尺寸標(biāo)注線。2
樹的根節(jié)點(diǎn)為與根節(jié)點(diǎn)相連的葉子節(jié)點(diǎn)的尺寸基準(zhǔn),樹的每個節(jié)點(diǎn)都以他的父節(jié)點(diǎn)的一個尺寸界線作為它的基準(zhǔn)。校正時,都是以基準(zhǔn)所在的一段為固定端,而一零一段為活動端,保持固定端不動,校正活動端到相應(yīng)的位置。
其中主要過程有生成尺寸樹,確定約束域,定義約束屬關(guān)系,圖形元素及尺寸標(biāo)注的精確位置校正。63樹的根節(jié)點(diǎn)為與根節(jié)點(diǎn)相連的葉子節(jié)點(diǎn)的尺寸基準(zhǔn),樹的每相關(guān)工作1[11]
來自印度的學(xué)者SekharMandal采用了比較系統(tǒng)的圖像處理方法
來進(jìn)行工程圖紙的重建
,具體流程如下:1.使用OCR類軟件將圖中所有字符探測出,進(jìn)行圖文分離工作。
2.使用Canny邊緣提取算法,將光柵圖中所有的輪廓表示出來,二值化處理之后就將整幅圖的骨架細(xì)化出來。
64相關(guān)工作1[11]來自印度的學(xué)者SekharMand3.采用數(shù)學(xué)形態(tài)學(xué)中的開啟運(yùn)算來提取特定方向的的圖形元素;采用1×4的結(jié)構(gòu)元素來提取水平線段,4×1的結(jié)構(gòu)元素來提取垂直線段
用原圖將提取出來的兩幅圖減掉,就可以得到其他任意方向上的線段和弧線。4.采用鏈?zhǔn)酱a(行程編碼)的方式將圖中的所有點(diǎn)陣圖表示出來,使用和弦特性將圖中所有的直線判斷出而且所有的弧線被當(dāng)成是多個小線段組成,記錄線段的拐點(diǎn)。提取后的水平線段提取后的垂直線段653.采用數(shù)學(xué)形態(tài)學(xué)中的開啟運(yùn)算來提取特定方向的的圖形5.利用鏈?zhǔn)酱a信息來構(gòu)建矢量格式圖。然后,根據(jù)兩線段之間相間距離的關(guān)系來判斷兩條直線是否屬于原來同一直線的兩條邊緣,設(shè)定閾值進(jìn)行判斷
如果兩條直線滿足閾值限定,就將兩條線段間的部分進(jìn)行填充,從而進(jìn)行矢量圖的重建。重構(gòu)圖形的閾值化判定過程以及重構(gòu)線寬信息665.利用鏈?zhǔn)酱a信息來構(gòu)建矢量格式圖。然后,根據(jù)兩線段相關(guān)工作2.1[7][8][9]
識別領(lǐng)域比較有代表性的工作就是香港城市大學(xué)——劉文印使用基于知識表示的識別方法。
首先,在預(yù)處理階段,使用開源軟件Res2Vec進(jìn)行矢量化,然后使用閾值去噪的方法清除被判斷為噪聲的小短線。
其次,定義了四種拓?fù)潢P(guān)系,分別為直線的相交、平行、垂直(不相交)以及弧線與直線;分別都有精確量化了的參數(shù)來表示。67相關(guān)工作2.1[7][8][9]識別領(lǐng)域比較有代表性再次,提出了一種屬性樹的知識表示方法;同時,提出了KAA(KnowledgeAcquisitionAlgorithm)——用于知識提取與表示和KGRA(KnowledgeGraphRecognitionAlgorithm)用于知識推理與識別。KAA的基本流程如下:68再次,提出了一種屬性樹的知識表示方法;同時,提出了KAA(KKAA算法描述:輸入:組成圖形對象的向量集(用戶提供的示例)。輸出:圖形化知識(一顆儲存著每兩個結(jié)點(diǎn)間的幾何約束關(guān)系和訪問順序的樹)流程:1.提取所有的相交幾何約束關(guān)系同時構(gòu)造屬性樹G(V,E);2.如果G是連通的,轉(zhuǎn)到第6步;3.將G分割成G1,G2,G3……
Gn顆連通的子樹;4.搜尋節(jié)點(diǎn)間可以將字?jǐn)?shù)連接起來的平行和垂直關(guān)系;5.如果上述關(guān)系找到了就將它們加入G,同時轉(zhuǎn)到第2步,否則停止(F)。6.加入弧線和圓的拓?fù)潢P(guān)系到圖中;7.在G的基礎(chǔ)上構(gòu)造生成樹ST,用廣度優(yōu)先的原則遍歷ST,獲取約束順序K(c1,c2……cn);8.停止(S),同時將G和K作為這種對象的知識儲存到知識庫中。69KAA算法描述:28
由于在識別過程中不可能將向量和已有的知識表示100%的匹配,所以定義了關(guān)于直線和直線,弧線和弧線以及由直線構(gòu)成的類弧線之間的相似因子的定義。KGRA算法描述如下:輸入:SV:向量集(構(gòu)成待識別對象的向量集)KD:知識庫TL:閾值集,其中包含了長度和數(shù)量的容忍范圍變量:CT:識別過程中臨時構(gòu)造的的樹SM:標(biāo)識集(用來標(biāo)識識別過程中被使用過的向量)輸出:RR:識別結(jié)果——用SV來表示的圖形對象的類型。70由于在識別過程中不可能將向量和已有的知識表示100%算法過程:1.從KD當(dāng)中選擇知識樹K,如果所有的知識都已經(jīng)試驗(yàn)過就停止(F)2.清空CT,初始化SM3.從SV中選擇下一個向量V,要求這個V實(shí)在沒有在SM中被標(biāo)注的。加入V到CT中作為根;同時,將V在SM中標(biāo)注,表示V已經(jīng)在識別過程中使用過了。4.從遍歷順序K中選擇下一條邊E。如果所有的邊已經(jīng)被訪問過了,而且冗余向量的個數(shù)沒有超過容忍限度,就停止(S),同時將RR標(biāo)示為由當(dāng)前K來指示的對象類型5.否則,將V標(biāo)記為以E為邊的父節(jié)點(diǎn),使用V和E來計(jì)算V’6.搜尋V”,在空間上沿著兩個方向搜尋,使用TL中的容忍限度來檢測在SV中與V’相似的向量。7.如果V”找到了,就將它設(shè)為CT中V的子節(jié)點(diǎn),在SM中將V”標(biāo)記為已使用過,同時轉(zhuǎn)到第4步8.如果沒有找到V”,而且向量的缺損數(shù)量超過了容忍的范圍,就轉(zhuǎn)到第1步,否則轉(zhuǎn)到第4步71算法過程:30
由于目前完全由計(jì)算機(jī)進(jìn)行識別還不能達(dá)到較高的精度和理想的理解結(jié)果,往往在經(jīng)過一些幾何變換(尺寸、方向、圖層交疊等)之后,就不能得出很好地識別結(jié)果。這時需要用戶交互的來審查正確、錯誤、遺漏這樣的識別結(jié)果。給出新的指導(dǎo)來引導(dǎo)知識庫的更新;知識庫的更新,最直接的體現(xiàn)就是對其中閾值庫(或容忍庫)中關(guān)于長度、角度、向量個數(shù)的閾值范圍進(jìn)行動態(tài)的調(diào)整。在用戶給與反饋之后系統(tǒng)將根據(jù),正確識別保持原有閾值,遺漏識別更新閾值,錯誤識別被忽略掉的原則進(jìn)行閾值調(diào)整。這樣就是整個系統(tǒng)形成一個閉環(huán)反饋來提高系統(tǒng)性能。72由于目前完全由計(jì)算機(jī)進(jìn)行識別還不能達(dá)到較高的精度和理相關(guān)工作2.2[10]
清華大學(xué)的——郭田田,在劉文印工作的基礎(chǔ)上進(jìn)行了進(jìn)一步的發(fā)展[16]。主要創(chuàng)新點(diǎn)如下:1.把注釋作為一種新的基本圖素,由此主要圖素分為三大類:直線、弧線和文本;并且由此定義了五種拓?fù)潢P(guān)系:直線相交、直線平行、直線與圓弧、直線與文本、圓弧與文本。2.在知識提取和識別的階段都設(shè)置了優(yōu)先級,優(yōu)先級概念的引入提高了知識提取和識別的效率。在知識提取階段,按照統(tǒng)計(jì)數(shù)據(jù)顯示,按照直線相交-直線平行-直線與圓弧-直線與文本-圓弧與文本這樣由高到低的優(yōu)先級來提取拓?fù)潢P(guān)系,這樣可以節(jié)約大量的計(jì)算時間。知識提取過程與劉文印相似。73相關(guān)工作2.2[10]清華大學(xué)的——郭田田,在劉文印
識別的過程中,基本思路和劉文印非常相似,但是應(yīng)用了優(yōu)先級的概念,可以提高識別效率。作者認(rèn)為,一個圖形對象如果特征越明顯,由于其差別大,所以在統(tǒng)計(jì)上的特性就是分布的比較少,所以在識別階段,搜尋基本圖素的優(yōu)先級就由統(tǒng)計(jì)分布特性少到多,優(yōu)先級由高到低。
這樣,首先開始搜尋特征明顯的部分,如果在沒有用到優(yōu)先級最低的一級就可以將目標(biāo)識別出來,就可以節(jié)省大量的計(jì)算時間,同時也在一定程度上降低了搜尋目標(biāo)時的復(fù)雜度。在本文中識別過程的優(yōu)先級正好和知識提取階段相反:文本與圓弧-文本與直線-弧線與直線-直線平行-直線相交的順序又高到低進(jìn)行探測。74識別的過程中,基本思路和劉文印非常相似,但是應(yīng)用了優(yōu)3.重復(fù)模式的預(yù)處理
在工程師繪圖的過程中,在規(guī)范允許的范圍內(nèi),不用的繪圖工程師可能會有不同的繪制風(fēng)格,相同的事物在人看來被歸為一類,而對于對一切認(rèn)知事物都精確表示的機(jī)器來說就被歸到不同的分類,例如:
以上兩幅圖都代表樓梯,但是由于在樓梯的表示中平行的線條樹木不一樣,在機(jī)器看來就是分為兩類,由此我們可以想到,重復(fù)模式的表示盡管符合規(guī)范,但是會導(dǎo)致大量識別結(jié)果的冗余分類。所以作者將重復(fù)模式處理為實(shí)際關(guān)系塊:在實(shí)際關(guān)系塊的處理中,只保留第一個和最后一個圖素的拓?fù)潢P(guān)系,來代表所包含的塊中的表現(xiàn)形式。從而使識別過程具有一定的智能性。753.重復(fù)模式的預(yù)處理34相關(guān)工作3[12][13]
南京大學(xué)——路通,使用約束網(wǎng)絡(luò)來進(jìn)行識別。其主要特色有:1.使用了更加精確地特征表示方法,初步的有定義了CGF(CommonGraphicsFeature),其中有基本圖素、屬性、關(guān)系、優(yōu)先級、閾值范圍這5個屬性來描述一個圖形對象。為了提高識別效果和體現(xiàn)出大類與小類的層次關(guān)系,在CGF的基礎(chǔ)之上定義了定義了靜態(tài)特性,其中包括:積極特性、消極特性、輔助特性和關(guān)系。前三個特性都是CGF集,關(guān)系描述的就是這三個集中兩兩之間的關(guān)系。作者同樣采用了優(yōu)先級策略來對識別匹配過程中的候選特性進(jìn)行排序,表示為文本-圓-弧-直線這樣由高到低的優(yōu)先級。2.用戶初始化系統(tǒng)階段對將要識別的工程圖設(shè)定領(lǐng)域知識背景。在作者看來,由于規(guī)范不同沒有一種規(guī)則是所有工程圖紙之間共有的,所以指定領(lǐng)域知識可以將識別率提高。76相關(guān)工作3[12][13]南京大學(xué)——路通,使用約束3.表述拓?fù)潢P(guān)系時,作者使用字符號表示,其間可以使用+、!、>、&、|、(等計(jì)算機(jī)運(yùn)算符號進(jìn)行連接,這樣,規(guī)則都是以字符串的型式表現(xiàn)的。到了識別的時
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 第1單元 古代亞非文明(高頻非選擇題25題)(原卷版)
- 《波蘭歪屋設(shè)計(jì)》課件
- 《證券市場概述周》課件
- 玩具設(shè)計(jì)美工工作總結(jié)
- 2023-2024年項(xiàng)目管理人員安全培訓(xùn)考試題帶答案(黃金題型)
- 關(guān)于認(rèn)識實(shí)習(xí)報告匯編六篇
- 《系統(tǒng)安全評價概述》課件
- 《婦產(chǎn)科學(xué)緒論》課件
- 《監(jiān)理工作程序》課件
- 《應(yīng)用開發(fā)和管理》課件
- 青島市2022-2023學(xué)年七年級上學(xué)期期末道德與法治試題
- 高空作業(yè)安全免責(zé)協(xié)議書范本
- 石油化學(xué)智慧樹知到期末考試答案章節(jié)答案2024年中國石油大學(xué)(華東)
- 手術(shù)后如何防止排尿困難
- 特種設(shè)備“日管控、周排查、月調(diào)度”表格
- 重點(diǎn)關(guān)愛學(xué)生幫扶活動記錄表
- 2021年10月自考00850廣告設(shè)計(jì)基礎(chǔ)試題及答案含解析
- 結(jié)構(gòu)化面試表格
- 地?zé)崮苜Y源的潛力及在能源領(lǐng)域中的應(yīng)用前景
- 2023版:美國眼科學(xué)會青光眼治療指南(全文)
- 家長會課件:小學(xué)寒假家長會課件
評論
0/150
提交評論