《基于形式概念分析的圖像數(shù)據(jù)挖掘研究》15000字(論文)_第1頁(yè)
《基于形式概念分析的圖像數(shù)據(jù)挖掘研究》15000字(論文)_第2頁(yè)
《基于形式概念分析的圖像數(shù)據(jù)挖掘研究》15000字(論文)_第3頁(yè)
《基于形式概念分析的圖像數(shù)據(jù)挖掘研究》15000字(論文)_第4頁(yè)
《基于形式概念分析的圖像數(shù)據(jù)挖掘研究》15000字(論文)_第5頁(yè)
已閱讀5頁(yè),還剩34頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

.緒論 21.1圖像數(shù)據(jù)挖掘研究概述 21.1.1圖像數(shù)據(jù)挖掘的背景介紹 21.1.2圖像數(shù)據(jù)挖掘的特點(diǎn) 41.1.3圖像數(shù)據(jù)挖掘的現(xiàn)狀及發(fā)展趨勢(shì) 41.2形式概念分析方法的概述 51.2.1形式概念分析方法的背景介紹 51.2.2形式概念分析方法的特點(diǎn) 61.2.3形式概念分析方法的現(xiàn)狀及發(fā)展趨勢(shì) 62.圖像數(shù)據(jù)挖掘?qū)嶒?yàn)研究 82.1算法比較 82.2卷積神經(jīng)網(wǎng)絡(luò)在圖像中的應(yīng)用 92.3相關(guān)知識(shí)概述 123.形式概念分析方法研究 143.1基本理論 143.1.1形式概念分析方法基本概念 143.1.2形式背景相關(guān)概念 153.2概念格的構(gòu)造 163.2.1形式背景構(gòu)造過(guò)程與分析 163.2.2概念格構(gòu)造方法與相關(guān)知識(shí) 183.2.3批生成算法 193.2.4漸進(jìn)式生成算法 193.3模糊概念格概述 204.形式概念分析理論下的圖像數(shù)據(jù)挖掘 224.1概念格下的圖像挖掘知識(shí)發(fā)現(xiàn) 224.2關(guān)聯(lián)規(guī)則 224.3形式概念分析理論下圖像數(shù)據(jù)挖掘的應(yīng)用 234.3.1圖像表示及形式背景構(gòu)造過(guò)程 234.3.2輸入表示 254.3.3代碼實(shí)現(xiàn)過(guò)程 264.3.4輸出結(jié)果及解釋 33結(jié)論 36參考文獻(xiàn) 391.緒論本文將形式概念分析理論應(yīng)用于圖像數(shù)據(jù)挖掘,緒論部分對(duì)圖像數(shù)據(jù)挖掘和形式概念分析理論的概述、現(xiàn)狀、發(fā)展趨勢(shì)以及其特點(diǎn)進(jìn)行了介紹說(shuō)明。1.1圖像數(shù)據(jù)挖掘研究概述現(xiàn)如今,隨著智能化在生活中的發(fā)展覆蓋多領(lǐng)域,各個(gè)領(lǐng)域都出現(xiàn)了越來(lái)越多的圖片、影像,其中相機(jī)、電腦、手機(jī)、平板電腦等電子產(chǎn)品起到了制造、傳播、修改圖像的作用ADDINNE.Ref.{421FECBC-88E4-477D-9BD7-65B3F8E254CD}[1,2]。在農(nóng)業(yè)、工業(yè)、醫(yī)學(xué)、氣象、礦產(chǎn)資源勘探等多方面都有著重要的影響。人們生活發(fā)展的方方面面都離不開(kāi)圖像。以下內(nèi)容重點(diǎn)對(duì)圖像數(shù)據(jù)挖掘的背景和特點(diǎn)進(jìn)行概述,并且針對(duì)圖像數(shù)據(jù)挖掘的近況和發(fā)展趨勢(shì)進(jìn)行了詳細(xì)擴(kuò)展。1.1.1圖像數(shù)據(jù)挖掘的背景介紹圖像中蘊(yùn)含著豐富的含義,獲得這些內(nèi)涵并且利用這些信息和特征在許多領(lǐng)域中都至關(guān)重要。圖像中的信息可以應(yīng)用于企業(yè)對(duì)于客戶(hù)需求分析,促進(jìn)客戶(hù)消費(fèi),有利于公司智能的制定運(yùn)營(yíng)決策,有效制定運(yùn)營(yíng)計(jì)劃,優(yōu)化運(yùn)營(yíng)過(guò)程,還可以應(yīng)用于醫(yī)院病癥分析,其中,對(duì)于具體病癥可以做到更快更準(zhǔn)的確診。同時(shí),在不可再生資源勘察、地下人員搜救、農(nóng)業(yè)、天氣以及自然災(zāi)害預(yù)警等都發(fā)揮著關(guān)鍵作用,對(duì)我們的社會(huì)的興盛,自己學(xué)習(xí)和生活發(fā)展都有著不可忽視的作用ADDINNE.Ref.{421FECBC-88E4-477D-9BD7-65B3F8E254CD}[3,4]。隨著圖像數(shù)據(jù)量的不斷增多,利用圖像獲取信息并且對(duì)信息數(shù)據(jù)進(jìn)行研究分析就顯得十分迫切,因而圖像數(shù)據(jù)挖掘技術(shù)就應(yīng)用于其中。圖像是人們面對(duì)世界進(jìn)行有意義認(rèn)識(shí)的主要工具,人們生活的各個(gè)方面已經(jīng)離不開(kāi)圖像。圖像是用于表達(dá)和描繪客觀事物的工具。圖像數(shù)據(jù)挖掘是基于潛藏在圖像中的基礎(chǔ)特征提取關(guān)系,這些數(shù)據(jù)與圖像中顏色的類(lèi)型、圖中元素的分布、像素和構(gòu)成圖片的結(jié)構(gòu)等都有著直接的聯(lián)系。而這些規(guī)則在更廣泛的數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)過(guò)程中進(jìn)一步轉(zhuǎn)化為支持決策的非平凡事實(shí)。圖像數(shù)據(jù)挖掘經(jīng)過(guò)多個(gè)步驟,同時(shí)也需要多種技術(shù)手段和學(xué)科研究,是一種集成式技術(shù)過(guò)程ADDINNE.Ref.{421FECBC-88E4-477D-9BD7-65B3F8E254CD}[5]。目前,人們對(duì)于圖片的利用范圍也在不斷擴(kuò)大,針對(duì)不同領(lǐng)域的圖片、影像進(jìn)行處理、挖掘和分析有著不同的方法與作用。面對(duì)不同的發(fā)展需求,采用不同有差別的挖掘模型。圖像數(shù)據(jù)挖掘并用于指導(dǎo)分類(lèi),常見(jiàn)的分類(lèi)方法有:貝葉斯、支持向量機(jī)、決策樹(shù)、最大似然法等多種方法。如圖1-1中所表示常見(jiàn)的分類(lèi)方法的普遍過(guò)程包含:獲取數(shù)據(jù)集。對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。選擇并提取特征。找到恰當(dāng)?shù)乃惴?。進(jìn)行數(shù)據(jù)挖掘。對(duì)挖掘后的結(jié)果進(jìn)行剖析。應(yīng)用所發(fā)現(xiàn)的規(guī)則和模式。圖1-1數(shù)據(jù)挖掘的步驟圖像數(shù)據(jù)挖掘經(jīng)過(guò)長(zhǎng)時(shí)期的發(fā)展,在信息處理與關(guān)聯(lián)關(guān)系發(fā)掘方面都有了很大的進(jìn)步,但面對(duì)圖像中特征的聯(lián)系,仍然需要進(jìn)一步研究。將形式概念分析方式應(yīng)用于特征之間的聯(lián)系,用圖像表示特征之間的聯(lián)系不僅要考慮圖像構(gòu)造的問(wèn)題,同時(shí)還要考慮到特征之間關(guān)系。1.1.2圖像數(shù)據(jù)挖掘的特點(diǎn) 圖像數(shù)據(jù)挖掘的特點(diǎn)有如下幾點(diǎn):對(duì)圖像中的信息數(shù)據(jù)進(jìn)行挖掘與聯(lián)系是非常不容易的。圖像中的色彩、像素、曝光度等因素都影響著圖像信息的提取,對(duì)從圖像中提取出的數(shù)據(jù)進(jìn)行分析也有很大的難度。并當(dāng)面對(duì)有不同參數(shù)卻有相同內(nèi)容的圖像時(shí),獲取信息的難易性以及信息之間聯(lián)系性都有著很大差異。例如對(duì)不同書(shū)籍的封面的特征挖掘時(shí),同類(lèi)書(shū)集中會(huì)有著許多特征之間的關(guān)聯(lián),將這些特征之間的關(guān)聯(lián)發(fā)掘出來(lái)并且可以通過(guò)直觀的圖像表現(xiàn)出來(lái),這個(gè)過(guò)程是非常有難度的。圖像中所隱藏的數(shù)據(jù)信息范圍寬廣,信息量巨大ADDINNE.Ref.{421FECBC-88E4-477D-9BD7-65B3F8E254CD}[6,7]。目前,圖像量激增,圖像中包含的信息內(nèi)容多種多樣。并且每個(gè)人針對(duì)圖像中的信息有著不一樣的理解,不同的人針對(duì)不同的信息會(huì)有著不同的處理方法,因此也會(huì)產(chǎn)生不同的結(jié)果。例如,在發(fā)現(xiàn)煤礦的圖像中,包含著很多不同因素,這些信息過(guò)多,對(duì)于甄別是否有煤礦都有著很大的迷惑性。不同的結(jié)構(gòu)關(guān)系信息都蘊(yùn)含在圖像中,包括空間關(guān)系信息ADDINNE.Ref.{421FECBC-88E4-477D-9BD7-65B3F8E254CD}[8,9]。其中除了上、下、左、右側(cè)的位置以外,還有更為復(fù)雜的空間位置。如分離、包圍等位置關(guān)系。在圖像中,處在不同的位置關(guān)系中代表了不同的含義。例如在樹(shù)葉圖片中,不同位置的葉片脈絡(luò)就有著不同的信息表示,可能就是不同種類(lèi)的樹(shù)葉。1.1.3圖像數(shù)據(jù)挖掘的現(xiàn)狀及發(fā)展趨勢(shì)Fayyad在1993年研究挖掘非標(biāo)準(zhǔn)和多媒體思想,其中主要針對(duì)于天體天文學(xué)來(lái)進(jìn)行圖像數(shù)據(jù)挖掘研究理論、相關(guān)技術(shù)和知識(shí)發(fā)現(xiàn)ADDINNE.Ref.{421FECBC-88E4-477D-9BD7-65B3F8E254CD}[10,11]。并且對(duì)圖像中的物體進(jìn)行歸類(lèi)、分析,能夠有效發(fā)現(xiàn)星體中的火山。2005年武漢大學(xué)博士秦昆應(yīng)用形式概念分析方法針對(duì)不同像素對(duì)圖像進(jìn)行數(shù)據(jù)挖掘,分析概念之間的關(guān)系,對(duì)圖像數(shù)據(jù)的存儲(chǔ)與管理以及相關(guān)應(yīng)用進(jìn)行研究。2010年,黃成對(duì)基于決策樹(shù)分類(lèi)的數(shù)字圖像數(shù)據(jù)挖掘研究,對(duì)其過(guò)程和算法進(jìn)行探究。2019年,陳邦國(guó)對(duì)他當(dāng)時(shí)所常用的圖像處理機(jī)器學(xué)習(xí)算法的相關(guān)流程進(jìn)行總結(jié)歸納,看到了深度學(xué)習(xí)與圖像處理的聯(lián)合發(fā)展有著良好發(fā)展方向。圖像數(shù)據(jù)的發(fā)展與應(yīng)用會(huì)越來(lái)越廣泛,在接下來(lái)的發(fā)展中重點(diǎn)在于特征間關(guān)系的發(fā)掘,應(yīng)用形式概念分析理論可以在這一過(guò)程中體現(xiàn)出巨大的優(yōu)勢(shì),這一理論對(duì)于在圖像中進(jìn)行形式背景和概念格的構(gòu)造都有很強(qiáng)的指導(dǎo)作用。這一研究也會(huì)越來(lái)越深層次,可以運(yùn)用的領(lǐng)域也會(huì)越來(lái)越豐富。1.2形式概念分析方法的概述本小節(jié)中對(duì)形式概念分析方法進(jìn)行了背景介紹,并且針對(duì)其特點(diǎn)、現(xiàn)狀以及發(fā)展趨勢(shì)做了說(shuō)明介紹。1.2.1形式概念分析方法的背景介紹形式概念分析方法有著優(yōu)秀的數(shù)學(xué)分析問(wèn)題能力,通過(guò)泛化和例化的關(guān)系進(jìn)行分類(lèi)、分析信息。其中,形式概念分析方法通過(guò)對(duì)設(shè)定概念集和設(shè)定的屬性集之間的關(guān)系進(jìn)行捕獲和研究。并且,可以生成兩種不同的結(jié)果,一種是:通過(guò)對(duì)子類(lèi)數(shù)據(jù)和父類(lèi)數(shù)據(jù)進(jìn)行分層排序,它所代表的是一種抽象的概念,而另一種則是根據(jù)有效數(shù)據(jù)所得到依賴(lài)關(guān)系。這種方法在許多研究方向中都有著應(yīng)用,例如在醫(yī)學(xué)領(lǐng)域中,對(duì)不同的臨床反應(yīng)以及疾病之間關(guān)系進(jìn)行認(rèn)識(shí)。腸道癌癥有著許多癥狀,而這些癥狀之間的聯(lián)系對(duì)于發(fā)掘病癥極為關(guān)鍵。這其中就應(yīng)用了形式概念分析理論中的思想,在發(fā)現(xiàn)癥狀之間聯(lián)系的過(guò)程中,就可以通過(guò)構(gòu)造形式背景,來(lái)生成概念格,通過(guò)概念格可以發(fā)掘出引起病癥的主要癥狀,減小模糊性和不相關(guān)癥狀。在圖像處理中,使用粗糙集理論進(jìn)行適合的規(guī)則挖掘,之后在這些規(guī)則中使用形式化的概念探索影響決策更重要的因素,利用這些因素構(gòu)造關(guān)系圖。這樣的應(yīng)用還有很多,雖然應(yīng)用的領(lǐng)域不同,但其中的數(shù)學(xué)思維和處理模式都有許多相似和借鑒之處。形式概念分析方法提供的構(gòu)造概念格的數(shù)學(xué)思想不可或缺,在學(xué)習(xí)的方方面面都體現(xiàn)出這一數(shù)學(xué)思想。從這一數(shù)學(xué)理論出發(fā),可以簡(jiǎn)化挖掘特征之間聯(lián)系的過(guò)程。有了這一理論基礎(chǔ),大大簡(jiǎn)化了圖像特征挖掘的過(guò)程,使應(yīng)用更加高效。1.2.2形式概念分析方法的特點(diǎn)形式概念分析的特點(diǎn)有如下幾點(diǎn):可以對(duì)數(shù)據(jù)中的概念進(jìn)行發(fā)掘、分析以及推理ADDINNE.Ref.{421FECBC-88E4-477D-9BD7-65B3F8E254CD}[12]。一個(gè)概念是由一組對(duì)象和他們所擁有的一組屬性組成一對(duì)。將形式概念中的概念定義為它的范圍和意圖,它是基于實(shí)際的(或保證的)可能性函數(shù),其中概念中的每個(gè)對(duì)象都有它意圖的所有屬性,每個(gè)屬性都被它的范圍的所有對(duì)象所擁有。對(duì)數(shù)據(jù)中可以被人們直接發(fā)現(xiàn)或間接發(fā)現(xiàn)的聯(lián)系所思考。例如在同一科或同一類(lèi)別的動(dòng)物中有很多相同的特點(diǎn),在哺乳動(dòng)物中,高度發(fā)達(dá)的神經(jīng)系統(tǒng)和器官就屬于它們共同的特點(diǎn)。然而發(fā)現(xiàn)這些特點(diǎn)并利用它們之間的關(guān)系,可以對(duì)未知種類(lèi)的動(dòng)物進(jìn)行有效地分類(lèi)??梢詫?duì)數(shù)據(jù)、概念以及依賴(lài)關(guān)系進(jìn)行可視化展開(kāi)或折疊。將特征構(gòu)造成形式背景,在形式背景可以使用的前提下進(jìn)一步建造概念格,就可以發(fā)覺(jué)出特征之間的關(guān)聯(lián)關(guān)系并可以加以探究。在概念格中,可以對(duì)所得到的特征關(guān)系圖像中關(guān)鍵的特征進(jìn)行擴(kuò)展,并對(duì)不明顯、關(guān)聯(lián)性低的特征進(jìn)行折疊。1.2.3形式概念分析方法的現(xiàn)狀以及發(fā)展趨勢(shì)德國(guó)的R.Wille教授將這一概念于1982年首次發(fā)表于世。Ken的主要研究在于兩部分,一部分為粗糙集,另一部分為概念格,剖析了粗糙形式概念分析理論;Yao進(jìn)一步探究了形式概念分析中的粗糙集;康向平主要運(yùn)用這一思想斟酌了粗糙集的發(fā)展方向,重新建造出基于形式概念格的粗糙集模型,為人們提供新的思路去分析粗糙集;Krajci對(duì)傳統(tǒng)的模糊集進(jìn)行新的概念理解和分析。李想進(jìn)行了這一理論知識(shí)性的拓展和應(yīng)用的聯(lián)系,融合了不確定信息的粗糙集和模糊集理論,還提出一種文本主題分類(lèi)方法ADDINNE.Ref.{421FECBC-88E4-477D-9BD7-65B3F8E254CD}[13,14]。2007年,劉利峰在文本聚類(lèi)中應(yīng)用概念格理論,并且改進(jìn)了屬性約簡(jiǎn)效率ADDINNE.Ref.{421FECBC-88E4-477D-9BD7-65B3F8E254CD}[15]。2017年,A.Castellanos等人認(rèn)為應(yīng)用形式概念分析是一種探索性的數(shù)據(jù)分析和組織技術(shù),擴(kuò)展出了一種形式概念分析的主題檢測(cè)方法,該方法將穩(wěn)定性概念應(yīng)用于主題選擇。此外,還提出了基于形式概念分析的方法能夠處理聚類(lèi)和概率方法所存在的一些的缺點(diǎn),如出現(xiàn)難以處理具有復(fù)雜泛化關(guān)系的問(wèn)題。發(fā)展概念和概念類(lèi)型的數(shù)字化分析主要是在運(yùn)用數(shù)學(xué)知識(shí)。經(jīng)過(guò)長(zhǎng)時(shí)間的發(fā)展,對(duì)于這一理論的認(rèn)識(shí)更加清晰,并且可以結(jié)合其余學(xué)科發(fā)揮作用,并與其他思維結(jié)合,已經(jīng)在多個(gè)領(lǐng)域應(yīng)用起來(lái)。在軟件工程、數(shù)據(jù)分析、信息搜索等都發(fā)揮著重要的作用ADDINNE.Ref.{421FECBC-88E4-477D-9BD7-65B3F8E254CD}[15]。在與其他領(lǐng)域結(jié)合時(shí)可以充分發(fā)揮對(duì)數(shù)據(jù)集泛化和例化的作用,成為了一種數(shù)據(jù)推理的有效手段。2.圖像數(shù)據(jù)挖掘?qū)嶒?yàn)研究本章節(jié)主要介紹了圖像數(shù)據(jù)挖掘發(fā)展領(lǐng)域和應(yīng)用場(chǎng)景,為了更好的理解圖像數(shù)據(jù)挖掘的運(yùn)行過(guò)程,本章節(jié)中具體講解了一個(gè)圖像識(shí)別挖掘的實(shí)驗(yàn),以此為例,清晰的介紹了具體的步驟,并且針對(duì)過(guò)程中的關(guān)鍵點(diǎn)做了解釋。2.1算法比較圖像處理在圖像挖掘、醫(yī)學(xué)成像、醫(yī)學(xué)圖像處理、網(wǎng)絡(luò)挖掘等領(lǐng)域發(fā)揮著重要的作用,其中例如:在醫(yī)學(xué)成像中用于觀察患者是否確診有著至關(guān)重要的作用,當(dāng)醫(yī)院通過(guò)技術(shù)手段獲得病人癌細(xì)胞圖像后,在圖像數(shù)據(jù)挖掘技術(shù)還沒(méi)有廣泛應(yīng)用時(shí),大多都是醫(yī)生通過(guò)主觀判斷,容易出現(xiàn)誤判,然而應(yīng)用圖像挖掘技術(shù)后就可以做到減少誤判,在大量數(shù)據(jù)的前提下,可以對(duì)癌細(xì)胞圖像做出更加準(zhǔn)確的判斷。為了更準(zhǔn)確的理解數(shù)據(jù)挖掘,以下比較幾種機(jī)器學(xué)習(xí)算法:決策樹(shù)。優(yōu)點(diǎn):便于人們認(rèn)識(shí),并且計(jì)算復(fù)雜度比較低,還可以用于對(duì)不相關(guān)的特征數(shù)據(jù)進(jìn)行處理。缺點(diǎn):有很大概率會(huì)產(chǎn)生超額匹配問(wèn)題,容易發(fā)生過(guò)擬合。Apriori算法。優(yōu)點(diǎn):理解起來(lái)比較簡(jiǎn)單,對(duì)于數(shù)據(jù)的要求不高。缺點(diǎn):在大型數(shù)據(jù)集上運(yùn)行不會(huì)很快。卷積神經(jīng)網(wǎng)絡(luò)。優(yōu)點(diǎn):得到的成果突出,分類(lèi)識(shí)別非常精準(zhǔn),共享卷積核,處理高維數(shù)據(jù)較為輕松。缺點(diǎn):需要大量的數(shù)據(jù)并且需要調(diào)整參數(shù)。通過(guò)具體講解深度學(xué)習(xí)算法基于內(nèi)容的圖像中的應(yīng)用,可以更加深層次的理解這一理論ADDINNE.Ref.{421FECBC-88E4-477D-9BD7-65B3F8E254CD}[16,17]。如圖2-1表示數(shù)據(jù)處理的一般流程圖,為后文中舉例說(shuō)明圖像數(shù)據(jù)挖掘提供支持。圖2-1數(shù)據(jù)處理的一般過(guò)程圖2.2卷積神經(jīng)網(wǎng)絡(luò)在圖像中的應(yīng)用為了達(dá)到更好理解運(yùn)行步驟的目的,以MNIST手寫(xiě)數(shù)字?jǐn)?shù)據(jù)集識(shí)別挖掘?yàn)槔?,具體講解了圖像數(shù)據(jù)挖掘的步驟。下面通過(guò)使用卷積神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)圖像識(shí)別處理的過(guò)程。通過(guò)介紹這個(gè)具體的算法,來(lái)對(duì)圖像數(shù)據(jù)處理過(guò)程更加清晰和熟悉。MNIST數(shù)據(jù)集是手寫(xiě)數(shù)字字符的數(shù)據(jù)集,由多張28×28像素的灰度手寫(xiě)數(shù)字圖片來(lái)構(gòu)成樣本。如圖2-2:圖2-2MNIST手寫(xiě)數(shù)字?jǐn)?shù)據(jù)示例在卷積神經(jīng)網(wǎng)絡(luò)中,使用卷積作為模型,在鄰層之間進(jìn)行數(shù)據(jù)交換,功能驅(qū)動(dòng)模型和信息驅(qū)動(dòng)模型共同組成了圖像數(shù)據(jù)挖掘模型ADDINNE.Ref.{421FECBC-88E4-477D-9BD7-65B3F8E254CD}[18,19]。機(jī)器學(xué)習(xí)技術(shù)中的卷積神經(jīng)網(wǎng)絡(luò)是用來(lái)處理知識(shí)。深度學(xué)習(xí)方法就屬于其中,并且更加適合應(yīng)用于圖像數(shù)據(jù)。相比較傳統(tǒng)的分析程序,這個(gè)方法會(huì)更加仔細(xì)檢查每個(gè)單獨(dú)的層。圖像內(nèi)容與端到端結(jié)構(gòu)的低層次表示可以通過(guò)卷積神經(jīng)網(wǎng)絡(luò)來(lái)獲得。如圖2-3所示:圖2-3具體模型結(jié)構(gòu)通過(guò)圖2-3具體模型結(jié)構(gòu)來(lái)對(duì)圖像處理步驟進(jìn)行簡(jiǎn)要介紹,并且對(duì)關(guān)鍵步驟附上代碼解釋說(shuō)明。第一步需要讀取數(shù)據(jù)集,并且讀取目錄中的數(shù)據(jù),定義輸入數(shù)據(jù),將輸入數(shù)據(jù)重塑為四維數(shù)據(jù)其中第一位數(shù)據(jù)代表了圖片數(shù)量,讀取測(cè)試集的特征與標(biāo)簽ADDINNE.Ref.{421FECBC-88E4-477D-9BD7-65B3F8E254CD}[20-22]ADDINNE.Ref.{21391D99-A687-477D-B350-16283142C520}。圖2-4說(shuō)明了定義卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),濾波器的數(shù)量、卷積核的尺寸、步長(zhǎng),最后設(shè)置activation,即激活函數(shù)設(shè)為relu。圖2-4代碼實(shí)現(xiàn)過(guò)程圖2-5中重新定義卷積神經(jīng)網(wǎng)絡(luò)和卷積層的構(gòu)成參數(shù),利用tf.layers.max_pooling2d函數(shù)進(jìn)行最大池操作,輸出可以看出圖片尺寸變小。定義第二次卷積結(jié)構(gòu),改變部分參數(shù)。兩次卷積和降采樣完成后,對(duì)每個(gè)圖打平處理。圖2-5表示下面接一個(gè)全連接層,使用的是tf.layers.dense函數(shù)。圖2-5代碼實(shí)現(xiàn)函數(shù)圖2-6中使用tf.layers.dense來(lái)表示輸出層,dropout的輸出成果作為輸入。這個(gè)是一個(gè)簡(jiǎn)單的全連接層,沒(méi)有采用激活函數(shù),輸出十個(gè)數(shù)值。圖2-6代碼表示輸出層計(jì)算交叉熵?fù)p失,定義訓(xùn)練操作、模型的性能評(píng)價(jià)指標(biāo)為準(zhǔn)確率、tensorflow的圖,計(jì)算在測(cè)試集上的準(zhǔn)確率。test_accuracy=sess.run(accuracy_op,{input_x:test_x,output_y:test_y})最后將圖像帶入模型,進(jìn)行訓(xùn)練操作,計(jì)算訓(xùn)練損失。最后將結(jié)果分別輸出。通過(guò)對(duì)上述操作的應(yīng)用,來(lái)建立模型結(jié)構(gòu),來(lái)實(shí)現(xiàn)了如圖2-7的輸出結(jié)果:圖2-7上述結(jié)論中輸出結(jié)果圖2-7中表示隨著訓(xùn)練數(shù)量的增多,訓(xùn)練的損失會(huì)越來(lái)越低,而測(cè)試的準(zhǔn)確率會(huì)越來(lái)越高,并且在這個(gè)測(cè)試中,當(dāng)step達(dá)到900時(shí),測(cè)試準(zhǔn)確率在這幾項(xiàng)數(shù)據(jù)中達(dá)到最高為0.44,當(dāng)step為100,測(cè)試的準(zhǔn)確率為0.10,數(shù)值較低。其中預(yù)測(cè)得到的標(biāo)簽與實(shí)際標(biāo)簽進(jìn)行對(duì)比,在眾多標(biāo)簽中,大多都預(yù)測(cè)正確,其中出現(xiàn)了5組與真實(shí)標(biāo)簽不符合情況,剩余18組與真實(shí)標(biāo)簽是一致的。體現(xiàn)出了這一算法的實(shí)現(xiàn)還是比較準(zhǔn)確,可以高效的實(shí)現(xiàn)實(shí)驗(yàn)過(guò)程,并且得到較為合理的結(jié)果,充分的完成好這一圖像處理識(shí)別實(shí)驗(yàn)。2.3相關(guān)知識(shí)概述具有重要使用意義的在于使用到了one-hot,是獨(dú)熱編碼,也是一種有效編碼,是分類(lèi)變量作為二進(jìn)制向量的表示。在特征處于離散的情況下,這樣會(huì)使得到他們之間的距離更有說(shuō)服力。這樣可以使得分類(lèi)器適合離散數(shù)據(jù),并且擴(kuò)展了特征的作用,對(duì)后文中的概念格實(shí)驗(yàn)提供了思路。卷積神經(jīng)網(wǎng)絡(luò)和多層感知器網(wǎng)絡(luò)有很多關(guān)鍵的不同之處,卷積神經(jīng)網(wǎng)絡(luò)包含了很多卷積層和池化層構(gòu)成的特征提取器,可以通過(guò)這樣有效的減弱參數(shù)的規(guī)模,大大簡(jiǎn)化了模型的復(fù)雜度,減少出現(xiàn)過(guò)擬合的情況,增強(qiáng)模型的泛化能力。通過(guò)圖2-3和代碼的理解,可以充分理解了圖像處理的一般過(guò)程,為之后的在形式概念分析理論下進(jìn)行圖像處理奠定了基礎(chǔ),并且做了很好的鋪墊。具有更強(qiáng)的代表性,更加便于理解和認(rèn)識(shí)。

3.形式概念分析方法研究本章節(jié)主要對(duì)形式概念理論進(jìn)行研究與分析,對(duì)這一理論的基本概念以及形式背景的相關(guān)概念作了說(shuō)明。在概念格構(gòu)造的過(guò)程中,首先剖析了形式背景的構(gòu)造過(guò)程,以及構(gòu)造原則,并且還介紹了兩種概念格構(gòu)造的方法,一種為批生成算法,另一種漸進(jìn)式生成算法。根據(jù)這兩種方法,在這些知識(shí)的前提下,做出了概念格中關(guān)聯(lián)關(guān)系的理解,最后還針對(duì)模糊概念格進(jìn)行了擴(kuò)展知識(shí)發(fā)現(xiàn)。3.1基本理論本小節(jié)中主要詳盡的介紹了形式概念分析的基本概念和形式背景的相關(guān)概念以及知識(shí)發(fā)現(xiàn)。3.1.1形式概念分析方法基本概念形式概念分析是格理論中的一部分,將對(duì)象屬性集進(jìn)行形式分析。它主要是對(duì)于概念和概念思維的形式化。對(duì)于兩組集合A和B,A和B之間的二元關(guān)系是一組所有對(duì)(A,B),a∈A,b∈B,這是笛卡爾積A×B的子集。如果A上所有元素滿(mǎn)足二進(jìn)制關(guān)系。a,b,c∈A,稱(chēng)為部分序關(guān)系。概念只能存在于許多其他概念的關(guān)系中,在這些關(guān)系中,次概念與超概念的關(guān)系起著突出的作用。作為超概念的子概念表明子概念的外延包含在超概念的外延中,這就等于子概念的內(nèi)涵包含超概念的內(nèi)涵的聯(lián)系。例如攝影畫(huà)畫(huà)類(lèi)書(shū)籍就是書(shū)籍的子概念,水仙花就是花的子概念。對(duì)于概念和概念層次結(jié)構(gòu)的數(shù)學(xué)理論,我們顯然需要一個(gè)數(shù)學(xué)模型,該模型允許從數(shù)學(xué)上講對(duì)象、屬性和表示對(duì)象具有屬性的關(guān)系。其中,這種模型是由“形式上下文”的概念引入的,而“形式上下文”是應(yīng)用數(shù)學(xué)的一個(gè)新領(lǐng)域,這也是形式概念分析的基礎(chǔ)。形式概念分析的核心是一組從上下文中進(jìn)行有組織的觀察后設(shè)計(jì)概念層次結(jié)構(gòu)的方法。因此,形式概念分析中的概念形成過(guò)程是一個(gè)非常優(yōu)秀的數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)過(guò)程,其中概念集的構(gòu)建構(gòu)成了“挖掘”階段。在這個(gè)過(guò)程中,成功運(yùn)用這一理論和思想的場(chǎng)景非常多。格算法的關(guān)鍵區(qū)別在于兩個(gè)方面:格序(優(yōu)先)關(guān)系的計(jì)算和構(gòu)造過(guò)程中上下文的演化。介紹一種將新對(duì)象插入概念格的通用方案,通過(guò)如下圖中的介紹,來(lái)表示新對(duì)象插入概念格中的過(guò)程,如下圖3-1所示:圖3-1將新對(duì)象插入概念格的通用方案下圖介紹用一對(duì)局部概念格組裝成為全局概念格的過(guò)程,這一過(guò)程可以由如下圖3-2所示:圖3-2將局部概念格組裝全局概念格圖3-1與圖3-2中的參數(shù)主要體現(xiàn)了局部概念格和全局概念格,并且使用這樣的參數(shù)使得組裝過(guò)程說(shuō)明起來(lái)更加簡(jiǎn)單。3.1.2形式背景相關(guān)概念外延和內(nèi)涵共同組成了它的概念,其中這一概念的所有對(duì)象構(gòu)成了其外延,內(nèi)涵包括適用于外延的所有對(duì)象的所有屬性。通過(guò)使用概念和概念層的數(shù)據(jù)知識(shí),我們可以使用一個(gè)數(shù)學(xué)模型,這個(gè)模型可以從數(shù)學(xué)思維出發(fā)來(lái)解釋對(duì)象具有的屬性關(guān)系。一個(gè)形式背景K=(G,M,I),G、M分別表示為集合,I則表示為他們之間的關(guān)系,G中包含的元素為對(duì)象,M中包括的元素稱(chēng)為屬性。通過(guò)表示對(duì)象和屬性的關(guān)系,記為(o,m)∈I,稱(chēng)為對(duì)象o有屬性m。在形式背景中,輸入的數(shù)據(jù)是由對(duì)象和描述其中屬性和這一關(guān)系的表格所構(gòu)成。缺乏背景知識(shí)可能會(huì)導(dǎo)致提取過(guò)多的形式概念,包括那些不合常理的、低效的概念,另一方面,適當(dāng)?shù)谋尘爸R(shí)處理可能會(huì)引起高效的知識(shí)提取。最重要的是,這一過(guò)程縮小了提取形式概念的規(guī)模。此外,由輸入數(shù)據(jù)提供的信息可應(yīng)用于對(duì)應(yīng)背景知識(shí)的不同內(nèi)容的不同目的。屬性之間相比較下的重要性是分類(lèi)和聚類(lèi)中的一個(gè)約束條件。換句話(huà)說(shuō),它剔除了與背景知識(shí)不相符合的隱藏聚類(lèi)。3.2概念格的構(gòu)造構(gòu)造概念格關(guān)鍵在于形式背景的建造,這一小節(jié)中具體化構(gòu)造了形式背景,并且對(duì)每一步驟做出了詳盡的說(shuō)明。同時(shí),介紹說(shuō)明了概念格中的聯(lián)系。3.2.1形式背景構(gòu)造過(guò)程與分析生成概念格在形式概念分析理論中非常關(guān)鍵,通過(guò)概念格來(lái)表示對(duì)象之間特征的聯(lián)系和關(guān)系。面對(duì)概念格的研究,國(guó)內(nèi)外的研究人員都對(duì)不同種類(lèi)的算法進(jìn)行詮釋和分析。其中有兩類(lèi)方法,一種是批生成算法,另一種是漸進(jìn)式生成算法。算法主要針對(duì)概念格的制作、擴(kuò)展、簡(jiǎn)化、規(guī)則提取和利用。下面對(duì)不同植物進(jìn)行形式背景分析,如表3-1:a是常見(jiàn)的外觀色彩為紅色的植物;b是常見(jiàn)的外觀色彩為黃色的植物;c是常見(jiàn)的外觀色彩為白色的植物;d是成長(zhǎng)于地上的植物;e是成長(zhǎng)于地下的植物;f是成長(zhǎng)于水中的植物。其中“×”指代他們不存在這一屬性關(guān)系。下表中表示出:lily包括c,d這兩個(gè)特征,Turnsole包括b,d這兩個(gè)特征、Rose包括a,d這兩個(gè)特征,Lotus僅包括f這一個(gè)特征,Carrot包括a,e這兩個(gè)特征。表3-1不同植物領(lǐng)域的形式背景abcdefLily××××Turnsole××××Rose××××Lotus×××××Carrot××××通過(guò)上表中的的描述,可以理解在對(duì)應(yīng)行與對(duì)應(yīng)列之間的關(guān)系,還可以用1和0的變化方法表示特征的有無(wú)。如下表所示:表3-2不同植物領(lǐng)域的形式背景不同表達(dá)形式abcdefLily001100Turnsole010100Rose100100Lotus000001Carrot100010因此,輸入表由5個(gè)不同的認(rèn)識(shí)對(duì)象和6種不同的屬性組成。這樣的表格對(duì)于希望使用表格中包含的信息來(lái)形成具有共同特性的物種集群的植物學(xué)家意義重大,這個(gè)圖表是進(jìn)行形式概念分析的一個(gè)輸入表達(dá)。這個(gè)概念可以代表了對(duì)象中全部白色花朵植物的類(lèi)別和集群,這樣一個(gè)范疇的形成是正確的。然而,對(duì)于一個(gè)生物學(xué)家的探究來(lái)說(shuō),這樣的分類(lèi)似乎是不自然的。因?yàn)樵诤芏嗲闆r下會(huì)考慮其他更加關(guān)鍵的屬性,但是這些屬性同樣是十分重要的。因此,在進(jìn)行這樣的實(shí)驗(yàn)分析時(shí),要根據(jù)實(shí)際情況,結(jié)合具體領(lǐng)域?qū)嵺`應(yīng)用,本文概念針對(duì)圖像進(jìn)行形式概念分析研究,具體到一個(gè)方面,進(jìn)一步研究。3.2.2概念格構(gòu)造方法與相關(guān)知識(shí)直觀的顯現(xiàn)出數(shù)據(jù)中的相關(guān)聯(lián)關(guān)系,并通過(guò)一個(gè)層次結(jié)構(gòu)圖(所謂的概念格)可視化形式概念和屬性含義。形式概念由一系列應(yīng)用于該概念的對(duì)象和一組蘊(yùn)藏于該概念的屬性組成,因此A是共有B全部屬性的所有對(duì)象的集合。針對(duì)概念(O1,D1)和(O2,D2),其中O和D分別代表對(duì)象與屬性。倘如出現(xiàn)D2?D1的情況,則形式概念(O1,D1)稱(chēng)之為形式概念(O2,D2)的亞概念,記為(O1,D1)≤(O2,D2)。這樣我們可以獲得一個(gè)有序集,這個(gè)完全格被稱(chēng)為形式背景的概念格,記為L(zhǎng)(K)。下圖即為針對(duì)表3-2中不同對(duì)象的不同的特征之間的關(guān)系,而形成的概念格圖,如下圖所示:圖3-3由表3-2形式背景多對(duì)應(yīng)的概念格圖3-3中下面的五個(gè)圓球代表著表3-2中的五個(gè)對(duì)象,而中間的聯(lián)系,代表了他們的特征之間聯(lián)系的緊密,并且圖中的任兩個(gè)節(jié)點(diǎn)之間的聯(lián)系都代表了有著偏序關(guān)系。3.2.3批生成算法批生成方法是在上文中所描述的形式背景的概念下,決定著概念之間的關(guān)聯(lián)與屬性的關(guān)系。這一算法可以實(shí)現(xiàn)對(duì)概念格的構(gòu)造,其中包括對(duì)于隊(duì)列、列表、鏈接的構(gòu)造。批生成算法:輸入:形式背景。步驟1:對(duì)概念格進(jìn)行初始化。步驟2:初始化隊(duì)列。步驟3:從隊(duì)列獲取一個(gè)概念,根據(jù)概念生成子概念。步驟4:如果子概念首次產(chǎn)生,就增加到概念格中并加入隊(duì)列。步驟5:增多概念與其子概念之間的鏈接關(guān)系。步驟6:重復(fù)操作步驟三到五,直至隊(duì)列為空。輸出:概念格。3.2.4漸進(jìn)式生成算法漸進(jìn)式生成方法也被稱(chēng)為Godin算法。該算法從空的概念格出發(fā),按順序?qū)⑵浼尤氲綉?yīng)用形式背景中的對(duì)象,漸進(jìn)式的構(gòu)造出概念格。將新加入的對(duì)象同生成的概念格中的概念進(jìn)行對(duì)比,通過(guò)對(duì)比可以發(fā)現(xiàn)三種類(lèi)型的關(guān)系:無(wú)關(guān)概念、更新概念和由新增概念的子概念。漸進(jìn)式生成方法主要是適用于更新概念和新增概念,轉(zhuǎn)變了概念之間的關(guān)系。漸進(jìn)式生成算法:輸入:形式背景。步驟1:對(duì)格進(jìn)行初始化。步驟2:初始化隊(duì)列。步驟3:從隊(duì)列中取出一個(gè)概念,產(chǎn)生其每個(gè)子概念。步驟4:倘若出現(xiàn)了之前沒(méi)有產(chǎn)生出過(guò)的一個(gè)子概念,則加入到概念格并加入隊(duì)列中。步驟5:增多概念和子概念的關(guān)聯(lián)關(guān)系數(shù)量。步驟6:重復(fù)操作步驟三到五,直至隊(duì)列為空。輸出:概念格。3.3模糊概念格概述我們目前得到的信息很多是模糊的,基于模糊背景下的形式概念分析,發(fā)展廣泛,并且伴隨著數(shù)據(jù)集規(guī)模的日益擴(kuò)大,生成的模糊概念集合變得越來(lái)越多。在學(xué)習(xí)過(guò)程中,其中兩種方法有著重要的聯(lián)系。這兩種方法分別是模糊概念格理論和模糊圖論,都利用模糊圖來(lái)說(shuō)明模糊概念格。目前還出現(xiàn)了一種從模糊上下文中構(gòu)造模糊概念的算法,該算法比現(xiàn)有的算法更易于處理。模糊形式背景是由三元組構(gòu)成,其中可以用K=(U,A,I)來(lái)表示,U是指對(duì)象集,A為屬性集,I稱(chēng)為隸屬度函數(shù)。其中U×A→[0,1],o∈U,d∈A,記(a,d)=m,m∈[0,1]。這一背景中隸屬度就是在0~1之中。模糊形式背景中存在著許多人們不明確,不明白的數(shù)據(jù)和屬性。形式背景上的所有模糊概念記為CS(K),這一結(jié)構(gòu)是通過(guò)泛化與例化的聯(lián)系而產(chǎn)生的。如同O1?O2,則(O1,D1)≤(O2,D2)。這樣可以獲得一個(gè)格有序集,這就是模糊形式背景K的模糊概念格。在漸進(jìn)式生成模糊概念格時(shí),可以增加用于計(jì)算模糊參數(shù)等來(lái)輔助計(jì)算。并輸入模糊形式背景來(lái)得到模糊概念格。為了精確表示不確定性和不完全性,這一數(shù)學(xué)理論增加了模糊上下文、異構(gòu)上下文、區(qū)間值模糊上下文、雙極模糊上下文、鏈接模糊上下文、可能性理論和基于粗糙集的形式上下文。模糊屬性可能包含一些不明確或不確定部分,這些部分可以由三個(gè)獨(dú)立的區(qū)域來(lái)表示,這其中包括了真隸屬函數(shù)、不確定隸屬函數(shù)和假隸屬函數(shù)。然而如果在模糊概念格中加入一個(gè)新的屬性并不需要計(jì)算所有的頻繁節(jié)點(diǎn)和關(guān)聯(lián)規(guī)則,只需要在模糊概念格的增量式構(gòu)造算法中對(duì)已經(jīng)發(fā)生變化的新節(jié)點(diǎn)進(jìn)行處理。擴(kuò)大目前存在的基于屬性的精確概念格增量構(gòu)造算法,這樣模糊概念格可以正常發(fā)揮作用。使用剪枝技術(shù)改造構(gòu)造算法,產(chǎn)生相適應(yīng)的關(guān)聯(lián)規(guī)則,經(jīng)過(guò)這樣的處理,可以減少了很大的計(jì)算量和計(jì)算時(shí)間。模糊控制算法慢慢擴(kuò)展到模糊環(huán)境,這樣的擴(kuò)展可以在上下文中表示不確定和模糊的信息。將上下文中的模糊性轉(zhuǎn)化為模糊形式上下文,提供了面對(duì)模糊形式概念分析的新方法。模糊集的運(yùn)算方法包括子、并、交、補(bǔ)集,伴隨著對(duì)象的變化,模糊概念格要進(jìn)行不斷地適應(yīng)變化,模糊概念格中的關(guān)聯(lián)規(guī)則也會(huì)相應(yīng)更新。在這個(gè)過(guò)程中,也并不需要對(duì)所有的頻繁節(jié)點(diǎn)和關(guān)聯(lián)規(guī)則進(jìn)行設(shè)置。當(dāng)縮小模糊形式概念的規(guī)模時(shí),可以使用去區(qū)間值模糊圖和模糊概念格相聯(lián)系來(lái)處理這個(gè)過(guò)程。

4.形式概念分析理論下的圖像數(shù)據(jù)挖掘本章中介紹了面對(duì)圖像中的特征進(jìn)行概念格構(gòu)造的全過(guò)程,包括對(duì)形式背景的建立和對(duì)關(guān)聯(lián)規(guī)則的介紹。這些都對(duì)概念格的構(gòu)造和分析的意義重大。針對(duì)實(shí)現(xiàn)過(guò)程,分析了代碼結(jié)構(gòu),并且對(duì)關(guān)鍵代碼做出了重要解釋。舉例說(shuō)明六本書(shū)籍封面作為輸入,對(duì)獲得到的輸出結(jié)果圖像進(jìn)行分析,并且針對(duì)圖中的節(jié)點(diǎn)和各邊之間代表的特征關(guān)系進(jìn)行了總結(jié)歸納。4.1概念格下的圖像數(shù)據(jù)挖掘知識(shí)發(fā)現(xiàn)將圖像數(shù)據(jù)挖掘與形式概念分析理論進(jìn)行關(guān)聯(lián)應(yīng)用是極為關(guān)鍵的??梢栽趫D像挖掘的基礎(chǔ)上,進(jìn)行深層次的理解和聯(lián)系圖像之間的關(guān)系以及特征。這對(duì)于目前發(fā)展中的圖像數(shù)據(jù)技術(shù)如虎添翼??梢愿尤菀椎陌l(fā)現(xiàn)隱含的信息,并且可以通過(guò)對(duì)圖像中的關(guān)鍵元素的提取,來(lái)進(jìn)行形式背景的建立。對(duì)形式背景的認(rèn)識(shí)和理解,可以更快的開(kāi)發(fā)概念格,這個(gè)過(guò)程也可以叫做形式概念分析。形式背景的構(gòu)造實(shí)現(xiàn)了在概念格下對(duì)圖像數(shù)據(jù)挖掘和分析,針對(duì)于圖像中的特征來(lái)進(jìn)行挖掘。形式背景的表現(xiàn)形式可以作為一種程序輸入的范本。只有建立有效、清晰的形式背景才能更好的應(yīng)用于圖像數(shù)據(jù),這是有效表達(dá)特征之間關(guān)系,進(jìn)行形式概念分析的必要前提。通過(guò)舉例子來(lái)介紹形式背景的建造過(guò)程。其中對(duì)圖像中個(gè)別特征的存在與否進(jìn)行確認(rèn),建立出形式背景。4.2關(guān)聯(lián)規(guī)則形式概念分析中對(duì)于圖像特征之間的關(guān)聯(lián)規(guī)則發(fā)掘是必不可少的。只有對(duì)關(guān)聯(lián)規(guī)則有了充分的認(rèn)識(shí),才可以對(duì)構(gòu)造出的概念格進(jìn)行充分的理解。關(guān)聯(lián)規(guī)則主要采用的方法是通過(guò)將任務(wù)分解為兩個(gè)小任務(wù),其一是產(chǎn)生頻繁項(xiàng)集,用來(lái)滿(mǎn)足最小支持度闕值,另一個(gè)是產(chǎn)生規(guī)則,從之前發(fā)現(xiàn)的頻繁項(xiàng)集中提取出所有高置信度的規(guī)則??梢允斋@頻繁項(xiàng)集和并且從頻繁項(xiàng)集中產(chǎn)生緊密的關(guān)聯(lián)聯(lián)系。下圖4-1即為Apriori算法的流程圖。圖4-1Apriori算法的流程圖對(duì)關(guān)聯(lián)規(guī)則算法中常用的Apriori算法進(jìn)行了說(shuō)明講解,可以深入地理解關(guān)聯(lián)規(guī)則。目前,關(guān)聯(lián)規(guī)則在多領(lǐng)域被廣泛使用,在經(jīng)濟(jì)領(lǐng)域中,他可以成功推斷出客戶(hù)的需求,針對(duì)人們的不同特點(diǎn)推送出有差異的方案。然而,我們應(yīng)當(dāng)在生活中的多方面應(yīng)用關(guān)聯(lián)規(guī)則,解決復(fù)雜困難的問(wèn)題。4.3形式概念分析理論下圖像數(shù)據(jù)挖掘的應(yīng)用這節(jié)中重點(diǎn)介紹了通過(guò)實(shí)例構(gòu)造形式背景進(jìn)而完成概念格的構(gòu)造,對(duì)整個(gè)構(gòu)造過(guò)程進(jìn)行說(shuō)明分析,并且結(jié)合代碼進(jìn)行講解。4.3.1圖像表示及形式背景構(gòu)造過(guò)程對(duì)六本不同書(shū)籍封面進(jìn)行特征發(fā)現(xiàn),并且構(gòu)造出形式背景的多種表達(dá)方式,采取最合理的一種。實(shí)例圖像如圖4-2:圖4-2-1歷史的軌跡圖4-2-2一生中愛(ài)提的99問(wèn)題圖4-2-3大學(xué)生生涯規(guī)劃與發(fā)展圖4-2-4怪誕心理學(xué)2圖4-2-5給大忙人解壓的書(shū)圖4-2-6長(zhǎng)尾理論圖4-2實(shí)驗(yàn)中的六本書(shū)籍封面表4-1是針對(duì)不同書(shū)籍封面的特點(diǎn)來(lái)進(jìn)行形式背景分析,其中有符號(hào)的表示這個(gè)書(shū)籍的封面中沒(méi)有這一元素,沒(méi)有符號(hào)的則代表書(shū)籍封面中擁有了這一特征,主要對(duì)顏色和圖案類(lèi)型進(jìn)行形式背景分析,其中顏色對(duì)紅、綠、黃、黑、白色進(jìn)行背景分析,而針對(duì)圖案主要包括圓形、矩形、線(xiàn)性、三角形。表4-1六本書(shū)籍封面的形式背景RedGreenYellowBlackSquareLinearCircularTrianglea×××××b××c×××××d×××e×××f××××其中在上述圖像中,a中包含紅色、黑色、線(xiàn)性圖案,b中包含紅色、綠色、黃色、黑色、以及正方形和圓形圖案。c中包含赤色、黑色和三角圖案。d中包含赤色、綠色、黃色、玄色、以及圓形圖案。e中包含紅色、綠色、黑色、以及線(xiàn)形和圓形圖案。f中包含紅色、綠色、黑色、以及線(xiàn)形和圓形圖案。對(duì)圖像特點(diǎn)的發(fā)現(xiàn)與搜集后,并對(duì)其聯(lián)絡(luò)和應(yīng)用。然而在應(yīng)用過(guò)程中可以用1和0來(lái)表示其特征的有無(wú)。1代表此類(lèi)特征在圖像中存在,而0則代表特征在圖像中不存在。表中描述圖片內(nèi)存在特征之間關(guān)系,通過(guò)做好這些前期工作,才能更好的發(fā)掘他們之間的關(guān)系。表4-2六本書(shū)籍封面的形式背景不同表示RedGreenYellowBlackSquareLinearCircularTrianglea10100100b11111010c10010001d11110010e11010110f11010010通過(guò)對(duì)上面舉出的圖片實(shí)例,來(lái)進(jìn)行不同的形式背景分析表示,通過(guò)1來(lái)表示有這個(gè)特征,0來(lái)表示沒(méi)有這個(gè)特征,來(lái)對(duì)形式背景的不同表示,上圖即對(duì)形式背景通過(guò)數(shù)據(jù)0和1的方式表示出來(lái),依次可以作為程序的輸入。4.3.2輸入表示如圖4-3中的輸入提示,即將對(duì)象和特征表示以及個(gè)數(shù)輸入到程序之中。通過(guò)輸入上述6個(gè)書(shū)籍封面對(duì)象,再根據(jù)提示將8個(gè)屬性輸入,即可完成程序初始化輸入。圖4-3輸入對(duì)象和屬性提示圖4-4代表將圖像特征的矩陣輸入代碼中,即為對(duì)表4-2的輸入,進(jìn)而可以實(shí)現(xiàn)代碼對(duì)不同對(duì)象特征關(guān)系進(jìn)行挖掘和聯(lián)系。圖4-4輸入特征矩陣提示上述圖4-3和圖4-4介紹了構(gòu)造概念格過(guò)程中,在形式背景構(gòu)造好的前提下,對(duì)對(duì)象和特征輸入,并且將對(duì)象與特征之間的對(duì)應(yīng)關(guān)系進(jìn)行矩陣形輸入。4.3.3代碼實(shí)現(xiàn)過(guò)程應(yīng)用networkx和matplotlib工具,在對(duì)圖像中的特征進(jìn)行挖掘分析之后,使其可以通過(guò)初始化一些畫(huà)圖的參數(shù)來(lái)解決圖像建立的基本要求。利用這一包,可以對(duì)發(fā)掘出的關(guān)系建立圖形,來(lái)清楚的表達(dá)出來(lái)圖像特征之間的關(guān)系。編寫(xiě)代碼來(lái)進(jìn)行數(shù)據(jù)輸入,將形式背景中的信息輸入到程序中,其中包括特征的表示以及實(shí)驗(yàn)的對(duì)象。對(duì)其中的關(guān)鍵代碼進(jìn)行說(shuō)明解釋?zhuān)喝鐖D4-5定義并且構(gòu)造矩陣。圖4-5構(gòu)造矩陣如圖4-6定義得到二分的派系,并且可以輸出查看。圖4-6定義派系并檢查如圖4-7主要定義稠密列表,并且利用循環(huán)語(yǔ)句進(jìn)行屬性與對(duì)象之間的匹配。圖4-7定義稠密列表如圖4-8表示的是生成格,并且使用if語(yǔ)句判斷是否為子集,創(chuàng)造概念格圖像中最底部和最頂部的節(jié)點(diǎn)。圖4-8生成格圖4-9所示將這些使用if語(yǔ)句所得出的屬性關(guān)系和對(duì)象等添加到圖表中,為之后的概念格圖像輸出做準(zhǔn)備。圖4-9添加信息到圖表圖4-10在圖表中添加節(jié)點(diǎn)之間的邊信息,最后都集合到lattice.png這一圖像文件中,打開(kāi)這一圖像就可以獲得他們所有特征之間的聯(lián)系。圖4-10將特征關(guān)系集合到圖像文件如圖4-11按照格式輸入對(duì)象和屬性,并且建立矩陣,得到倆個(gè)派系。圖4-11建立對(duì)象與屬性的矩陣如圖4-12所示使用while語(yǔ)句壓縮兩個(gè)派系直到?jīng)]有變化。圖4-12壓縮派系建立對(duì)象與屬性的矩陣如圖4-13是解釋過(guò)濾器概念的過(guò)程,這個(gè)過(guò)程是不可或缺的,它解決了過(guò)濾器運(yùn)行的要求。圖4-13定制濾波器如4-14以下代碼是對(duì)在形式概念上的圖像特征數(shù)據(jù)進(jìn)行排序,并且生成概念格的圖像文件。圖4-14生成圖像文件圖4-15表示查詢(xún)并且返回輸出結(jié)果,對(duì)輸出是否規(guī)范,返回提示信息。圖4-15輸出并返回通過(guò)上個(gè)圖中代碼的編寫(xiě)和實(shí)現(xiàn),可以構(gòu)造出對(duì)象與屬性之間關(guān)系的圖像,并且在代碼實(shí)現(xiàn)過(guò)程中,具體講解了每一部分,其中包括定義矩陣、濾波器和屬性關(guān)聯(lián)構(gòu)造,將這些都直觀清晰的體現(xiàn)在輸出圖像中,以此達(dá)到實(shí)現(xiàn)目的。4.3.4輸出結(jié)果及解釋通過(guò)將形式背景的輸入,經(jīng)過(guò)上述代碼的編寫(xiě)和運(yùn)行,可以將圖像數(shù)據(jù)以及特征進(jìn)行泛化和例化。將形式概念應(yīng)用于其中,體現(xiàn)出了不同對(duì)象中的特征關(guān)聯(lián)。圖像中的節(jié)點(diǎn)和邊以及邊和邊之間都有著相密切的關(guān)聯(lián)。圖4-16表示的是概念格的節(jié)點(diǎn)。通過(guò)對(duì)概念格節(jié)點(diǎn)的認(rèn)識(shí)可以理解圖像數(shù)據(jù)特征之間的關(guān)系,在輸出結(jié)果中,可以通過(guò)節(jié)點(diǎn)的提示來(lái)更好的理解輸出結(jié)果,體現(xiàn)各個(gè)對(duì)象之間特征的關(guān)系,充分體現(xiàn)了概念格應(yīng)用于圖像數(shù)據(jù)挖掘的歷程。圖4-16即為輸出圖像中節(jié)點(diǎn)表示,這樣更有利于對(duì)于輸出關(guān)系的理解。圖4-16概念格節(jié)點(diǎn)表現(xiàn)圖4-16中表示圖4-17中的節(jié)點(diǎn),是根據(jù)不同對(duì)象之間的特征關(guān)系所決定,并且在對(duì)節(jié)點(diǎn)有了清晰的認(rèn)識(shí)后,才能更好的理解輸出的結(jié)果圖像,把圖像中的特征關(guān)系顯現(xiàn)出來(lái)。圖4-17其中(a,136)代表著是a封面有1、3、6這三個(gè)屬性,分別代表紅色、黑色、線(xiàn)性圖案。(b,123457)代表著是b封面有1、2、3、4、5、7這六個(gè)屬性,分別代表紅色、綠色、黃色、黑色、以及正方形和圓形圖案。(c,148)代表著是c封面有1、4、8這三個(gè)屬性,分別代表紅色、黑色、三角圖案。(e,12467)代表著是e封面有1、2、4、6、7這五個(gè)屬性,分別代表紅色、綠色、黑色、以及線(xiàn)形和圓形圖案。經(jīng)過(guò)這樣的過(guò)程確定節(jié)點(diǎn),可以更好的利用屬性之間聯(lián)系。經(jīng)過(guò)概念格的構(gòu)造來(lái)帶入程序分析,利用過(guò)濾器等發(fā)掘出相關(guān)聯(lián)系。為了更好的理解輸出圖像,根據(jù)輸出結(jié)果表示出不同對(duì)象中特征的關(guān)系,可以清晰的從輸出圖像中反映出來(lái)。如圖4-17所示:圖4-17輸出結(jié)果通過(guò)圖4-17可以對(duì)輸出結(jié)果起到很好的解釋與說(shuō)明的作用,可以通過(guò)輸出結(jié)果的圖像來(lái)表現(xiàn)出以上六本書(shū)籍封面特征的關(guān)聯(lián)關(guān)系,在這六本書(shū)籍的封面特征中,都有著緊密的聯(lián)系,并且共同特征占據(jù)大多數(shù),所有他們各自之間都有著不可忽視的聯(lián)系。正如圖4-17所表示的一樣,這個(gè)概念格輸出結(jié)果完美的體現(xiàn)了基于形式概念分析對(duì)上文中不同書(shū)籍封面的圖像數(shù)據(jù)挖掘所得到的直觀表現(xiàn),對(duì)六本書(shū)籍封面之間的特征關(guān)系進(jìn)行了清晰呈現(xiàn)。這一應(yīng)用為形式概念分析理論在圖像數(shù)據(jù)挖掘中的發(fā)展提供很好的案例,對(duì)進(jìn)一步聯(lián)系和發(fā)現(xiàn)提供了很優(yōu)化的方法。結(jié)論本論文對(duì)基于形式概念分析下的圖像數(shù)據(jù)挖掘進(jìn)行深入認(rèn)識(shí)與擴(kuò)展,文中將形式概念分析理論和圖形數(shù)據(jù)挖掘建立聯(lián)系,豐富了這一領(lǐng)域的研究。為了能夠有直觀的說(shuō)明介紹,要通過(guò)具體應(yīng)用來(lái)實(shí)現(xiàn)這一目的。本文的主要內(nèi)容如下:本文介紹了圖像數(shù)據(jù)挖掘和形式概念分析理論知識(shí)概述。從形式概念分析與圖像挖掘的研究現(xiàn)狀和發(fā)展趨勢(shì)入手??偨Y(jié)了他們各自的特點(diǎn),使特點(diǎn)呈現(xiàn)出條理化、清晰化、實(shí)例化。通過(guò)這種方法,這為本文后續(xù)分析奠定了堅(jiān)實(shí)的基礎(chǔ),應(yīng)用的方向更加明確。文中提出了從例化和泛化的關(guān)系中入手分析圖像,使概念格理論的思想可以充分體現(xiàn)出來(lái),展現(xiàn)出其獨(dú)特的長(zhǎng)處,為之后的應(yīng)用提供了充分的理論依據(jù)。對(duì)圖像挖掘研究進(jìn)行實(shí)例化分析。本文將理論應(yīng)用于首要進(jìn)一步撰寫(xiě),首要將二者有機(jī)聯(lián)系。要達(dá)到這一目的,就要對(duì)二者都有很深刻的認(rèn)識(shí)和發(fā)展。本文通過(guò)舉例圖像數(shù)據(jù)的實(shí)驗(yàn),可以讓學(xué)習(xí)者更加清晰地認(rèn)識(shí)到論文的研究過(guò)程,并對(duì)多種算法的優(yōu)缺點(diǎn)進(jìn)行比較。本文通過(guò)對(duì)大量圖像數(shù)據(jù)進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用,改變參數(shù)值來(lái)得到不同的準(zhǔn)確率,并且通過(guò)這一實(shí)驗(yàn)實(shí)現(xiàn)對(duì)圖像的分類(lèi),得到了識(shí)別準(zhǔn)確率,這其中也應(yīng)用到例化與泛化的思想。因此,可以在這個(gè)實(shí)踐操作過(guò)程中,深入體會(huì)到了形式概念分析思想。對(duì)概念格的構(gòu)造。本文詳細(xì)講解了概念的常用構(gòu)造算法,并且介紹了其具體過(guò)程。通過(guò)具體的應(yīng)用實(shí)踐,針對(duì)不同花的品種,對(duì)其特征進(jìn)行了分析總結(jié),用圖表的形式清晰簡(jiǎn)潔的構(gòu)造出了形式背景,為下文中實(shí)驗(yàn)的輸入做準(zhǔn)備。同之前的研究中對(duì)于形式背景做出了更細(xì)致的講解與分析。對(duì)圖像數(shù)據(jù)挖掘與形式概念分析理論進(jìn)行整合利用。其中概念格在圖像數(shù)據(jù)中的應(yīng)用主要體現(xiàn)在圖像的特征中,針對(duì)圖像中最具有代表性的特征進(jìn)行了形式背景構(gòu)造。通過(guò)對(duì)六本書(shū)籍封面的形式背景構(gòu)造,可以清楚地體現(xiàn)出不同封面特征之間的關(guān)系,實(shí)現(xiàn)了對(duì)于圖像數(shù)據(jù)進(jìn)行概念分析的準(zhǔn)備工作。經(jīng)過(guò)本文的研究,本文重點(diǎn)構(gòu)造了概念格。通過(guò)具體實(shí)例,尋找六本不同書(shū)籍封面的特征,構(gòu)造出概念格并分析書(shū)籍之間的特征關(guān)系,實(shí)現(xiàn)了本次論文的研究目的。具體代碼實(shí)現(xiàn)過(guò)程中應(yīng)用繪制圖的一些工具包,對(duì)圖像的輸出做準(zhǔn)備。在研究中,通過(guò)解釋過(guò)濾器概念等,編寫(xiě)程序,將上述圖像的形式背景作為輸入,經(jīng)過(guò)1或0作為特征有無(wú)輸入的表示,來(lái)比較和聯(lián)系各個(gè)特征之間的關(guān)系從而生成圖像來(lái)表示特征之間的關(guān)系,對(duì)圖像的節(jié)點(diǎn)和邊之間的關(guān)系都做出了研究并且使其在概念格圖像中顯現(xiàn)出來(lái)。這一階段中概念格的構(gòu)造是本論文的關(guān)鍵,但如果沒(méi)有文中其余部分的研究發(fā)展,也不能完美構(gòu)造出概念格,也不能如此高效的體現(xiàn)出他們特征之間的關(guān)聯(lián)關(guān)系。因此,在本文中每一章節(jié)都是環(huán)環(huán)相扣,緊密聯(lián)系,必不可少,只希望能夠呈現(xiàn)出完整又清晰的研究鏈條。在這樣的研究過(guò)程中,收獲了一些應(yīng)用成果,但還需要更深的研究和探討,對(duì)于形式概念分析理論研究仍然是研究的重點(diǎn)。針對(duì)與圖像數(shù)據(jù)的聯(lián)系,以及進(jìn)一步對(duì)特征概念格的構(gòu)造也是關(guān)鍵之處,如何廣泛的應(yīng)用于圖像和其他領(lǐng)域仍然是我們需要多多關(guān)注的。

參考文獻(xiàn)[1]KavithaD,RaoBVM,KishoreBV.ASurveyonAssortedApproachestoGraphDataMining[J].InternationalJournalofComputerApplications,2011,14(1):43-46.[2]李新友.圖像數(shù)據(jù)挖掘的預(yù)處理技術(shù)[J].河北旅游職業(yè)學(xué)院學(xué)報(bào),

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論