自然語(yǔ)言處理-第4章 特征與增強(qiáng)的文法_第1頁(yè)
自然語(yǔ)言處理-第4章 特征與增強(qiáng)的文法_第2頁(yè)
自然語(yǔ)言處理-第4章 特征與增強(qiáng)的文法_第3頁(yè)
自然語(yǔ)言處理-第4章 特征與增強(qiáng)的文法_第4頁(yè)
自然語(yǔ)言處理-第4章 特征與增強(qiáng)的文法_第5頁(yè)
已閱讀5頁(yè),還剩35頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第四章特征和增強(qiáng)的文法前一章講的上下文無(wú)關(guān)文法為迄今為止開發(fā)的大多數(shù)計(jì)算分析機(jī)構(gòu)提供了基礎(chǔ)。但僅使用最基本的上下文無(wú)關(guān)文法要處理自然語(yǔ)言將是很不方便的。在本章中將描述基本上下文無(wú)關(guān)機(jī)制的一種擴(kuò)展,它使用一組特征來(lái)定義成分。這種擴(kuò)展使我們能夠用一種直覺而簡(jiǎn)潔的方法來(lái)處理自然語(yǔ)言中諸如一致性和子類等的方面的問(wèn)題。4.1 特征系統(tǒng)和增強(qiáng)的文法4.2 英語(yǔ)的一些基本特征系統(tǒng)4.3 詞法分析和辭典4.4 一個(gè)使用特征的簡(jiǎn)單文法4.5 使用特征進(jìn)行分析4.6 增強(qiáng)的轉(zhuǎn)移網(wǎng)絡(luò)4.7 確定子句文法(Definite Clause Grammar)4.8 擴(kuò)展的特征系統(tǒng)和合一文法結(jié)束放映4.1 特征系統(tǒng)和帶參數(shù)

2、的文法自然語(yǔ)言中的一致性限制及特征系統(tǒng)的引入自然語(yǔ)言中在詞與詞之間,短語(yǔ)與短語(yǔ)之間經(jīng)常有一致性限制。例子:a men不是一個(gè)合法的英語(yǔ)短語(yǔ)。主要幾種一致性形式:數(shù)的一致性(number agreement)、主語(yǔ)動(dòng)詞的一致性(subjectverb agreement)、代詞的性一致性(gender agreement)以及短語(yǔ)中主詞與補(bǔ)充成分之間的限制等。為了方便地處理一致性的現(xiàn)象,語(yǔ)法形式應(yīng)進(jìn)行擴(kuò)展以使的成分(constituent)可以帶有特征(feature)。例子:引入特征NUMBER后可寫如下增強(qiáng)的CFG:NPART N僅當(dāng)NUMBER1和NUMBER2一致若不采用特征,上述的文法

3、規(guī)則可以等價(jià)于下面兩條規(guī)則,但顯然這樣將使得文法的大小加倍: NPSINGARTSING NSINGER NPPLURALART PLURAL NPLURAL結(jié)論:使用特征將既保持文法大小又能處理一致性限制。特征結(jié)構(gòu)介紹特征結(jié)構(gòu)(feature structure):定義成分(constituent)相關(guān)屬性的從特征(feature)到值(value)的映射關(guān)系。例子:ART1: (CAT ART ROOT a NUMBER s)一種簡(jiǎn)寫方式:ART1: (ART ROOT a NUMBER s)特征結(jié)構(gòu)可以用來(lái)表示更大的成分,這時(shí)特征結(jié)構(gòu)本身可以作為值?;谡麛?shù)(1、2、3)的特殊特征代表第

4、幾(1、2、3)個(gè)的子成分例子:NP1: (NP NUMBER s 1(ART ROOT a NUMBER s) 2(N ROOT fish NUMBER s)NPARTNsafishasNUMBER NUMBERROOTROOTNUMBER21用特征結(jié)構(gòu)描述增強(qiáng)的文法規(guī)則有了特征結(jié)構(gòu)后就可以用它們來(lái)描述增強(qiáng)的語(yǔ)法規(guī)則。為了使一條規(guī)則能夠適用一個(gè)較寬范圍的情況,我們將允許變量(variable)作為特征值。例如:(NP NUMBER ?n)(ART NUMBER ?n) (N NUMBER ?n)根據(jù)上述規(guī)則,下面的成分將不是合法成分: (NP 1(ART NUMBER s) (NP NUMB

5、ER s 2(N NUMBER s) 1(ART NUMBER s) 2(N NUMBER p)變量還可以用來(lái)表明成分中的歧義。例如:fish可以作為單數(shù)或復(fù)數(shù),可以在辭典中為之定義兩個(gè)條目,也可以使用變量而僅定義如下單一的條目:(N ROOT fish NUMBER ?n)受限變量(constrained variable):其值只能取自特定序列的變量。例如:(N ROOT fish NUMBER ?ns p)可以簡(jiǎn)化為:(N ROOT fish NUMBER s p)返回4.2 英語(yǔ)的一些基本特征系統(tǒng)人稱與數(shù)(Person and Number)特征前面的章節(jié)中我們已經(jīng)看到英語(yǔ)中的數(shù)的系統(tǒng)

6、:即,單詞可以劃分為單數(shù)詞或復(fù)數(shù)詞。此外在英語(yǔ)中,主語(yǔ)和動(dòng)詞之間還必須滿足人稱(person)的一致性。人稱有三種取值,包括:第一人稱(1)、第二人稱(2)和第三人稱(3)。由于數(shù)和人稱這兩個(gè)特征經(jīng)常是一起發(fā)生的,故一般將它們合起來(lái)定義為一個(gè)特征AGR。該特征可取以下值:1s、2s、3s、1p、2p、3p (第一人稱單數(shù)、第二人稱單數(shù)、第三人稱單數(shù)、第一人稱復(fù)數(shù)、第二人稱復(fù)數(shù)、第三人稱復(fù)數(shù))。例子:is只能用于第三人稱單數(shù)故其AGR特征應(yīng)為1s。而are可適用第二人稱單數(shù)和其他復(fù)數(shù)形式,故起AGR特征應(yīng)為一個(gè)變量,即2s 1p 2p 3p。動(dòng)詞形式(VerbForm)特征和動(dòng)詞子類英語(yǔ)中另一個(gè)

7、重要的特征類是動(dòng)詞的形式??梢远x相應(yīng)的特征VFORM來(lái)表示。該特征可以取以下值:base:基本形式(例如:go,be,say)pres:現(xiàn)在時(shí)(例如:go,goes,am,is,say,says)past:過(guò)去時(shí)(例如:went,was,said)fin:限定形式(等價(jià)于pres past)ing:現(xiàn)在分詞(例如:going,being,saying)pastprt:過(guò)去分詞(例如:gone,been,said)inf:不定式為處理詞和其補(bǔ)充成分之間的相互作用,我們使用特征:SUBCAT。表4.2列出了動(dòng)詞的SUBCAT特征可取的部分值:值范例動(dòng)詞例句_nonelaughJack laugh

8、ed._npfindJack found a key._np_npgiveJack gave Sue the paper._vp : infwantJack wants to fly._np_vp : inftellJack told the man to go_vp:ingkeepJack keeps hoping for the best._np_vp : ingcatchJack caugth Sam looking at his desk._np_vp : basewatchJack watched Sam look at his desk.圖4.2 NP/VP組合的SUBCAT值實(shí)例

9、:(VP)(V SUBCAT _np_vp : inf) (NP)(VP VFORM inf)許多動(dòng)詞可帶介詞短語(yǔ),不同動(dòng)詞所帶介詞短語(yǔ)起不同的作用。為此可以為介詞短語(yǔ)引入特征:PFORM(見圖4.3)。許多動(dòng)詞還可以帶子句,根據(jù)引導(dǎo)詞的不同可以為句子引入特征:COMP。它可取的值主要有:for,that和nocomp。根據(jù)上述兩點(diǎn),動(dòng)詞可以進(jìn)一步被分類(見圖4.4)。值范例介詞例句TOtoI gave it to the bank.LOCin , on , by , inside , on top ofI put it on the desk.MOTto , from , along , I

10、 walked to the store.圖4.2 介詞短語(yǔ)PFORM特征的一些值值范例動(dòng)詞 例句_np_pp : togiveJack gave the key to the man._pp : locbeJack is at the store._np_pp : locputJack put the box in the corner._pp : motgoJack went to the store._np_pp : mottakeJack took the hate to the party_adjpbe,seemJack is happy._np_adjpkeepJack kept

11、the dinner hot._s : thatbelieveJack believed that the world was flat._s : forhopeJack hoped for the man to win the prize.圖4.4 附加的SUBCAT值實(shí)例:(VP)(V SUBCAT _np_pp : loc) (NP)(PP PFORM LOC)關(guān)于二值特征和特征的缺省值二值特征:有一些特征是二值特征,一個(gè)成分要么具有該特征要么不具有。二值特征的值是或,它們經(jīng)常被作為前綴。例如:若以INV特征表示一個(gè)句子是否為倒裝句,則句子Jack laughed .的INV特征值為(或

12、具有特征INV)。而句子Did Jack laugh?的INV特征值為(或具有特征INV)。特征的缺省值(default value):當(dāng)一個(gè)成分被創(chuàng)建為具有某特征而又沒有指定該特征的值時(shí),該特征的缺省值將為。這對(duì)二值特征尤其有用,但同樣也可用于非二值特征。它保證了以后對(duì)該特征的一致性檢查都將失敗。缺省值是在成分第一次被創(chuàng)建時(shí)插入的。返回4.3 詞法分析和辭典利用詞法分析來(lái)減少辭典的條目在定義文法之前應(yīng)先定義一個(gè)辭典。辭典必須包含所可能用到所有不同詞的信息,包括所有相關(guān)的特征值限制。當(dāng)一個(gè)詞有歧義,則它在辭典中應(yīng)相應(yīng)地具有多個(gè)條目。由于英語(yǔ)單詞有一些規(guī)則的詞法模式,例如:英語(yǔ)中絕大多數(shù)的動(dòng)詞都

13、使用相同的后綴(-s,-ed)來(lái)表明其不同的形式。因此在辭典中不必包含單詞的每種形式。主要的思想就是:在辭典中僅存儲(chǔ)詞的基本形式條目,使用上下文無(wú)關(guān)規(guī)則把基詞和后綴組合從而推導(dǎo)出其他條目。在這中間還要使用3.7節(jié)介紹的方法。在使用了這種方法后大大減少了辭典的條目。例如,原來(lái)對(duì)于動(dòng)詞want,在詞典中會(huì)有六個(gè)條目:want(基本形式和現(xiàn)在時(shí))、wants、wanting、wanted(過(guò)去時(shí)和過(guò)去分詞)現(xiàn)在就只要一個(gè)條目:want(基本形式)例如:給定如下規(guī)則:(V ROOT ?r SUBCAT ?s VFORM pres AGR 3s) (V ROOT ?r SUBCAT ?s VFORM b

14、ase)(S)則結(jié)合辭典條目:want: (V ROOT want SUCAT _np _vp:inf _np_vp:inf VFORM base)在給定輸入want-s時(shí)將生成如下成分:want: (V ROOT want SUCAT _np _vp:inf _np_vp:inf VFORM pres AGR 3s)對(duì)于非第三人稱單數(shù)的動(dòng)詞形式可由下述規(guī)則處理:(V ROOT ?r SUBCAT ?s VFORM pres AGR 1s 2s 1p 2p 3p) (V ROOT ?r SUBCAT ?s VFORM base)但上述的規(guī)則是不完善的,它在處理不規(guī)則動(dòng)詞(如:be)時(shí)將產(chǎn)生錯(cuò)誤

15、,故應(yīng)引入二值特征IRREG-PRES。具有特征IRREG-PRES表示具有不規(guī)則現(xiàn)在時(shí)形式的動(dòng)詞(類似的規(guī)則IRREG-PAST等也將引入)。則正確的規(guī)則如下表所示:現(xiàn)在時(shí):1 (V ROOT ?r SUBCAT ?s VFORM pres AGR 3s) (V ROOT ?r SUBCAT ?s VFORM base IRREG-PRES ) S2 (V ROOT ?r SUBCAT ?s VFORM pres AGR 1s 2s 1p 2p 3p) (V ROOT ?r SUBCAT ?s VFORM base IRREG-PRES )過(guò)去時(shí):3 (V ROOT ?r SUBCAT ?s

16、 VFORM past AGR 1s 2s 3s 1p 2p 3p) (V ROOT ?r SUBCAT ?s VFORM base IRREG-PAST ) ED過(guò)去分詞:4 (V ROOT ?r SUBCAT ?s VFORM pastprt) (V ROOT ?r SUBCAT ?s VFORM base EN-PASTPRT ) ED5 (V ROOT ?r SUBCAT ?s VFORM pastprt) (V ROOT ?r SUBCAT ?s VFORM base EN-PASTPRT ) EN現(xiàn)在分詞:6 (V ROOT ?r SUBCAT ?s VFORM ing) (V R

17、OOT ?r SUBCAT ?s VFORM base) ING名詞復(fù)數(shù):7 (N ROOT ?r AGR 3p) (N ROOT ?r AGR 3sIRREG-PL ) S文法4.5 普通動(dòng)詞和名詞后綴的一些詞類規(guī)則簡(jiǎn)化辭典條目寫法在定義了一大套特征后,要寫辭典的條目就顯得非常麻煩。下面幾個(gè)技巧可以用來(lái)簡(jiǎn)化辭典條目的寫法:允許特征的缺省值。有了這種能力后,如果一個(gè)辭典條目對(duì)于特定的特征取缺省值,那么該特征值就不必顯式地聲明了。允許辭典中把一串特征定義為一個(gè)單一的符號(hào),在具體的辭典條目中就使用該符號(hào)來(lái)代表相應(yīng)的一串特征。此外,還可以采用一些附加的技巧允許特征的繼承。a:(CAT ART ROO

18、T A1 AGR 3s)is:(CAT V ROOT BE1 VFORM pres SUBCAT _adjp _np AGR 3s)see:(CAT V ROOT SEE1 VFORM base SUBCAT _np IRREG-PAST + EN-PASTPRT +)Jack:(CAT NAMEAGR 3s)the:(CAT ART ROOT THE1 AGR 3s 3p)be:(CAT V ROOT BE1 VFORM base IRREG-PRES + IRREG-PAST + EN-PASTPRT + SUBCAT _adjp _np)man:(CAT N ROOT MAN1 AGR

19、3s)to:(CAT TO)man:(CAT N ROOT MAN1 AGR 3p)cry:(CAT V ROOT CRY1 VFORM base SUBCAT _none)want:(CAT V ROOT WANT1 VFORM base SUBCAT _np _vp:inf _np_vp:inf)saw:(CAT N ROOT SAW1 AGR 3s)dog:(CAT N ROOT DOG1 ARG 3s)was:(CAT V ROOT BE1 VFORM past AGR 1s 3s SUBCAT _adjp _np)saw:(CAT V ROOT SAW2 VFORM base SUB

20、CAT _np)fish:(CAT N ROOT FISH1 AGR 3s 3p IRREG-PL +)happy: (CAT ARJSUBCAT _vp:inf)saw:(CAT V ROOT SEE1 VFORM past SUBCAT _np)he:(CAT PRO ROOT HE1 ARG 3s)seed:(CAT N ROOT SEED1 ARG 3s)were: (CAT V ROOT BE1 VFORM past AGR 2s 1p 2p 3p SUBCAT _adjp _np)一個(gè)簡(jiǎn)單辭典返回4.4 一個(gè)使用特征的簡(jiǎn)單文法一些用于簡(jiǎn)化文法規(guī)則寫法的慣例省略特征:由于某些特征值只

21、能隸屬于特定的特征,因此在寫文法規(guī)則時(shí)就可以省略該特征而僅列出由方括弧包含的特征值。例如:成分(VP SUBCAT inf)可以寫成VPinf。對(duì)于二值特征則由于其值不具唯一性,采用其他的慣例,舉例說(shuō)明如下:成分(C B )應(yīng)寫成C+B。應(yīng)用主特征:許多特征都限制使得父成分(constituent)的特征值必須與主要子成分(head subconstituent)的特征值一致,它們被稱為主特征(head feature)。如果主特征先單獨(dú)聲明,系統(tǒng)就能夠根據(jù)需要自動(dòng)地把它們加到規(guī)則中,這樣相應(yīng)的規(guī)則就可以簡(jiǎn)化。例:把VFORM和AGR聲明為主特征后可簡(jiǎn)化規(guī)則:(VP VFORM ?v AGR

22、?a) (V VFORM ?v AGR ?a SUBCAT _np_vp:inf) (NP) (VP VFORM inf)為:VP (V SUBCAT _np_vp:inf) NP (VP VFORM inf)進(jìn)一步為:VP V_np_vp:inf NP VPinf一個(gè)使用特征的簡(jiǎn)單文法 1、S-inv(NP AGR ?a) (VPpres past AGR ?a) 2、NP (ART AGR ?a) (N AGR ?a) 3、NP PRO 4、VP V_none 5、VP V_np NP 6、VP V_vp:inf VPinf 7、VP V_np_vp:inf NP VPinf 8、VP V

23、_adjp ADJP 9、VP TO VPbase10、ADJP ADJ11、ADJP ADJ _vp:inf VPinfS和VP的主特征:VFORM和AGRNP的主特征:AGR例子:S-inv(NP AGR ?a) (VPpres past AGR ?a)可以做如下擴(kuò)展:(S INV ) (NP AGR ?a) (VP VFORM ?vpres past AGR ?a) (S INV VFORM ?vpres past AGR ?a) (NP AGR ?a) (VP VFORM ?vpres past AGR ?a)簡(jiǎn)化形式也可以用在分析樹中,例如:S3sNP3sVPpres,3sART3s

24、N3sVpres,3s,_nonethemancriesS3sNP3sVPpres,3sPRO3sVpres,3s,_vp:infhewantsVPinfVPbaseTOVbase,_adjpADJPtobehappy 1、S-inv(NP AGR ?a) (VPpres past AGR ?a) 2、NP (ART AGR ?a) (N AGR ?a) 3、NP PRO 4、VP V_none 5、VP V_np NP 6、VP V_vp:inf VPinf 7、VP V_np_vp:inf NP VPinf 8、VP V_adjp ADJP 9、VP TO VPbase10、ADJP AD

25、J11、ADJP ADJ _vp:inf VPinfS和VP的主特征:VFORM和AGRNP的主特征:AGR對(duì)于本節(jié)提供的簡(jiǎn)單文法,下面句子將不能被接受:The men cries.The man cry.The man saw to be happyHe wants.He wants the man saw the dog.man:(CAT N ROOT MAN1 AGR 3s)men:(CAT N ROOT MAN1 AGR 3p)cry:(CAT V ROOT CRY1 VFORM base SUBCAT _none)saw:(CAT V ROOT SEE1 VFORM past SUB

26、CAT _np)want:(CAT V ROOT WANT1 VFORM base SUBCAT _np _vp:inf _np_vp:inf)返回4.5 使用特征進(jìn)行分析成分(constituent)與規(guī)則(rule)匹配算法的推廣上一章的分析算法可以被擴(kuò)展以處理增強(qiáng)的上下文無(wú)關(guān)文法,這里牽涉到的是對(duì)其中成分(constituent)與規(guī)則(rule)匹配算法的推廣。在圖表分析算法中,廣泛使用的是如下弧擴(kuò)展操作:成分X擴(kuò)展?。篊C1Ci XCn,產(chǎn)生新弧:CC1Ci X Cn弧擴(kuò)展的能進(jìn)行的前提是,成分X和能和規(guī)則中待處理的成分(在 后的成分)相匹配。對(duì)于具有特征的文法,這種匹配操作也是類似

27、的。只是分析器必須在源弧能被X擴(kuò)展之前給其中變量一個(gè)具體值。精確地定義這種匹配操作的關(guān)鍵是記住帶特征的文法規(guī)則的定義。新的弧擴(kuò)展算法可以具體地描述如下:算法:對(duì)與給定一條活動(dòng)弧A,稱其中緊跟在點(diǎn)( )后的成分為NEXT。又設(shè)用來(lái)擴(kuò)展弧A的新成分為X。則擴(kuò)展弧A應(yīng)作如下工作:a、給變量具體化(instantiate),這樣NEXT中指定的所有特征在X中均能找到b、創(chuàng)建一條新弧A,該弧除了第a步中的做具體化時(shí)確定的變量外,其余部分完全拷貝自弧A。c、按圖表分析器的通常操作修改弧A例:設(shè)弧1(NP AGR ?a) (ART AGR ?a) (N AGR ?a)現(xiàn)要用成分(ART ROOT A AGR

28、 3s)將其擴(kuò)展。解:使用上述算法,令A(yù)=弧1。NEXT= (ART AGR ?a)X= (ART ROOT A AGR 3s)。第a步,NEXT和X匹配,將變量?a具體化為3s。第b步,創(chuàng)建如下的新弧(弧2):2 (NP AGR 3s) (ART AGR 3s) (N AGR 3s)第c步,弧2被擴(kuò)展成弧3:3 (NP AGR 3s) (ART AGR 3s) (N AGR 3s)牽涉到受限變量時(shí)變量instantiate結(jié)果如果規(guī)則中的變量是受限變量,則該變量綁定結(jié)果應(yīng)是該受限變量取值范圍中的一個(gè)。如果成分中的帶的是受限變量,則其可能取值中至少要有一個(gè)滿足規(guī)則的要求。如果規(guī)則和成分中都是受

29、限變量,則綁定結(jié)果應(yīng)是兩者的交集。例如:前例,若用 (ART ROOT the AGR ?v3s 3p)擴(kuò)展弧一則結(jié)果將為:(NP AGR ?v3s 3p) (ART AGR ?v3s 3p) (N AGR ?v3s 3p)而根據(jù)前面討論的結(jié)果,它還可進(jìn)一步地被(N ROOT dog AGR 3s)所擴(kuò)展。在記錄分析結(jié)構(gòu)時(shí)很有用的一個(gè)擴(kuò)展就是:當(dāng)一條弧被擴(kuò)展時(shí),分析器自動(dòng)插入子成分特征(基于數(shù)字,代表第幾個(gè)子過(guò)程)PRO1 CAT PRO AGR 3sV1 CAT V ROOT want VFORM pres AGR 3s SUBCAT _np _vp:inf _np_vp:infTO1 CA

30、T TOV2 CAT V ROOT cry VFORM base SUBCAT _noneNP1 CAT NP AGR 3s 1 PRO1NP1 CAT VP VFORM base 1 V2VP2 CAT VP VFORM inf 1 TO1 2 VP1VP3 CAT VP VFORM pres AGR 3s 1 V1 2 VP2S1 CAT S AGR 3s VFORM pres INV - 1 NP1 2 VP3 1、(S INV VFORM ?vpres past AGR ?a) (NP AGR ?a) (VP VFORM ?vpres past AGR ?a) 2、(NP AGR ?a

31、) (ART AGR ?a)(N AGR ?a) 3、(NP AGR ?a)(PRO AGR ?a) 4、(VP AGR ?a VFORM ?v) (V SUBCAT _none AGR ?a VFORM ?v) 5、(VP AGR ?a VFORM ?v) (V SUBCAT _np AGR ?a VFORM ?v) NP 6、(VP AGR ?a VFORM ?v) (V SUBCAT _vp:inf AGR ?a VFORM ?v) (VP VFORM inf) 7、(VP AGR ?a VFORM ?v) (V SUBCAT _np_vp:inf AGR ?a VFORM ?v) NP

32、 (VP VFORM inf) 8、(VP AGR ?a VFORM ?v) (V SUBCAT _adjp AGR ?a VFORM ?v) ADJP 9、(VP SUBCAT inf AGR ?a VFORM inf) (TO AGR ?a VFORM inf) (VP VFORM base) 10、ADJPADJ 11、ADJP (ADJ SUBCAT inf)(VP VFORM inf)一個(gè)分析實(shí)例Hewantstocry返回4.6 增強(qiáng)的轉(zhuǎn)移網(wǎng)絡(luò)增強(qiáng)的轉(zhuǎn)移網(wǎng)絡(luò)的介紹及相關(guān)術(shù)語(yǔ)前面介紹的特征同樣也可以加到遞歸轉(zhuǎn)移網(wǎng)絡(luò)(RTN)中。這將產(chǎn)生增強(qiáng)的轉(zhuǎn)移網(wǎng)絡(luò)(ATN)。在ATN中特征被稱為寄

33、存器(register);寄存器的值由動(dòng)作(action)設(shè)定,這些動(dòng)作和弧相聯(lián)系。測(cè)試(test)用來(lái)定義一致性檢查,測(cè)試成功返回非空值,否則返回空集或nil。每當(dāng)push入一個(gè)新的網(wǎng)絡(luò)時(shí),一組新的寄存器被創(chuàng)建。在穿過(guò)該網(wǎng)絡(luò)的過(guò)程中,這些寄存器被賦值。最后當(dāng)從網(wǎng)絡(luò)中pop出來(lái)時(shí),這些寄存器將被用來(lái)生成新的成分,而由變量返回。當(dāng)經(jīng)過(guò)一條詞類邊時(shí),根據(jù)讀入詞所建立起來(lái)的成分放在變量中。例如下圖:NPNP1NP2name312nartpop弧 測(cè)試動(dòng)作DET:=AGR:=AGRnone1HEAD:=AGR:= AGR AGRAGR AGR2NAME=AGR=AGRnone3弧測(cè)試動(dòng)作SUBJ:=n

34、one4MAIN-V:=AGR:= AGRSUBJ AGRAGRSUBJ AGR5OBJ=none6SS1S2S3NPvNPpop456在S網(wǎng)絡(luò)中步驟節(jié)點(diǎn)位置弧寄存器1S1弧4SUBJ(NP DET the HEAD dog AGR 3s)5S13弧5 (檢查3s1s 2s 3s 1p 2p 3p)MAIN-Vsaw AGR3s6S24弧6OBJ(NP NAME Jack AGR 3s)9S35pop弧返回(S SUBJ (NP DET the HEAD dog AGR 3s) MAIN-Vsaw AGR3s OBJ(NP NAME Jack AGR 3s)第一個(gè)NP調(diào)用:弧4步驟節(jié)點(diǎn)位置弧寄

35、存器2NP1弧1DETthe AGR3s 3p3NP12弧2(檢查3s 3p3s)HEADdog AGR3s4NP23pop弧返回(NP DET the HEAD dog AGR 3s)第二個(gè)NP調(diào)用:弧6步驟節(jié)點(diǎn)位置弧寄存器7NP4弧3NAMEJohn AGR3s8NP25pop弧返回(NP NAME Jack AGR 3s)利用ATN分析的實(shí)例簡(jiǎn)單陳述句的ATN文法SS2S3S4NPvNPpop111S52121 NPPPjumpjump2弧測(cè)試動(dòng)作S/1noneSUBJ :=MOOD := DECLS2/1AGRSUBJAGRMAIN-V :=S3/1SUBCATMAIN-V _np _

36、np_npOBJ :=SUBCAT := SUBCATMAIN-V_np _np_npS3/2SUBCATMAIN-V_noneSUBCAT :=_noneS4/1SUBCATMAIN-V_np_npIOBJ := OBJOBJ := S5/1noneMODS :=Append(MODS,)弧測(cè)試動(dòng)作NP/1noneDET :=AGR := AGRNP/2nonePRO :=NP/3AGR3pHEAD :=AGR := AGRNP/4noneNAME :=NP2/1noneADJS := Append(ADJS,)NP2/2AGRAGRHEAD :=AGR := AGRAGRNP3/1none

37、MODS :=Append(MODS,)NPNP2artnpop12NP321PP1adj234pronnamePPPP1prepNPpop11PP21弧測(cè)試動(dòng)作PP/1noneP :=PP1/1nonePOBJ :=預(yù)設(shè)寄存器對(duì)ATN中特征處理機(jī)制的進(jìn)一步擴(kuò)充就是增加當(dāng)一個(gè)網(wǎng)絡(luò)被調(diào)用時(shí)預(yù)先設(shè)定其中寄存器值的能力。這種機(jī)制用來(lái)向網(wǎng)絡(luò)傳遞信息,以幫助分析出新的成分。操作 SENDR 實(shí)現(xiàn)了這種機(jī)制。返回4.7 確定子句文法(Definite Clause Grammar)在PROLOG規(guī)則中加入一致性我們可以通過(guò)向每個(gè)謂詞加入額外的參數(shù)而使之帶有特征。例如我們可以通過(guò)向與每個(gè)數(shù)特征相關(guān)的謂中加入

38、額外的參數(shù)number而強(qiáng)制數(shù)的一致性。下面是一個(gè)相應(yīng)文法的例子:1np(P1,Number,P3) :- art(P1,Number,P2),n(P2,Number,P3)2art(I,Number,O) :- word(Word,I,O),isart(Word,Number)3isart(a,3s) :-4isart(the,3s) :-5isart(the,3p) :-6n(I,Number,O) :- word(Word,I,O),isnoun(Word,Number)7isnoun(dog,3s) :-8isnoun(dogs,3p) :-確定子句文法(Definite Clause

39、 Grammar)為了描述文法,他多數(shù)基于邏輯的文法系統(tǒng)提供了一種更方便的格式,它可以自動(dòng)地被轉(zhuǎn)化為PROLOG子句。每個(gè)謂詞中詞的位置參數(shù)可被省略而由系統(tǒng)自動(dòng)加入。代表終結(jié)符的謂詞是系統(tǒng)地定義的,故也可將它們省略,系統(tǒng)會(huì)自動(dòng)生成這些規(guī)則。確定子句文法(DCG)就是實(shí)現(xiàn)上述省略的一種格式。它和增強(qiáng)的CFG看起來(lái)很像。我們還可以在其中參數(shù)的位置用一個(gè)特征結(jié)構(gòu)代替,看起來(lái)就更象了。下面是文法4.7的DCG版本。1s(inv - agr Agr)np(agr Agr),vp(agr Agr vform pres)2np(agr Agr2) art(agr Agr2),n(agr Agr2)3np(a

40、gr Agr3) pro(agr Agr3)4vp(agr Agr4 vform Vf3) v(subcat _none agr Agr4 vform Vf3)5vp(agr Agr4 vform Vf3) v(subcat _np agr Agr4 vform Vf3),np()返回4.8 擴(kuò)展的特征系統(tǒng)和合一文法合一文法(unification grammar)及有關(guān)術(shù)語(yǔ)介紹合一文法:由特征結(jié)構(gòu)與特征結(jié)構(gòu)之間的一組限制定義的文法稱為合一文法。擴(kuò)展(extend):若特征結(jié)構(gòu)F2中的每個(gè)特征值在特征結(jié)構(gòu)F1中均有定義,則稱F1擴(kuò)展了F2或F1比F2更特殊。例如:特征結(jié)構(gòu)(CAT VROOT

41、cry)擴(kuò)展了特征結(jié)構(gòu)(CAT V),而(CAT V ROOT cry)和(CAT V VFORM pres)兩個(gè)特征結(jié)構(gòu)則不具有擴(kuò)展關(guān)系(extension relation)。合一(unify):對(duì)于給定的兩個(gè)特征結(jié)構(gòu),如果存在一個(gè)特征結(jié)構(gòu)是它們的擴(kuò)展,則稱這兩個(gè)特征結(jié)構(gòu)合一。最一般合一者(most general unifier):兩個(gè)特征結(jié)構(gòu)所共有的擴(kuò)展中最小的特征結(jié)構(gòu)稱為這兩者的最一般合一者。例子:(CAT V ROOT VFORM pres)為上述后一組后一組特征結(jié)構(gòu)的最一般合一者。(CAT V AGR 3s)和(CAT V AGR 3p)不能合一。延長(zhǎng)也可用在可選值(disjun

42、ctive value)中,例如:(AGR 3s)延長(zhǎng)了(AGR 3s 3p)我們只要利用合一的概念就可以具體說(shuō)明一個(gè)文法了,因?yàn)樗刑卣饕恢滦詸z查和處理都能用合一關(guān)系(unification relationship)這一術(shù)語(yǔ)加以指出。文法4.7中的規(guī)則SNP VP可用如下合一文法來(lái)表示:X0 X1 X2CAT0=SCAT1=NPCAT2=VPAGR0=AGR1=AGR2VFORM0=VFORM2或簡(jiǎn)寫為:S NP VPAGR=AGR1=AGR2VFORM=VFORM2用DAG表示特征結(jié)構(gòu)通過(guò)特征結(jié)構(gòu)表示為有向無(wú)環(huán)圖(DAG),可以精確地定義合一。在描述特征結(jié)構(gòu)的DAG中,每個(gè)成分和值都表示為節(jié)點(diǎn),而特征則表示為帶有標(biāo)號(hào)的弧。例如:下面左邊的成分就可以表示為右圖:N1:(CAT N ROOT fish AGR 3s 3pDAG中,沒有入度的節(jié)點(diǎn)稱為源(source)。特征結(jié)構(gòu)DAG中只有唯一的源節(jié)點(diǎn),稱為根節(jié)點(diǎn)(root node)。DAG中,沒有出度的節(jié)點(diǎn)稱為槽(sink)。特征結(jié)構(gòu)的槽上標(biāo)有原子特征或一組特征。下面將用圖形匹配算法來(lái)定義兩個(gè)特征結(jié)構(gòu)的合一:它接收兩個(gè)有根的圖,返回這兩個(gè)圖的合一圖。要合一以Ni為根的DAG和以Nj為根的DAG應(yīng)做如下工作:1、若Ni和Nj相等,則成功返回Ni;2、若Ni和Nj均為槽節(jié)點(diǎn),那么如果兩者的標(biāo)號(hào)具有非空交集,則返

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論