符號表的組織和管理演示文稿_第1頁
符號表的組織和管理演示文稿_第2頁
符號表的組織和管理演示文稿_第3頁
符號表的組織和管理演示文稿_第4頁
符號表的組織和管理演示文稿_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

符號表的組織和管理演示文稿當前1頁,總共23頁。(優(yōu)選)符號表的組織和管理當前2頁,總共23頁。例C語言的變量聲明shortinta;floatb=0.0;把標識符a聲明為短整數(shù)型,把b聲明為浮點類型,而且初始化為0。那么,編譯程序?qū)γ總€變量要記錄它的類型,以便執(zhí)行類型檢查和分配存儲,比如短整型變量i占2個字節(jié);要記錄它在存儲器中的位置(相對位移或絕對地址),以便目標程序運行時訪問;若像b有初始值,則還需要記錄這個初始值。當前3頁,總共23頁。(2)查找符號的屬性符號表存放了源程序中的各種類型的信息,比如數(shù)值、變量類型、參數(shù)傳遞的地址等,在分析和翻譯源程序的過程中會被不斷地查詢。例如,對于上述的變量聲明,如果源程序有代碼

a+b時,就需要查找、計算表達式中運算數(shù)的類型和值,以便計算出表達式。又如,在源程序中如果出現(xiàn)了函數(shù)調(diào)用factory(6),編譯程序就需要查找到factory的聲明,找到實參6的地址并傳給形參n,執(zhí)行函數(shù)factory的體,并返回值等。當前4頁,總共23頁。(2)檢查符號的合法性例如,對于上述聲明,代碼a=a+b,C語言的編譯將檢查變量a和b的類型,把表達式a+b的結(jié)果轉(zhuǎn)換成短整型,僅取整數(shù)部分進行賦值。在其它強類型語言,如Pascal和Ada,表達式運算數(shù)的類型必須一致,不能進行隱式類型轉(zhuǎn)換,對于這樣的表達式a+b,編譯程序在語義分析的過程中將發(fā)現(xiàn)并報告類型錯誤的信息。又如,面向?qū)ο笳Z言的繼承性和多態(tài)性允許同一個消息在不同的環(huán)境中調(diào)用不同的方法(函數(shù)),即調(diào)用同名但在不同的類中實現(xiàn)的方法。這就需要編譯或者運行時在方法的符號表中查詢在參數(shù)、返回數(shù)以及方法方面名字一致的實現(xiàn)。當前5頁,總共23頁。(3)作為目標代碼生成階段地址分配的依據(jù)標識符由它定義的存儲類型或它在程序中的位置來確定。首先是要確定變量存儲的區(qū)域。例如,在Java語言中,整數(shù)的類型(以及所占用的字節(jié))有byte(1個字節(jié))、short(2個字節(jié))、int(4個字節(jié))以及l(fā)ong(8個字節(jié)),而float類型占4個字節(jié),double類型占8個字節(jié)。又如,對寄存器變量,編譯將盡可能地把它們保留在機器的寄存器當中,以提高運行速度;而對在一個文件中定義的外部變量,它們要在不同的源程序文件之間訪問,需要編譯程序把它們放在所有源程序文件都可以方便尋找到的存儲器的位置。其次,要根據(jù)標識符出現(xiàn)的順序,決定標識符在某個存儲區(qū)域中的具體位置,而有關(guān)區(qū)域的標志及其相對位置都是作為該標識符的語義信息存放在它的符號表中的。當前6頁,總共23頁。5.2符號表的主要屬性及其作用不同的符號類別包含了不同的屬性,由于它們的信息不同,也就導(dǎo)致了符號表的組織有較大的差別。例如,數(shù)量類型的變量名字和過程名字:對于一個變量名要記錄其類型(如整型、實型、布爾型等)、占用的存儲字節(jié)以及相對與某個基準位置的相對位置;對一個過程名要記錄的屬性包括參數(shù)的個數(shù)及其類型,該過程是否有返回值,過程中的變量聲明,甚至過程聲明(如果像Pascal語言允許嵌套過程聲明)等信息。

不同的程序語言規(guī)定了符號的不同性質(zhì)以及語法、語義和規(guī)則,幾種基本的符號屬性。當前7頁,總共23頁。(1)符號名語言中的符號名通常用標識符來表示。根據(jù)語言的定義,程序中出現(xiàn)的重名標識符定義將按照該標識符在程序中的作用域和可視規(guī)則進行相應(yīng)的處理。而在程序的運行過程中,符號表中的符號名始終是唯一的標志。在一些允許操作重載、類繼承的語言中,函數(shù)名、操作名允許重名,對于重載操作的標識符,它們可以通過參數(shù)的個數(shù)與類型以及返回值的類型來區(qū)別;而對于操作的繼承,編譯器可以構(gòu)造繼承圖,同時保存類結(jié)構(gòu),這樣就可以為每個操作和屬性找到唯一的定義。例如,對應(yīng)不同的參數(shù)類型,可以定義幾個求和重載函數(shù):intsum(inta,intb)doublesum(doublea,doubleb)floatsum(floata,floatb,floatc)當某個函數(shù)中調(diào)用到重載函數(shù)時,編譯器根據(jù)實參的類型和個數(shù)去調(diào)用相應(yīng)的函數(shù)。當前8頁,總共23頁。(2)符號種屬

由于語言中符號所擁有的屬性可能不同,其組織就可以采用不同的數(shù)據(jù)結(jié)構(gòu),可以用符號的種屬來區(qū)別每個符號的基本劃分。根據(jù)不同的語言,符號的種屬可以包括:簡單變量、結(jié)構(gòu)型變量、數(shù)組、過程、類型、類等。可以依據(jù)符號種屬的劃分來組織符號表,一種方式是為每個種屬的標識符建立一張表,這樣,可以對符號表類似地安排組織結(jié)構(gòu)、進行同樣的操作;另外一種方式把所有種屬的標識符統(tǒng)一安排在一張表中,根據(jù)符號的種屬進行條件判斷,對不同種屬的特殊型執(zhí)行不同的存儲安排和操作。當前9頁,總共23頁。(3)符號類型

現(xiàn)代程序語言中的一個重要構(gòu)造就是數(shù)據(jù)類型(類型),它是變量標識符的重要屬性,函數(shù)的數(shù)據(jù)類型指的是該函數(shù)返回值的數(shù)據(jù)類型。現(xiàn)代語言通常都有如下的基本類型:整型、實型、字符型、布爾型、邏輯型等;符號的類型屬性從源程序中該符號的定義中得到變量符號的數(shù)據(jù)類型屬性不但決定了該變量的數(shù)據(jù)在存儲器中的存儲格式,也規(guī)定了可以對該變量施加的操作運算。每一個變量的類型是符號表中標識符屬性的重要信息。當前10頁,總共23頁。(4)存儲類別

大多數(shù)程序語言對變量的存儲類別采用兩種方式。一種是用關(guān)鍵字指定,例如,在FORTRAN語言中用COMMON來定義公共存儲區(qū)域,允許不同程序段都可以訪問這些數(shù)據(jù);又如,C和C++語言規(guī)定static定義的變量屬于文件的靜態(tài)存儲變量或?qū)儆诤瘮?shù)內(nèi)部的靜態(tài)存儲變量,這些變量在編譯時分配存儲空間,如果定義時沒有初值,編譯器還需要將它們初始化為0。另一種方式是根據(jù)定義變量的聲明在程序中的位置來決定。例如,C++規(guī)定在一個文件中定義的變量缺省為外部的,即程序的公共存儲變量;而在函數(shù)體內(nèi)缺省存儲類別關(guān)鍵字所定義的變量是內(nèi)部變量,是屬于該函數(shù)體所獨有的私有存儲變量,因而是動態(tài)地分配存儲空間。區(qū)別符號存儲類型地屬性是編譯過程中語義處理、檢查和存儲分配的重要依據(jù)。符號的存儲類別同時還決定了符號變量的作用域、可見性和它的生命周期等性質(zhì)。當前11頁,總共23頁。(5)作用域一個標識符在程序中起作用的范圍稱為其作用域。一般來說,定義一個符號的位置及存儲類型就決定了該符號的作用域,就是它可以出現(xiàn)的場合,可以在程序中作為參數(shù)、表達式的運算數(shù)等被引用。C語言中外部變量的作用域是整個程序,一個外部符號的定義在整個策劃能夠許中只能出現(xiàn)一次,為了方便使用和編譯,同名標識符的其它說明可以多次出現(xiàn)。FORTRAN語言中的COMMON變量的作用域則不是整個程序,而只能在定義這個COMMON塊的函數(shù)或過程中引用。面向?qū)ο笳Z言,如C++,的每個類都引入了一個獨立的類域。當前12頁,總共23頁。作用域與可見性

標識符的可見性從另外一個角度說明其有效性,它與作用域有一定一致性。標識符的作用域包含可見范圍,但是,可見范圍不會超過作用域。可見性在理解同名是不是合法的作用域嵌套時十分直觀。對于外層塊域內(nèi)層塊定義的同名標識符,在外層作用域中,內(nèi)層所定義的標識符時不可見的,即外層所引用的是外層所定義的標識符;同樣,在內(nèi)層作用域中,外層的標識符將被內(nèi)層的同名標識符所屏蔽,變得不可見,即外層中同名標識符的可見范圍是作用域中挖去內(nèi)層塊的范圍,在內(nèi)存塊形成了作用域洞。當前13頁,總共23頁。(6)存儲分配信息編譯程序需要根據(jù)符號的存儲類別定義以及它們在程序中出現(xiàn)的位置和順序來確定每一個符號應(yīng)該分配的存儲區(qū)域及其具體位置。通常情況下,編譯為每個符號分配一個相對于某個基址的相對位移,而不是絕對的內(nèi)存地址。當前14頁,總共23頁。(7)其它屬性數(shù)組內(nèi)情向量需要把描述數(shù)組屬性的信息如數(shù)組類型、維數(shù)、每個維的上下界、數(shù)組元素的首地址等登錄在符號表中,以便確定數(shù)組在存儲器占用的空間和數(shù)組元素的確定,并且完成數(shù)組的翻譯。記錄結(jié)構(gòu)型的成員信息一個記錄結(jié)構(gòu)型的變量包含若干成員,每個成員的數(shù)據(jù)類型可以彼此不同,因此,一個記錄結(jié)構(gòu)型變量在存儲分配時所占空間的大小由其成員來確定,而且,對每個成員的訪問還需要它所屬成員排列次序的屬性信息。函數(shù)或過程的形參函數(shù)或過程的形參作為其局部變量,同時又是對外部調(diào)用的接口。每個函數(shù)或過程形參的個數(shù)、類型、排列順序都體現(xiàn)了調(diào)用函數(shù)或過程時的屬性,它們都應(yīng)該反映在符號表中,以便在過程調(diào)用的時候進行參數(shù)傳遞,并且執(zhí)行語義檢查(如處理函數(shù)名的重載)。在面相對象語言中,還必須把一個類或其超類所定義同名方法存放在一個方法表中,指向每個方法的實現(xiàn)操作,以便實現(xiàn)面相對象的繼承性質(zhì)。當前15頁,總共23頁。5.3符號表的組織結(jié)構(gòu)一個編譯程序從詞法分析、語法分析、語義分析到代碼生成的整個過程中,都要不斷地訪問和管理符號表。因此,符號表的組織管理直接關(guān)系到編譯程序的效率。三種常見的符號表的結(jié)構(gòu):線性表、搜索樹和散列表組織線性表組織是按照符號被掃描到的先后順序填寫各個表項,可以用一個多維數(shù)組或多個一維數(shù)組來存放符號的信息。線性表需要兩個指針來方便管理和操作:一個指針指向該符號表的開始位置,另一個指針指向符號表的下一個可用位置。線性表是最基本的數(shù)據(jù)結(jié)構(gòu),可以方便、直接地實現(xiàn)上述的插入、查找和刪除三種基本操作,而且每種的操作時間都是符號表大小的線性函數(shù),對于有N個表項的符號表,這些操作的平均時間都是N/2左右(算法時間復(fù)雜性為Θ(N))。由于線性表無需附加空間,比較節(jié)省存儲。如果編譯器對處理時間要求不高,或者符號個數(shù)不大(如關(guān)鍵字),符號表就可以采用線性表結(jié)構(gòu)。當前16頁,總共23頁。搜索樹結(jié)構(gòu)搜索樹可以在構(gòu)造符號表的同時,按照符號名的字典順序把表項整理排列,提高符號表查找操作的速度。這樣就可以采用折半查找的方式,加快搜索的速度。對于有N個表項的符號表,每次查找最多只需要做logN次比較(因此這種查找法也叫對數(shù)查找法)。但是,由于符號表在編譯過程中是邊填寫邊引用,動態(tài)地建立、更新以及刪除表項,這樣,每增加和刪除一個表項都需要對符號表進行重新排序,這同樣浪費時間。因此,搜索樹結(jié)構(gòu)不適合用于構(gòu)造符號表,除了需要額外的空間構(gòu)造搜索樹以外,整體而言,它們實現(xiàn)這三類操作效率不是最優(yōu),而且刪除操作的實現(xiàn)過于復(fù)雜。

當前17頁,總共23頁。符號表處理的關(guān)鍵問題散列組織統(tǒng)一了查詢與插入操作技術(shù),相對來說具有較高的時空效率,為上述三種操作提供的時間基本上是常數(shù)。特別是散列表結(jié)構(gòu)符合編譯過程邊填寫邊引用符號表的特性,是實現(xiàn)符號表的最佳數(shù)據(jù)結(jié)構(gòu),在實踐中的使用最多。

線性表結(jié)構(gòu)填表快,查詢慢;搜索樹結(jié)構(gòu)查詢快,填表慢。如何保證查詢與插入表項這兩個基本操作的都能高效地完成。當前18頁,總共23頁。散列方法散列方法在表項的存儲位置與它的關(guān)鍵碼之間建立一個確定的對應(yīng)函數(shù)關(guān)系(哈希函數(shù),雜湊函數(shù),hash),使每個關(guān)鍵碼symbol與散列結(jié)構(gòu)(散列表,哈希表,雜湊表)中的唯一的存儲位置相對應(yīng),即hash(symbol)。在搜索時,首先對表項的關(guān)鍵碼用哈希函數(shù)計算出對應(yīng)的表項的存儲位置,在散列表中按此位置取出表項進行比較,若關(guān)鍵碼相等,則搜索成功。在填入表項時,依同樣函數(shù)計算存儲位置,并按此位置存放表項。由于使用這種方法進行搜索時不必多次比較關(guān)鍵碼,因此搜速速度比較快,可以到達逼近具有此關(guān)鍵碼的表項的實際存放地址。當前19頁,總共23頁。對哈希函數(shù)的基本要求①計算簡單、高效;②函數(shù)值能均勻地分布在1和N之間,③對不同的關(guān)鍵碼都返回一個代表存儲位置的不同值。構(gòu)造哈希函數(shù)的算法有許多,例如,若取N為素數(shù),就可以定義哈希函數(shù)為symbol/N的余數(shù),其中symbol是某個符號的代碼。由于語言中的標識符可以相互區(qū)別,它們的代碼值都是不同的。當前20頁,總共23頁。散列沖突的解決不同的關(guān)鍵碼經(jīng)過雜湊運算以后,有可能得到相同的雜湊值,這種現(xiàn)象稱為散列沖突。一種常用的方法是鏈地址法。把有N個地址的散列表改為N個桶,桶號與散列地址一一對應(yīng),第i(1≦i≦N)個桶號即為第i個散列地址,每個桶則是一個線性鏈表(稱為同義詞表),鏈表中的表項具有相同的散列函數(shù)值。若出現(xiàn)了沖突,即一個表項的散列值所對應(yīng)的地址已經(jīng)被占據(jù),則需把這個表項放到該桶的鏈尾或鏈首。當前21頁,總共23頁。5.4名字的作用范圍

名字的聲明和作用域

程序語言中的聲明是把信息聯(lián)系到名字(標識符)的一種語法結(jié)構(gòu)。編程語言中一般包括5類聲明:常量聲明、變量聲明、類型聲明和過程/函數(shù)聲明以及類聲明常量聲明把值聯(lián)解到名字。類型聲明把名字綁定到新構(gòu)造的類型或者為已經(jīng)存在的名字創(chuàng)建一個別名。變量聲明通常把名

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論