版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、編譯原理實踐及應(yīng)用編譯原理實踐及應(yīng)用主講人:董明剛, ,2021年12月11日星期六第2頁教材及主要參考資料教材及主要參考資料 教材教材:編譯原理實踐及應(yīng)用,黃賢英,清華大學(xué)出版社 主要參考資料:主要參考資料: 編譯原理,陳火旺,國防工業(yè)出版社 編譯原理(原書第2版)(龍書) ,ALFRED V.AHO etc著,趙建華 鄭滔等譯 ,機械工業(yè)出版社 ,2008.12 程序設(shè)計語言編譯方法,肖軍模,大連理工大學(xué)出版社 編譯原理,張素琴,呂映芝,清華大學(xué)出版社 更多教材及參考資料參見編譯原理精品課程網(wǎng)站。C語言程序void main( ) int x,y,z; x=3; y=2; z=x+y;內(nèi)存
2、地址內(nèi)存地址 內(nèi)存內(nèi)容內(nèi)存內(nèi)容單元名字單元名字200H3x:局部變量202H2y:局部變量204H5z:局部變量300H3A03302H3AE1304H3A02306H3AE2308HDA6C.3A71匯編語言程序mov ax,3mov x,axmov bx,2mov y,bxadd ax,bxmov z,ax.序言在內(nèi)存中:在內(nèi)存中:數(shù)據(jù)區(qū)代碼區(qū) ?編譯原理概述編譯原理概述第一章第一章 2021年12月11日星期六第5頁本章要求本章要求 主要內(nèi)容主要內(nèi)容:各種翻譯程序的概念,編譯各種翻譯程序的概念,編譯過程和階段劃分,編譯程序的組成和結(jié)過程和階段劃分,編譯程序的組成和結(jié)構(gòu),編譯程序的構(gòu)造方法
3、構(gòu),編譯程序的構(gòu)造方法 重點掌握:重點掌握:編譯程序工作的基本過程及編譯程序工作的基本過程及其各階段的基本任務(wù),編譯程序總框。其各階段的基本任務(wù),編譯程序總框。2021年12月11日星期六第6頁1.1 程序設(shè)計語言與翻譯程序程序設(shè)計語言與翻譯程序 機器語言機器語言 (machine language) C7 06 0000 0002 匯編語言匯編語言 (assembler language) MOV X , 2 高級語言高級語言 (high-level language) X = 2為什么要使用編譯程序?為什么要使用編譯程序?2021年12月11日星期六第7頁 機器語言機器語言 (machin
4、e language) C7 06 0000 0002 匯編語言匯編語言 (assembler language) MOV X , 2 高級語言高級語言 (high-level language) X = 2為什么要使用編譯程序?為什么要使用編譯程序?2021年12月11日星期六第8頁計算機中的語言層次和翻譯程序計算機中的語言層次和翻譯程序2021年12月11日星期六第9頁什么叫翻譯程序什么叫翻譯程序 翻譯程序翻譯程序:能夠?qū)⒛撤N語言寫的程序轉(zhuǎn)換成另一種語言的程序,而且后者與前者在邏輯上是等價的。 編譯程序編譯程序:將高級程序設(shè)計語言程序翻譯成邏輯上等價的低級語言(匯編語言,機器語言)程序的翻
5、譯程序。 解釋程序解釋程序:將高級程序設(shè)計語言寫的源程序作為輸入,邊解釋邊執(zhí)行源程序本身,而不產(chǎn)生目標程序的翻譯程序。2021年12月11日星期六第10頁高級語言語言處理程序操作系統(tǒng)匯編語言翻譯程序所處的層次翻譯程序所處的層次計算機硬件C編譯程序C語言Basic解釋程序Basic語言Fortran編譯程序Fortran語言.2021年12月11日星期六第11頁編譯程序編譯程序編譯程序編譯程序源程序源程序目標程序目標程序計算機運行計算機運行輸入數(shù)據(jù)輸入數(shù)據(jù)結(jié)果結(jié)果解釋程序解釋程序解釋程序解釋程序源程序源程序輸入數(shù)據(jù)輸入數(shù)據(jù)結(jié)果結(jié)果2021年12月11日星期六第12頁對編譯程序的一些說明對編譯程序
6、的一些說明 編譯程序?qū)嵸|(zhì)上是一個翻譯程序翻譯程序,要注意等價等價變換 本課程的任務(wù)任務(wù)就是講解在這個轉(zhuǎn)換過程中所涉及到的一些理論和方法,最后,使用這些理論和方法,自己編寫一個小的編譯器 轉(zhuǎn)換是一個總體的功能,要抓住總體結(jié)構(gòu),逐層細分,寫編譯器時要體現(xiàn)軟件工程中軟件設(shè)計的軟件設(shè)計的原則原則,自頂向下,逐層分解。 編譯器要完成的轉(zhuǎn)換任務(wù)相當復(fù)雜,實現(xiàn)編譯器時必須分步驟分階段分步驟分階段實現(xiàn)。分階段實現(xiàn)的好處是能夠簡化程序的設(shè)計簡化程序的設(shè)計,當然也可以不分階段實現(xiàn)。2021年12月11日星期六第13頁編譯程序的分類編譯程序的分類診斷編譯程序診斷編譯程序優(yōu)化編譯程序優(yōu)化編譯程序可變目標編譯程序可變目
7、標編譯程序交叉編譯程序交叉編譯程序2021年12月11日星期六第14頁編譯器的伙伴編譯器的伙伴編輯器編輯器(editor)(editor)預(yù)處理器預(yù)處理器(Preprocessor)(Preprocessor) 將源程序匯集到一起,宏展開等將源程序匯集到一起,宏展開等匯編程序匯編程序(assembler)(assembler)連接程序連接程序(linker)(linker) 連接系統(tǒng)函數(shù)與系統(tǒng)資源連接系統(tǒng)函數(shù)與系統(tǒng)資源裝入程序裝入程序(loader)(loader) 重定位重定位(relocation)(relocation)Debugger,Pro ManagerDebugger,Pro M
8、anager2021年12月11日星期六第15頁編譯原理是討論編譯程序設(shè)計的基本理論、基本概念、基本方法 什么是編譯原理什么是編譯原理2021年12月11日星期六第16頁1.2 編譯過程概述編譯過程概述 1、邏輯上分五個階段:詞法分析、語法分析、語義分析與中間代碼生成、代碼優(yōu)化、目標代碼生成 每個階段把源程序從一種表示變換成另一種表示源 程 序編 譯 器目 標 程 序詞法分析語法分析語義分析與中間代碼生成代碼優(yōu)化目標代碼生成2021年12月11日星期六第17頁 按照詞法分析、語法分析、語義分析等這種方式來劃分階段的原因是:每個階段的復(fù)雜程度不同,所依據(jù)的理論基礎(chǔ)不同理論基礎(chǔ)不同,實現(xiàn)時采用的方
9、法也不方法也不同同。主要是方便理解和實現(xiàn)。 劃分階段的依據(jù)是什么?每個階段所實現(xiàn)的功能功能相對獨立相對獨立。2021年12月11日星期六第18頁用一個例子說明各階段的功能/*一個PASCAL語言的源程序*/program test; /*this is an example,computing an area*/ var area, length, width: integer; begin length:=5;width:=5; area := 5length *widthlength *widthend. 2021年12月11日星期六第19頁第一階段:詞法分析第一階段:詞法分析任務(wù)任務(wù):
10、從左到右掃描源程序,識別出每個單詞從左到右掃描源程序,識別出每個單詞o 附加任務(wù):a、濾掉空格 b、去掉注釋o 單詞符號是語言的基本組成成分o 詞法分析的工作主要依據(jù)語言中單詞的構(gòu)成規(guī)則o 單詞的種類: (1) 標識符 (2) 關(guān)鍵字(char、int、if、else、while、for等) (3) 運算符(即運算符號 +、*、/、&等) (4) 界符(常見的有 ; , : ( )等) (5) 常數(shù) 2021年12月11日星期六第20頁begin area:=5length*width length *widthend;單詞類型內(nèi)部形式begin關(guān)鍵字$beginarea標識符id1:
11、=界符:=5常數(shù)int1+算符+length標識符id1*算符*width標識符id2+算符+length標識符id2*算符*width標識符id3end關(guān)鍵字$end;界符;例:2021年12月11日星期六第21頁第二階段:語法分析第二階段:語法分析任務(wù)任務(wù): 在詞法分析的基礎(chǔ)上,根據(jù)語言的語法規(guī)則,將單詞符號串分解成各類語法短語(例:程序、語句、表達式)。o 確定整個輸入串是否構(gòu)成語法上正確的程序。o 根據(jù)規(guī)則判定:根據(jù)規(guī)則判定:賦值語句:賦值語句:標識符標識符:表達式表達式 表達式:表達式:標識符、常數(shù)是表達式標識符、常數(shù)是表達式 表達式的運算也是表達式表達式的運算也是表達式例:識別符號
12、串id1:=int1 + id2 * id3 + id2 * id3是一個賦值語句( area:=5length*widthlength *width)而int1 + id2 * id3 + id2 * id3是一個表達式 ( 5length*widthlength *width )2021年12月11日星期六第22頁語法分析所依據(jù)的是語言的語法規(guī)則id1:=int1 + id2 * id3 + id2 * id32021年12月11日星期六第23頁第三階段:語義分析和中間代碼生成第三階段:語義分析和中間代碼生成任務(wù)任務(wù):對語法分析所識別出的各類語法短語分析其含義,進行初步的翻譯(翻譯成中間代
13、碼)。o 靜態(tài)語義審查 變量定義 類型匹配 類型轉(zhuǎn)換 例:C:=A*B (檢查C與、類型)o 中間代碼的翻譯 中間代碼有多種形式,如: 四元式: (運算符,運算對象1,運算對象2,結(jié)果) 2021年12月11日星期六第24頁例:對賦值語句: id1:=int1 + id2 * id3 + id2 * id3 1. 檢查area、length、width是否定義、類型 2. 生成中間代碼(運算符,運算對象運算符,運算對象1,運算對象,運算對象2,結(jié)果,結(jié)果) (*, id2, id3, T1) (+, int1, T1, T2) (*, id2, id3, T3) (+, T2, T3, T4)
14、 (:=, T4, _, id1)id1:=int1 + id2 * id3 + id2 * id32021年12月11日星期六第25頁第四階段:第四階段: 代碼優(yōu)化代碼優(yōu)化任務(wù)任務(wù):對已產(chǎn)生的中間代碼進行加工變換,使生成的目標代碼更為高效(時間和空間)。o 優(yōu)化方法包括:公共子表達式的提取、循環(huán)優(yōu)化、刪除無用代碼等。o 代碼的優(yōu)化依據(jù)的是程序的等價變換規(guī)則。序號 四元式1(*, id2, id3, T1)2(+, int1, T1, T2)3(*, id2, id3, T3)4(+, T2, T3, T4)5(:=, T4, _, id1)序號 四元式1(*, id2, id3, T1)2
15、(+, int1, T1, T2)3(+, T2, T1, id1)2021年12月11日星期六第26頁第五階段:目標代碼的生成第五階段:目標代碼的生成任務(wù)任務(wù):把中間代碼(或經(jīng)優(yōu)化的中間代碼)變換成特定機器上的低級語言代碼。o 依賴于機器的硬件系統(tǒng)結(jié)構(gòu)和機器指令的含義o 目標代碼可以是:絕對指令代碼、可重定位的指令代碼、匯編指令代碼序號 四元式1(*, id2, id3, T1)2 (+, int1, T1, T2)3(+, T2, T1, id1)(1)mov AX, id2(2)mul AX, id3(3)mov BX, AX(4)add AX, int1(5)add AX, BX(6)
16、mov id1, AX2021年12月11日星期六第27頁1.2編譯程編譯程序的結(jié)構(gòu)序的結(jié)構(gòu) 由左圖可以看出,詞法分析是實現(xiàn)編譯器的基礎(chǔ),語法分析是實現(xiàn)編譯器的關(guān)鍵。 因此按照這個順序來實現(xiàn)編譯器 每一步的實現(xiàn)都依賴于一定的理論基礎(chǔ)。 數(shù)學(xué),尤其是離散數(shù)學(xué)是程序設(shè)計方法學(xué)的理論基礎(chǔ)2021年12月11日星期六第28頁編譯階段的組合編譯階段的組合 幾個概念遍:對源程序或源程序的中間結(jié)果從頭到尾掃描一次,并作有關(guān)的加工處理,生成新的中間結(jié)果或目標程序。編譯前端:主要指與源語言有關(guān),與目標語言無關(guān)的部分,通常包括詞法分析、語法分析、語義分析和中間代碼生成,與機器無關(guān)部分的代碼優(yōu)化編譯后端:指與目標機
17、器有關(guān)的部分。如與機器有關(guān)的優(yōu)化、目標代碼生成2021年12月11日星期六第29頁編譯階段的組合編譯階段的組合2021年12月11日星期六第30頁為什么生成中間代碼為什么生成中間代碼2021年12月11日星期六第31頁編譯程序中的主要數(shù)據(jù)結(jié)構(gòu)編譯程序中的主要數(shù)據(jù)結(jié)構(gòu) (續(xù)續(xù))Token表符號表常數(shù)表錯誤信息語法樹中間代碼表臨時文件目標代碼表2021年12月11日星期六第32頁(1) Token表表 當掃描程序?qū)⒆址占揭粋€記號中時,它通常是以符號表示這個記號;這也就是說,作為一個枚舉數(shù)據(jù)類型的值來表示源程序的記號集。(2) 語法樹(語法樹(syntax tree) 如果分析程序確實生成了語法
18、樹,它的構(gòu)造通常為基于指針的標準結(jié)構(gòu),在進行分析時動態(tài)分配該結(jié)構(gòu),則整棵樹可作為一個指向根節(jié)點的單個變量保存。結(jié)構(gòu)中的每一個節(jié)點都是一個記錄,它的域表示由分析程序和之后的語義分析程序收集的信息。編譯程序中的主要數(shù)據(jù)結(jié)構(gòu)介紹編譯程序中的主要數(shù)據(jù)結(jié)構(gòu)介紹: :2021年12月11日星期六第33頁(3) 符號表(符號表(symbol table) 這個數(shù)據(jù)結(jié)構(gòu)中的信息與標識符有關(guān):函數(shù)、變量、常量以及數(shù)據(jù)類型。符號表幾乎與編譯器的所有階段交互:掃描程序、分析程序或?qū)俗R符輸入到表格中的語義分析程序;語義分析程序?qū)⒃黾訑?shù)據(jù)類型和其他信息;優(yōu)化階段和代碼生成階段也將利用由符號表提供的信息選出恰當?shù)拇a。
19、因為對符號表的訪問如此頻繁,所以插入、刪除和訪問操作都必須比常規(guī)操作更有效。盡管可以使用各種樹的結(jié)構(gòu),但雜湊表卻是達到這一要求的標準數(shù)據(jù)結(jié)構(gòu)。有時在一個列表或棧中可使用若干個表格。2021年12月11日星期六第34頁(4) 常數(shù)表(常數(shù)表(literal table) 常數(shù)表的功能是存放在程序中用到的常量和字符串,因此快速插入和查找在常數(shù)表中也十分重要。但是,在其中卻無需刪除,這是因為它的數(shù)據(jù)全程應(yīng)用于程序而且常量或字符串在該表中只出現(xiàn)一次。(5) 中間代碼(中間代碼(intermediate code) 根據(jù)中間代碼的類型(例如三元式代碼)和優(yōu)化的類型,該代碼可以是文本串的數(shù)組、臨時文本文件
20、或是結(jié)構(gòu)的連接列表。對于進行復(fù)雜優(yōu)化的編譯器,應(yīng)特別注意選擇允許簡單重組的表示。2021年12月11日星期六第35頁(6) 目標目標代碼(代碼(intermediate code) 存放最終生成的目標代碼,該代碼最終是文本形式的文件。(7) 臨時文件(臨時文件(t e m p o r a ry file) 計算機過去一直未能在編譯器時將整個程序保留在存儲器中。這一問題已經(jīng)通過使用臨時文件來保存翻譯時中間步驟的結(jié)果或通過“匆忙地”編譯(也就是只保留源程序早期部分的足夠信息用以處理翻譯)解決了。2021年12月11日星期六第36頁1.3 編譯程序的設(shè)計編譯程序的設(shè)計 構(gòu)造編譯程序要掌握以下幾方面的
21、內(nèi)容: 源語言:理解其結(jié)構(gòu)和含義 目標語言:必須清楚硬件的系統(tǒng)結(jié)構(gòu)和指令的格式等 編譯方法2021年12月11日星期六第37頁1.3 編譯程序的構(gòu)造編譯程序的構(gòu)造 一般實現(xiàn)編譯程序的方法有:1.直接用機器語言編寫編譯程序2.用匯編語言編寫編譯程序 注:編譯程序核心部分常用匯編語言編寫3.用高級語言編寫編譯程序 注:這是普遍采用的方法4.自編譯5.用編譯工具自動生成:LEX(詞法分析)與YACC(用于自動產(chǎn)生LALR分析表)6.移植(同種語言的編譯程序在不同類型的機器之間移植)2021年12月11日星期六第38頁本書構(gòu)成及編譯程序框架本書構(gòu)成及編譯程序框架2021年12月11日星期六第39頁1.
22、4 編譯技術(shù)的發(fā)展編譯技術(shù)的發(fā)展1954年至1957年間,F(xiàn)ORTRAN語言及其編譯器的開發(fā)。花了18個人年。幾乎與此同時,Noam Chomsky開始研究語言文法(grammar,結(jié)構(gòu)規(guī)則)的難易程度以及識別它們所需的算法來為語言分類。在6 0年代和7 0年代進行的分析問題(parsing problem,用于限定上下文無關(guān)語言的識別的有效算法)的研究。有窮自動機(finite automata)和正規(guī)式(regular expression) 的研究與喬姆斯基的研究幾乎同時開始,引出了表示程序設(shè)計語言的單詞的符號方式。接著又深化了生成有效的目標代碼的方法,這就是最初的編譯器,實際上應(yīng)稱作代碼改進技術(shù)(code improvement technique)。當分析問題變得好懂起來時,人們就在開發(fā)程序上花費了很大的功夫來研究這一部分的編譯器的自動構(gòu)造。Lex與Yacc。在70年代后期和80年代早期,大量的項目都關(guān)注于編譯器其他部分的生成自動化,這其中就包括了代碼生成。這些嘗試并未取得多少成功。 2021年12月11日星期六第40頁1.4 編譯技術(shù)最近的發(fā)展編譯技術(shù)最近的發(fā)展 與復(fù)雜的程序設(shè)計語言的發(fā)展結(jié)合在一起。如用于函數(shù)語言編譯的Hindley-Milner類型檢查的統(tǒng)一算法。 編譯器已成為基于窗口的交互
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 44943-2024鞋類化學(xué)試驗方法鄰苯基苯酚含量的測定高效液相色譜-串聯(lián)質(zhì)譜法
- 2024年度二手住宅交易墊資服務(wù)協(xié)議
- 2024年度銀行信用貸款擔保合同范本3篇
- 2024年度金融信托合同樣本:實現(xiàn)財富傳承與投資增值3篇
- 2024年企業(yè)員工離職補償勞動合同范本3篇
- 2024年度高校與企業(yè)產(chǎn)學(xué)研合作人才培養(yǎng)與創(chuàng)新創(chuàng)業(yè)指導(dǎo)及市場開拓專用協(xié)議3篇
- 2024年度高新技術(shù)企業(yè)員工勞動合同范本及知識產(chǎn)權(quán)保護協(xié)議3篇
- 2024年度電子元器件貼牌代生產(chǎn)合同3篇
- 2024年商業(yè)綜合體后勤服務(wù)保障委托合同3篇
- 2024年新能源汽車生產(chǎn)與銷售戰(zhàn)略合作協(xié)議
- 比賽獲獎?wù)n件-I-love-My-White-Shoes(繪本)
- 手機大腦:讓人睡眠好、心情好、腦力好的戒手機指南
- (完整版)蘇教版四年級下冊英語單詞表
- 2023年陜西西安國際港務(wù)區(qū)管委會招聘筆試參考題庫附帶答案詳解
- 四川省成都市2021-2022學(xué)年高一(上)期末調(diào)研考試物理試題Word版含解析
- 2023年江蘇小高考物理試題及答案
- 安徽省職工帶薪年休假實施細則完整版
- 低壓送電施工方案
- 廣州中醫(yī)藥大學(xué)2022學(xué)年第一學(xué)期《護理學(xué)基礎(chǔ)》期末考試附答案
- 五年級上冊數(shù)學(xué)試題-《組合圖形的面積》測試卷A北師大版 (含答案)
- FZ/T 71001-2015精梳毛針織絨線
評論
0/150
提交評論