新編計算機導(dǎo)論 課件 3-4 信息的編碼-2_第1頁
新編計算機導(dǎo)論 課件 3-4 信息的編碼-2_第2頁
新編計算機導(dǎo)論 課件 3-4 信息的編碼-2_第3頁
新編計算機導(dǎo)論 課件 3-4 信息的編碼-2_第4頁
新編計算機導(dǎo)論 課件 3-4 信息的編碼-2_第5頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

新編計算機導(dǎo)論計算的基礎(chǔ)4信息的編碼(下)西文字符及多媒體的編碼01漢字的編碼02本節(jié)CAPACITY內(nèi)容漢字編碼漢字信息的處理涉及漢字的輸入、漢字信息的轉(zhuǎn)換、漢字信息在計算機內(nèi)的存儲、輸出等,分別對應(yīng)不同的編碼。1)漢字輸入碼2)漢字交換碼(國標(biāo)碼)3)漢字機內(nèi)碼4)漢字字形碼5)漢字地址碼漢字的編碼漢字輸入碼為將漢字輸入計算機而編制的代碼稱為漢字輸入碼,也叫外碼。總體來說可分為音碼、形碼、音形結(jié)合碼三大類。音碼是根據(jù)漢字的拼音進行編碼的,如全拼碼、雙拼碼。形碼是根據(jù)漢字的字形結(jié)構(gòu)進行編碼的,如五筆字型碼、倉頡碼。音形碼則結(jié)合了兩者,如自然碼。漢字的編碼漢字交換碼(國標(biāo)碼)漢字交換碼是指不同的具有漢字處理功能的計算機系統(tǒng)之間在交換漢字信息時所使用的代碼標(biāo)準(zhǔn)。1980年我國公布了《信息交換用漢字編碼字符集——基本集》,GB2312-80編碼,簡稱國標(biāo)碼。自國家標(biāo)準(zhǔn)GB2312-80公布以來,我國一直延用該標(biāo)準(zhǔn)所規(guī)定的國標(biāo)碼作為統(tǒng)一的漢字信息交換碼。每個漢字由兩個字節(jié)構(gòu)成。定義了6763個漢字,682個圖形符號,共7445個字符。漢字的編碼漢字交換碼(國標(biāo)碼)區(qū)位碼:94區(qū)*94位(區(qū)號、位號)1區(qū)—9區(qū):非漢字圖形符號10區(qū)—15區(qū):空(可造字或其它符號)16區(qū)—55區(qū):一級漢字,40*94-5=3755個,按拼音排,覆蓋率99.9%56區(qū)—87區(qū):二級漢字,32*94=3008個,按偏旁部首排一級二級共6763個,覆蓋率99.99%國標(biāo)碼:每個漢字由兩個字節(jié)構(gòu)成第一字節(jié):區(qū)號+20H;第二字節(jié):位號+20H漢字的編碼“中華人民共和國”7個漢字的區(qū)位碼分別是:“中”—54區(qū)48位;“華”—27區(qū)10位;“人”—40區(qū)43位;“民”—35區(qū)81位;“共”—25區(qū)18位;“和”—26區(qū)45位;“國”—25區(qū)90位;漢字的編碼漢字機內(nèi)碼漢字機內(nèi)碼,指漢字在計算機內(nèi)存儲和處理時所用的由0和1符號組成的編碼。簡稱“內(nèi)碼”。輸入碼被接受后就由漢字操作系統(tǒng)的“輸入碼轉(zhuǎn)換模塊”轉(zhuǎn)換為機內(nèi)碼。機內(nèi)碼是漢字最基本的編碼,不管什么漢字系統(tǒng)和漢字輸入方法,輸入的漢字外碼到機器內(nèi)部都要轉(zhuǎn)換成機內(nèi)碼。漢字在計算機內(nèi)部,內(nèi)碼是唯一的。漢字的編碼漢字機內(nèi)碼國標(biāo)碼和機內(nèi)碼的關(guān)系:將國標(biāo)碼的每個字節(jié)的最高位由“0”變?yōu)椤?”,變換后的國標(biāo)碼即為漢字機內(nèi)碼。機內(nèi)碼:將國標(biāo)碼最高位置“1”

或國標(biāo)碼第一字節(jié)+80H,第二字節(jié)+80H西文字符:1個字節(jié),高位為0漢字:2個字節(jié),高位為1漢字的編碼漢字機內(nèi)碼區(qū)位碼國標(biāo)碼(區(qū)碼、位碼各加20H)機內(nèi)碼(每個字節(jié)各加80H)漢字的編碼【例】漢字“中”區(qū)位碼為5448區(qū)碼36H,位碼30H國標(biāo)碼為5650H內(nèi)碼為D6D0H漢字的編碼漢字字形碼為了漢字的輸出顯示和打印,需要描述漢字的字形,即對漢字的字形進行編碼,稱為漢字的字形碼,也稱為漢字字模。漢字是一種象形文字,每個字都可以看成是一個特殊的圖形,所以漢字字形碼通常有兩種表示方式,點陣方式和矢量方式。漢字的編碼漢字字形碼點陣方式每一個漢字可以用一組點陣來表示。點陣的每個點位有兩種狀態(tài):有點或無點(黑色或白色)。可用二進制代碼0、1表示不同狀態(tài)。用點陣表示字形時,漢字字形碼指的就是這個漢字字形點陣的代碼。漢字的編碼漢字“中”的16×16點陣的字形、字形編碼(a)16×16點陣字形表示(b)16×16點陣字形編碼表示計算:占(16×16)/8=32字節(jié)漢字的編碼漢字字形碼點陣方式根據(jù)輸出漢字的要求不同,點陣的大小也不同。漢字字型有16×16(簡易型)、24×24(普通型)、32×32(提高型)、48×48、128×128點陣等。所有漢字和各種符號的點陣字形編碼的集合稱為“漢字字庫”,也稱漢字的“字模庫”。不同的字體對應(yīng)著不同的字庫。漢字的編碼漢字字形碼矢量方式矢量表示方式存儲的是描述漢字字形的輪廓特征,比如一個筆劃的起始、終止坐標(biāo),半徑、弧度等等。要輸出顯示、打印漢字時,要經(jīng)過一系列的數(shù)學(xué)運算。Windows中使用的TrueType技術(shù)就是漢字的矢量表示方式。漢字的編碼矢量方式矢量和點陣方式的區(qū)別:點陣漢字表示方法簡單,容易實現(xiàn),在放大時會失真。矢量漢字能不失真的隨意放大,但需要有相應(yīng)的算法來實現(xiàn),其實現(xiàn)方法較復(fù)雜。漢字的編碼漢字地址碼漢字地址碼是指漢字字模庫(這里主要指整字形的點陣字模庫)中存儲各漢字字形信息的邏輯地址碼。每個漢字字形碼在漢字字庫中的相對位移地址稱為漢字地址碼,即指漢字字型信息在漢字字模庫中存放的首地址。每個漢字在字庫中都占有一個固定大小的連續(xù)區(qū)域,其首地址即是該漢字的地址碼。需要向輸出設(shè)備輸出漢字時,必須通過地址碼,才能在漢字字庫中取到所需的字形碼,最終在輸出設(shè)備上形成可見的漢字字形。漢字的編碼幾種漢字編碼的關(guān)系漢字通過輸入碼輸入計算機,由漢字系統(tǒng)的管理模塊查表或計算,將輸入碼(外碼)轉(zhuǎn)換成機內(nèi)碼存入計

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論