漢字是如何編碼的_第1頁(yè)
漢字是如何編碼的_第2頁(yè)
漢字是如何編碼的_第3頁(yè)
漢字是如何編碼的_第4頁(yè)
漢字是如何編碼的_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、漢字是如何編碼的漢字是如何編碼的 以奇渠以奇渠存儲(chǔ)和單位 0 1 1 0 0 0 0 18個(gè)位組成一個(gè)字節(jié)(Byte,縮寫(xiě)位B)字節(jié)是存儲(chǔ)信息的基本單位1B=8bit 1KB=1024B 1MB=1024KB 1GB=1024MB 1TB=1024GB存儲(chǔ)一個(gè)漢字需要兩個(gè)字節(jié)。由于漢字有一萬(wàn)多個(gè),常用的也有六千多個(gè),所以編碼采用兩字節(jié)的低7位共14個(gè)二進(jìn)制位來(lái)表示。一般漢字的編碼方案要解決4種編碼問(wèn)題。位(bit)存儲(chǔ)信息的最小單位漢字的編碼漢字交換碼漢字交換碼主要是用作漢字信息交換的。以國(guó)家標(biāo)準(zhǔn)局1980年頒布的信息交換用漢字編碼字符集基本集(代號(hào)GB2312-80)規(guī)定漢字交換碼作為國(guó)家標(biāo)

2、準(zhǔn)漢字編碼,簡(jiǎn)稱(chēng)國(guó)標(biāo)碼。國(guó)標(biāo)GB2312-80規(guī)定,所有的國(guó)際漢字和符號(hào)組成一個(gè)94*94的矩陣。在該矩陣中,每一行稱(chēng)為一個(gè)“區(qū)”,每一列稱(chēng)為一個(gè)“位”,這樣就形成了94個(gè)區(qū)號(hào)(0194)和94個(gè)位號(hào)(0194)的漢字字符集。國(guó)標(biāo)碼中有6763個(gè)漢字和628個(gè)其他基本圖形字符,共計(jì)7445個(gè)字符。其中規(guī)定一級(jí)漢字3755個(gè),二級(jí)漢字3008個(gè),圖形符號(hào)682個(gè)。一個(gè)漢字所在的區(qū)號(hào)與位號(hào)簡(jiǎn)單地組合在一起就構(gòu)成了該漢字的“區(qū)位碼”。在漢字區(qū)位碼中,高兩位為區(qū)號(hào),低兩位為位號(hào)。因此,區(qū)位碼與漢字或圖形符號(hào)之間是一一對(duì)應(yīng)的。一個(gè)漢字由兩個(gè)字節(jié)代碼表示。國(guó)標(biāo)碼=2020H+區(qū)位碼 例:“學(xué)”的區(qū)位碼為4

3、907D 國(guó)標(biāo)碼=3107H+2020H=5127H區(qū)位碼表區(qū)位碼表01-09 區(qū)為特殊符號(hào)。10-15 區(qū)未有編碼。16-55 區(qū)為一級(jí)漢字,按拼音排序。56-87 區(qū)為二級(jí)漢字,按部首筆畫(huà)排序。88-94 區(qū)則未有編碼。漢字編碼漢字機(jī)內(nèi)碼漢字機(jī)內(nèi)碼:計(jì)算機(jī)系統(tǒng)內(nèi)部標(biāo)識(shí)漢字的編碼。一個(gè)漢字由兩個(gè)字節(jié)組成,為了與ASCII碼區(qū)別,最高位均為1。機(jī)內(nèi)碼=區(qū)位碼+A0A0H機(jī)內(nèi)碼=國(guó)標(biāo)碼+8080H例:“學(xué)”字的區(qū)位碼為:3107H 國(guó)標(biāo)碼為:5127H 機(jī)內(nèi)碼 =3107H+A0A0H=D1A7H=5127H+8080H=D1A7H 8080H=10000000 10000000漢字編碼漢字輸入

4、碼輸入碼(各種輸入碼是不同的) 鍵盤(pán)處理交換碼國(guó)標(biāo)碼高位改1機(jī)內(nèi)碼如輸入“學(xué)”;拼音輸xue國(guó)標(biāo)碼:雙字節(jié),高位為0得到“學(xué)”的國(guó)標(biāo)碼:01010001 00100111得到學(xué)的機(jī)內(nèi)碼:11010001 10100111漢字編碼漢字字形碼漢字在顯示和打印輸出時(shí),是以漢字字形信息表示的,即以點(diǎn)陣的方式形成漢字圖形。漢字字形碼是指確定一個(gè)漢字字形點(diǎn)陣的代碼(漢字字形碼)。一般采用點(diǎn)陣字形表示字符。目前普遍使用的漢字字型碼是用點(diǎn)陣方式表示的,稱(chēng)為“點(diǎn)陣字模碼”。所謂“點(diǎn)陣字模碼”,就是將漢字像圖像一樣置于網(wǎng)狀方格上,每格是存儲(chǔ)器中的一個(gè)位,1616點(diǎn)陣是在縱向16點(diǎn)、橫向16點(diǎn)的網(wǎng)狀方格上寫(xiě)一個(gè)漢字,有筆畫(huà)的格對(duì)應(yīng)1,無(wú)筆畫(huà)的格對(duì)應(yīng)0。這種用點(diǎn)陣形式存儲(chǔ)的漢字字型信息的集合稱(chēng)為漢字字模庫(kù),簡(jiǎn)稱(chēng)漢字字庫(kù)。通常漢字顯示使用1616點(diǎn)陣,而漢字打印可選用2424點(diǎn)陣、3232點(diǎn)陣、6464點(diǎn)陣等。漢字字形點(diǎn)陣中的每個(gè)點(diǎn)對(duì)應(yīng)一個(gè)二進(jìn)制位,1字節(jié)又等于8個(gè)二進(jìn)制位,所以1616點(diǎn)陣字形的字要使用32個(gè)字節(jié)(16168字節(jié)32字節(jié))存儲(chǔ),6464點(diǎn)陣的字形要使用512個(gè)字節(jié)。在1616點(diǎn)陣字庫(kù)中的每一個(gè)漢字以32個(gè)字節(jié)存放,存儲(chǔ)一、二級(jí)漢字及符號(hào)共8836個(gè),需要282.5KB磁盤(pán)空間。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論