計算機中的常用編碼_第1頁
計算機中的常用編碼_第2頁
計算機中的常用編碼_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

計算機中的常用編碼計算機中的常用編碼字符又稱為符號數(shù)據(jù),包括字母和符號等。計算機除處理數(shù)值信息外,大量處理的是字符信息。例如,將高級語言編寫的程序輸入到計算機時,人與計算機通信時所用的語言就不再是一種純數(shù)字語言而是字符語言。由于計算機中只能存儲二進制數(shù),這就需要對字符進行編碼,建立字符數(shù)據(jù)與二進制數(shù)據(jù)之間的對應(yīng)關(guān)系,以便于計算機識別、存儲和處理。1.ASSII碼目前,國際上使用的字母、數(shù)字和符號的信息、編碼系統(tǒng)種類很多,但使用最廣泛的是ASCII碼(AmericanStandardCodeforInterchange)。該碼開始時是美國國家信息交換標(biāo)準(zhǔn)字符碼,后來被采納為一種國際通用的信息交換標(biāo)準(zhǔn)代碼。ASCII碼總共有128個元素,其中包括32個通用控制字符,10個十進制數(shù)碼,52個英文大、小寫字母和34個專用符號。因為ASCII碼總共為128個元素,故用二進制編碼表示需用7位。任意一個元素由7位二進制數(shù)D7D6D5D4D3D2D1表示,從0000000到1111111共有128種編碼,可用來表示128個不同的字符。ASCII碼是7位的編碼,但由于字節(jié)(8位)是計算機中常用單位,故仍以1字節(jié)來存放一個ASCII字符,每個字節(jié)中多余的最高位D7取為0。表1-3所示為7位ASCII編碼表(省略了恒為0的最高位D7)。表1-37位ASCII編碼表D5D5D4DsD^DiD^CICILp010^Ml#10帥1如im112NUL-DLEq瀘%PqppCIOOWSOH^DCWA矽驢qQ0010^sgDC2p咔Rp80011^ETXqDC3#O*3*QlgEOT^DC4#ATpN0101^ENQ^HAKq如E#Up0110^ACK#SYNqF#fpClllWBE"EM¥Tp3ggQ1的訴B*CAN—混1001^HTqW*詔VhPmio^ESLW*ZpjQ.眼1011^¥TqESCp—p*P1100^F**<p1101^CKpG*堀FumS3RSq*XWAP1111^SW2*3就苓函要確定某個字符的ASCII碼,在表中可先查到它的位置,然后確定它所在位置相應(yīng)的列和行,最后根據(jù)列確定高位碼(D6D5D4),根據(jù)行確定低位碼(D3D2D1D0),把高位碼與低位碼合在一起就是該字符的ASCII碼(高位碼在前,低位碼在后)。例如,字母A的ASCII碼是1000001,符號〃+〃的ASCII碼是0101011。ASCII碼的特點如下。編碼值0?31(0000000?0011111)不對應(yīng)任何可印刷字符,通常為控制符,用于計算機通信中的通信控制或?qū)υO(shè)備的功能控制;編碼值為32(0100000)是空格字符,編碼值為127(1111111)是刪除控制DEL碼;其余94個字符為可印刷字符。字符0?9這10個數(shù)字字符的高3位編碼(D6D5D4)為011,低4位為0000?1011。當(dāng)去掉高3位的值時,低4位正好是二進制形式的0?9。這既滿足正常的排序關(guān)系,又有利于完成ASCII碼與二進制碼之間的轉(zhuǎn)換。英文字母的編碼是正常的字母排序關(guān)系,且大、小寫英文字母編碼的對應(yīng)關(guān)系相當(dāng)簡便,差別僅表現(xiàn)在D5位的值為0或1,有利于大、小寫字母之間的編碼轉(zhuǎn)換。2.漢字的存儲與編碼漢字的存儲有兩個方面的含義:一種是字型碼的存儲,一種是漢字內(nèi)碼的存儲。為了能顯示和打印漢字,必須存儲漢字的字型。目前普遍使用的漢字字型碼是用點陣方式表示的,稱為〃點陣字模碼〃。所謂〃點陣字模碼〃,就是將漢字像圖像一樣置于網(wǎng)狀方格上,每格是存儲器中的一個位。16X16點陣是在縱向16點、橫向16點的網(wǎng)狀方格上寫一個漢字,有筆劃的格對應(yīng)1,無筆劃的格對應(yīng)0。這種用點陣形式存儲的漢字字型信息的集合稱為漢字字模庫,簡稱漢字字庫。在16X16點陣字庫中,每一個漢字以32個字節(jié)存放,存儲一、二級漢字及符號共8836個,需要282.5KB磁盤空間。而用戶的文檔假定有10萬個漢字,卻只需要200KB的磁盤空間,這是因為用戶文檔中存儲的只是每個漢字(符號)的內(nèi)碼。一個漢字用兩個字節(jié)的內(nèi)碼表示,計算機顯示一個漢字的過程是:首先根據(jù)其內(nèi)碼找到該漢字在字庫中的地址,然后將該漢字的點陣字型在屏幕上輸出。漢字是我國表示信息的主要手段,常用漢字有3000~5000個,漢字通常用兩個字節(jié)編碼。為了與ASCII碼相區(qū)別,規(guī)定漢字編碼的兩個字節(jié)最高位為1。采用雙7位漢字編碼,最多可表示128X128=16384個漢字。國標(biāo)碼(GB碼)即中華人民共和國國家標(biāo)準(zhǔn)信息交換漢字編碼,代號為GB2312-1980。國標(biāo)碼中有6763個漢字和628個其他基本圖形字符,共計7445個字符。其中,一級漢字3775個,二級漢字3008個,圖形符號682個。國標(biāo)碼是一種機器內(nèi)部編碼,其主要用于統(tǒng)一不同系統(tǒng)之間所用的不同編碼,將不同系統(tǒng)使用的不同編碼統(tǒng)一轉(zhuǎn)換成國標(biāo)碼,以實現(xiàn)不同系統(tǒng)之間的漢字信息交換。除了GB碼外,還有BIG5碼和GBK碼。BIG5碼即大五碼,是我國港臺地區(qū)廣泛使用的漢

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論