信息技術(shù) 第一冊(五年制高職)教案 1.3.4 計(jì)算機(jī)中的信息編碼-文檔_第1頁
信息技術(shù) 第一冊(五年制高職)教案 1.3.4 計(jì)算機(jī)中的信息編碼-文檔_第2頁
信息技術(shù) 第一冊(五年制高職)教案 1.3.4 計(jì)算機(jī)中的信息編碼-文檔_第3頁
信息技術(shù) 第一冊(五年制高職)教案 1.3.4 計(jì)算機(jī)中的信息編碼-文檔_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

.3.4計(jì)算機(jī)中的信息編碼編碼的概念在日常生活中隨處可見,例如,學(xué)生證上的學(xué)號是一個編碼,每張人民幣紙幣上都有一個編碼。這兩個編碼中的前者是往往用十進(jìn)制數(shù)表示,后者則是由十進(jìn)制數(shù)和英文字母混合而成。下面詳細(xì)介紹各種不同類型的信息在計(jì)算機(jī)中采用二進(jìn)制進(jìn)行編碼的方法。西文字符的編碼在微機(jī)中對字符進(jìn)行編碼,通常采用ASCII碼和Unicode編碼。(1)ASCII碼ASCII碼是AmericanStandardCodeforInformationInterchange(美國信息互換標(biāo)準(zhǔn)代碼)的簡稱,已經(jīng)被國際標(biāo)準(zhǔn)化組織(ISO)指定為國際標(biāo)準(zhǔn),稱為ISO646標(biāo)準(zhǔn),適用于所有拉丁文字字母。標(biāo)準(zhǔn)ASCII碼采用7位二進(jìn)制數(shù)來表示所有的大寫和小寫字母、數(shù)字0到9、標(biāo)點(diǎn)符號,以及在美式英語中使用的特殊控制字符等128個字符。這128個字符可以分為95個可顯示/打印字符和33個控制字符兩類。在8個二進(jìn)制位中,ASCII采用了7位(b0~b6)編碼,空閑最高位b7常用作奇偶校驗(yàn)位。ASCII碼的字符編碼表共有24=16行,23=8列。低4位編碼b3b2b1b0用作行編碼,而高3位b6b5b4用作列編碼。標(biāo)準(zhǔn)ASCII碼字符集見表1。表1標(biāo)準(zhǔn)ASCII碼字符集低4位b3b2b1b0高3位b6b5b40000010100111001011101110000NULDLESP0@P`p0001SOHDC1!1AQaq0010STXDC2"2BRbr0011ETXDC3#3CScs0100EOTDC4$4DTdt0101ENQNAK%5EUeu0110ACKSYN&6FVfv0111BELETB'7GWgw1000BSCAN(8HXhx1001HTEM)9IYiy1010LFSUB*:JZjz1011VTESC+;K[k{1100FFFS,〈L\l|1101CRGS-=M]m}1110SORS.〉N^n~1111SIUS/?O_oDEL表1中的每個字符對應(yīng)一個二進(jìn)制編碼,每個編碼的數(shù)值稱為ASCII碼的值,例如,字母A的編碼為1000001B,即65D或41H。由于ASCII碼只有7位,在用一個字節(jié)保存一個字符的ASCII碼時,占該字節(jié)的低7位,最高位補(bǔ)0??梢钥闯觯瑪?shù)字0~9的ASCII碼的值范圍是48~59,大寫字母的ASCII碼的值范圍是65~90,小寫字母的ASCII碼的值范圍是97~122,其順序與字母表中的順序是一樣的,并且同一個字母的大小寫ASCII碼的值相差32。(2)Unicode編碼擴(kuò)展的ASCII碼所提供了256個字符,但用來表示世界各國的文字編碼顯然是遠(yuǎn)遠(yuǎn)不夠的,還需要表示更多的字符和意義,因此又出現(xiàn)了Unicode編碼。Unicode是國際組織制定的可以容納世界上所有文字和符號的字符編碼方案。它為每種語言中的每個字符設(shè)定了統(tǒng)一并且唯一的二進(jìn)制編碼,以滿足跨語言、跨平臺進(jìn)行文本轉(zhuǎn)換、處理的要求。Unicode編碼自1994年公布以來已得到普及,廣泛應(yīng)用于Windows操作系統(tǒng)、Office等軟件中。漢字的編碼漢字也是一種字符,也需要用二進(jìn)制進(jìn)行編碼才能被計(jì)算機(jī)接受。漢字是象形文字,有近60,000個左右的漢字,常用漢字就達(dá)7,000個左右。漢字的編碼處理較為復(fù)雜,需要對漢字信息進(jìn)行轉(zhuǎn)換處理,主要經(jīng)歷輸入、處理和輸出過程,具體處理的過程如圖3-6所示。首先是通過漢字輸入碼輸入漢字信息,計(jì)算機(jī)內(nèi)部通過統(tǒng)一的編碼將輸入碼轉(zhuǎn)換為漢字的機(jī)內(nèi)碼進(jìn)行存儲和處理,最后通過字形碼將漢字輸出顯示。因此,對漢字信息的處理過程實(shí)際上是各種漢字編碼間的轉(zhuǎn)換過程,主要包括:漢字輸入碼、漢字機(jī)內(nèi)碼、漢字地址碼、漢字字形碼。

圖1漢字信息處理系統(tǒng)的流程模型(1)漢字輸入碼漢字輸入碼是能通過鍵盤的字母、數(shù)字等直接把漢字輸入到計(jì)算機(jī)設(shè)計(jì)的編碼,常見的輸入編碼方式有數(shù)字編碼、拼音碼、字形編碼、混合編碼。數(shù)字編碼是用數(shù)字串代表一個漢字進(jìn)行輸入,常用的是國際區(qū)位碼。區(qū)位碼是由區(qū)號(即行號)和位號(即列號)構(gòu)成,我們用4位十進(jìn)制數(shù)字表示一個區(qū)位碼,其中前2位表示區(qū)號,后2位表示位號。例如:“學(xué)”字的區(qū)號是49,位號是07,區(qū)位碼就是4907,用2個字節(jié)的二進(jìn)制表示為:0011000100000111。拼音碼是以漢字拼音為基礎(chǔ),以漢字的漢語拼音或其一定規(guī)則的縮寫形式為編碼元素的漢字輸入碼。常用的有QQ輸入法、搜狗拼音、智能全拼、微軟拼音、紫光拼音等。字型碼是用漢字的形狀進(jìn)行編碼的漢字輸入碼。常見的有五筆輸入法?,F(xiàn)在,為了提升輸入的速度,不斷涌現(xiàn)出很多新的輸入法,如語音輸入、手寫輸入和掃描輸入。(2)漢字機(jī)內(nèi)碼漢字機(jī)內(nèi)碼,我們又稱為漢字存儲碼或者內(nèi)碼。當(dāng)使用不同漢字輸入碼將漢字輸入到計(jì)算機(jī)內(nèi)時,需要將漢字轉(zhuǎn)換為統(tǒng)一的漢字機(jī)內(nèi)碼進(jìn)行存儲、加工處理和傳輸。漢字機(jī)內(nèi)碼是漢字最基本的編碼,都是由0和1表示的。常用的漢字機(jī)內(nèi)碼的編碼方式有GB2312、BIG5、GBK、GB18030和國際標(biāo)準(zhǔn)字符集Unicode。(3)漢字地址碼

漢字地址碼是指漢字字庫中存儲漢字字形信息的邏輯地址碼。在漢字庫中,字形信息都是按一定順序連續(xù)存放的(一般按照標(biāo)準(zhǔn)漢字國標(biāo)碼中漢字的排列順序進(jìn)行存放),因此漢字地址碼絕大多數(shù)是連續(xù)有序的,且與漢字機(jī)內(nèi)碼有對應(yīng)關(guān)系,這樣漢字內(nèi)碼到漢字地址碼的轉(zhuǎn)換也相對比較簡單。(4)漢字字形碼漢字字形碼又稱為漢字字模,是存放漢字的字形信息的編碼,它也與漢字內(nèi)碼一一對應(yīng),用于漢字的輸出或顯示。每個漢字的字形碼都從預(yù)先存放在計(jì)算機(jī)的漢字庫中尋找得到。

漢字字形的描述有點(diǎn)陣字形和矢量表示法兩種。點(diǎn)陣字形法是把每個漢字都用一個16*16或24*24的點(diǎn)陣表示,通過每個排列的點(diǎn)的黑白顏色來描述一個漢字字型。矢量表示方式是通過曲線來描述漢字字形的輪廓特征,一般都采用數(shù)學(xué)方法描述漢字的輪廓曲線。數(shù)值編碼前面介紹了不同進(jìn)制之間的轉(zhuǎn)換,對任何進(jìn)制的數(shù)值,其絕對值都可以轉(zhuǎn)換成二進(jìn)制數(shù),這樣其他進(jìn)制的數(shù)據(jù)就可以在計(jì)算機(jī)中表示了。在各種軟件編程語言中,數(shù)值型數(shù)據(jù)按存儲大小、表示形式與取值范圍的不同,又分為多種不同類型,比如數(shù)值型,浮點(diǎn)型(單精度型,雙精度型)和整型等。任何一個數(shù)在計(jì)算機(jī)內(nèi)部都要被表示成二進(jìn)制數(shù),該二進(jìn)制數(shù)叫作機(jī)器數(shù),它是該數(shù)的真值。機(jī)器數(shù)有固定的位數(shù),同時機(jī)器數(shù)是帶符號的,通常用最高位表示符號,0表示正,1表示負(fù)。在計(jì)算機(jī)內(nèi)部,機(jī)器數(shù)的表示方法有原碼、反碼和補(bǔ)碼三種,最常用的是原碼和補(bǔ)碼兩種,原碼表示法比較直觀,補(bǔ)碼表示運(yùn)算則比較簡單,在計(jì)算機(jī)中數(shù)值都是以補(bǔ)碼的方式存儲的。(1)原碼原碼表示法是在數(shù)值前面增加了一位表示符號位,符號位為0表示該數(shù)為正,符號位為1表示該數(shù)為負(fù),正數(shù)該位為0,負(fù)數(shù)該位為1,其余位表示該數(shù)值的絕對值。如:真值為85和-85,其原碼為01010101和11010101。原碼表示法能比較直觀地表示機(jī)器數(shù),但是原碼不能直接參加運(yùn)算。當(dāng)用原碼進(jìn)行乘除操作時,可取其絕對值(尾數(shù))直接運(yùn)算,再按同號相乘除為正數(shù),異號相乘除結(jié)果為負(fù)數(shù)的原則處理結(jié)果數(shù)的符號位即可,但對常用的加減運(yùn)算操作,使用原碼表示卻極不方便,有可能會出錯,需要借助于補(bǔ)碼。(2)反碼反碼表示法是正數(shù)的反碼是其原碼本身,而負(fù)數(shù)的反碼是在原碼的基礎(chǔ)上,符號位不變,其余各位取反。在計(jì)算機(jī)內(nèi)部使用反碼表示法可以化減為加,一般用于設(shè)置環(huán)境變量。真值為85和-85,其反碼分別是01010101和10101010。(3)補(bǔ)碼計(jì)算機(jī)內(nèi)部,數(shù)值都是使用補(bǔ)碼來表示和存儲的。那什么是補(bǔ)碼呢?補(bǔ)碼表示法是正數(shù)的補(bǔ)碼是其原碼本身,而負(fù)數(shù)的補(bǔ)碼是在原碼的基礎(chǔ)上,符號位不變,其余各位取反,最后末位+1,即“反碼加1”。由此可以看出補(bǔ)碼是通

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論