計(jì)算機(jī)中的文字表達(dá)方式.pptx
《計(jì)算機(jī)中的文字表達(dá)方式.pptx》由會(huì)員分享,可在線閱讀,更多相關(guān)《計(jì)算機(jī)中的文字表達(dá)方式.pptx(11頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
計(jì)算機(jī)中的文字表達(dá)方式,1.ASCII碼2.GB2312編碼3.Big5編碼4.Unicode編碼5.輸入編碼6.字型碼,一.文字表達(dá)方式的種類(lèi)1.ASCII碼,ASCII(AmericanStandardCodeforInformationInterchange,美國(guó)信息互換標(biāo)準(zhǔn)代碼)是基于拉丁字母的一套電腦編碼系統(tǒng)。它主要用于顯示現(xiàn)代英語(yǔ)和其他西歐語(yǔ)言。它是現(xiàn)今最通用的單字節(jié)編碼2010年12月8日叫基礎(chǔ)ASCII碼,使用7位二進(jìn)制數(shù)來(lái)表示所有的大寫(xiě)和小寫(xiě)字母,數(shù)字0到9、標(biāo)點(diǎn)符號(hào),以及在美式英語(yǔ)中使用的特殊控制字符。ASC11碼編碼的編碼規(guī)則是在下表中確定的,它是一種約定順序編碼,每個(gè)字符在ASC11碼表中的順序號(hào)成為字符的ASC值,它有兩種形式,一種包含128個(gè)字符,另一種包含256個(gè)字符。包括128個(gè)字符的ASC碼表,ASC值范圍是0~127,計(jì)算機(jī)中使用7個(gè)二進(jìn)制位就可以表示,因此稱(chēng)為7位二進(jìn)制碼。包含256個(gè)字符的ASC碼表,在7位碼表的基礎(chǔ)上,增加了對(duì)128個(gè)字符的支持。國(guó)際上7位ASC碼有廣泛的支持,對(duì)8位ASC11值支持程度較弱,尤其在中文環(huán)境下因?yàn)橥瑵h字的存儲(chǔ)編碼相沖突,8位ASC11碼值不被支持。在7位ASC11碼值中,字符總體上分為兩大類(lèi):控制字符和可顯示字符??刂谱址糜陲@示、打印、警告或傳輸過(guò)程和解釋?zhuān)陬l幕上不顯示,其ASC11值得范圍是0~31及127??娠@示字符則同英文中出現(xiàn)的各種字母和個(gè)符號(hào)相對(duì)應(yīng),涵蓋了英文所需要的所有文字符號(hào),其ASC11值范圍是32~126,可細(xì)分為以下幾大類(lèi):英文字符,ASC11值范圍是32~47、58~64、91~96及123~126;數(shù)字字符,ASC11值是48~57;大寫(xiě)英文字母,ASC11值是65~90;小寫(xiě)英文字母,ASC11值范圍是97~122.,2.GB2312編碼,GB2312或GB2312-80是一個(gè)簡(jiǎn)體中文字符集的中國(guó)國(guó)家標(biāo)準(zhǔn),全稱(chēng)為《信息交換用漢字編碼字符集基本集》,又稱(chēng)為GB0,由中國(guó)國(guó)家標(biāo)準(zhǔn)總局發(fā)布,1981年5月1日實(shí)施。GB2312編碼通行于中國(guó)大陸;新加坡等地也采用此編碼。中國(guó)大陸幾乎所有的中文系統(tǒng)和國(guó)際化的軟件都支持GB2312。GB2312標(biāo)準(zhǔn)共收錄6763個(gè)漢字,其中一級(jí)漢字3755個(gè),二級(jí)漢字3008個(gè);同時(shí),GB2312收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄語(yǔ)西里爾字母在內(nèi)的682個(gè)全角字符。ASC11碼值得出現(xiàn)有效的解決了西文文字的信息化問(wèn)題,但對(duì)于漢字字符卻完全不適用,為了滿(mǎn)足國(guó)內(nèi)在計(jì)算機(jī)中使用文字的需要,中國(guó)國(guó)家標(biāo)準(zhǔn)總局發(fā)布了一系列的漢字字符集國(guó)家標(biāo)準(zhǔn)編碼,統(tǒng)稱(chēng)為GB碼或國(guó)標(biāo)碼,其中最有影響的是與1980年發(fā)布的《信息交換用漢字編碼字符集基本集》,標(biāo)準(zhǔn)號(hào)為GB2312-1980.因其使用非常普遍,也常被統(tǒng)稱(chēng)為國(guó)標(biāo)碼.GB2312是一個(gè)簡(jiǎn)體中文字符集,由6763個(gè)常用漢字和682個(gè)全角的非漢字字符組成,其中漢字根據(jù)使用的頻率可分為兩級(jí)。一級(jí)漢字3755個(gè),二級(jí)漢字3008個(gè)。由于字符數(shù)量比較大,GB2312采用了二維矩陣編碼法對(duì)所有字符進(jìn)行編碼。首先構(gòu)造一個(gè)94列的方陣,對(duì)每一行成為一個(gè)“區(qū)”,每一列稱(chēng)為一個(gè)“位”,然后將所有字符依照下表的規(guī)律填寫(xiě)在方陣中。這樣所有的字符在方陣中都有一個(gè)唯一的位置,這個(gè)位置可以用區(qū)號(hào)、位號(hào)合成表示,稱(chēng)為字符的區(qū)位碼。因?yàn)閰^(qū)位碼同字符的位置是完全對(duì)應(yīng)的,因此區(qū)位碼同字符之間也是一一對(duì)應(yīng)的。,3.Big5編碼,“大五碼”(Big5)是在1984年由臺(tái)灣13家廠商與臺(tái)灣地區(qū)財(cái)團(tuán)法人信息工業(yè)策進(jìn)會(huì)為五大中文套裝軟件所設(shè)計(jì)的中文內(nèi)碼,所以就稱(chēng)為Big5中文內(nèi)碼,雖然五大套裝軟件并沒(méi)有成功,但Big5碼卻深遠(yuǎn)地影響中文電腦內(nèi)碼,直至今日。“五大碼”的英文名稱(chēng)“Big5”后來(lái)被人按英文字序譯回中文,以致現(xiàn)在有“五大碼”和“大五碼”兩個(gè)中文名稱(chēng)。大五碼是一種繁體中文漢字字符集,其中繁體漢字13053個(gè),808個(gè)標(biāo)點(diǎn)符號(hào),希臘字母及特殊符號(hào)。大五碼的編碼碼表直接針對(duì)存儲(chǔ)而設(shè)計(jì)、每個(gè)字符統(tǒng)一使用兩個(gè)字節(jié)存儲(chǔ)表示。第一字節(jié)范圍81H~FEH,避開(kāi)了同ASCII碼的沖突,第二字節(jié)范圍是40H~7EH和A1H~FEH,在同一正文不能對(duì)兩種字符集的字符同時(shí)支持。,Big5編碼的字符編碼分布表,4.Unicode編碼,Unicode字符集可以簡(jiǎn)寫(xiě)為UCS(UnicodeCharacterSet)。早期的Unicode標(biāo)準(zhǔn)有UCS-2、UCS-4的說(shuō)法。UCS-2用兩個(gè)字節(jié)編碼,UCS-4用4個(gè)字節(jié)編碼。UCS-4根據(jù)最高位為0的最高字節(jié)分成2^7=128個(gè)group。每個(gè)group再根據(jù)次高字節(jié)分為256個(gè)平面(plane)。每Unicode是國(guó)際組織制定的可以容納世界上所有文字和符號(hào)的字符編碼方案。Unicode用數(shù)字0-0 x10FFFF來(lái)映射這些字符,最多可以容納1114112個(gè)字符,或者說(shuō)有1114112個(gè)碼位。碼位就是可以分配給字符的數(shù)字。UTF-8、UTF-16、UTF-32都是將數(shù)字轉(zhuǎn)換到程序數(shù)據(jù)的編碼方案。,UCS是一種字符集編碼法,主要用于計(jì)算機(jī)程序和操作系統(tǒng)內(nèi)部。在存儲(chǔ)和傳輸中,往往不直接使用UCS編碼而是通過(guò)一定的轉(zhuǎn)換程序來(lái)實(shí)現(xiàn)。這些轉(zhuǎn)換編碼最通用的是utf8和utf16.由于大量使用的ASC11碼字符兼容所提出的UCS的一種實(shí)現(xiàn)就是utf8.utf8就是采用變長(zhǎng)字節(jié)表示一個(gè)字符,盡管有節(jié)約存儲(chǔ)和傳輸資源的好處,但也同時(shí)導(dǎo)致軟件實(shí)現(xiàn)有困難。平面根據(jù)第3個(gè)字節(jié)分為256行(row),每行有256個(gè)碼位(cell)。group0的平面0被稱(chēng)作BMP(BasicMultilingualPlane)。將UCS-4的BMP去掉前面的兩個(gè)零字節(jié)就得到了UCS-2。,五輸入編碼,世界上使用漢字的人口約占世界總?cè)丝诘乃姆种唬虼搜芯亢桶l(fā)展?jié)h字輸入編碼是一項(xiàng)非常急迫的任務(wù)。中國(guó)是漢字的發(fā)源國(guó),漢字應(yīng)用已有數(shù)千年歷史。一九八七年中國(guó)研究漢字輸入編碼的人員已近四百人,不論在深度和廣度上,都走在世界前列。漢字從形編碼利用人們已有的漢字書(shū)寫(xiě)知識(shí),在鍵盤(pán)上象寫(xiě)字一樣打入筆畫(huà)和字根,從計(jì)算機(jī)內(nèi)選出漢字,既直接又方便。從音編碼是以一九五八年二月十一日全國(guó)人大批準(zhǔn)公布的《漢語(yǔ)拼音方案》為基本編碼元素。漢語(yǔ)拼音是以北京語(yǔ)音為標(biāo)準(zhǔn)音,以北方語(yǔ)為基礎(chǔ)方言,以典范的白話文著作為語(yǔ)法規(guī)范的普通話。自推廣普通話以來(lái),已有相當(dāng)數(shù)量的人掌握了漢語(yǔ)拼音,以此為基礎(chǔ)作漢字輸入編碼,為這部分人所樂(lè)于接受。但中國(guó)各地方言復(fù)雜,不少人還難以做到準(zhǔn)確認(rèn)讀漢字,因此容易出現(xiàn)差錯(cuò)。,6.字型碼,漢字字型碼又稱(chēng)字字模,用于漢字在顯示屏或打印機(jī)輸出。漢字字型碼通常有兩種表示方式:點(diǎn)陣和矢量表示方法。用點(diǎn)陣表示字型時(shí),漢字字型碼指的是這個(gè)漢字字型點(diǎn)陣的代碼。根據(jù)輸出漢字的要求不同,點(diǎn)陣的多少也不同。簡(jiǎn)易型漢字為16*16點(diǎn)陣,提高型漢字為24*24點(diǎn)陣,32*32點(diǎn)陣,48*48點(diǎn)陣等等。點(diǎn)陣規(guī)模愈大,字型愈清晰美觀,所占存儲(chǔ)空間也愈大矢量表示方式存儲(chǔ)的是描述漢字字型的輪廓特征,當(dāng)要輸出漢字時(shí),通過(guò)計(jì)算機(jī)的計(jì)算,由漢字字型描述生成所需大小和形狀的漢字點(diǎn)陣。矢量化字型描述與最終文字顯示的大小,分辨率無(wú)關(guān),因此可以產(chǎn)生高質(zhì)量的漢字輸出。Windows中使用的TrueType技術(shù)就是漢字的矢量表示方式。,二.文字輸入到顯示流程,將字符寫(xiě)入一個(gè)MN的空白方格中,對(duì)表格中每個(gè)方格用一個(gè)比特(Bit)來(lái)表示,字符通過(guò)的方格用“1”表示,未通過(guò)的方格用“0”來(lái)表示,這樣將每個(gè)方格的值按照從左到右,從上到下的順序?qū)懴聛?lái),就形成了字符的點(diǎn)陣字型碼。顯示漢字時(shí),則執(zhí)行相反的過(guò)程,對(duì)于點(diǎn)陣字形為“0”的比特,在頻幕中像素顯示為背景色,而為“1”的比特,則顯示為前景色。根據(jù)點(diǎn)陣編碼時(shí)使用的表格大小,常用的漢字點(diǎn)陣字庫(kù)一般分為16點(diǎn)陣、24點(diǎn)陣、32點(diǎn)陣等格式。每個(gè)漢字碼占(MN)/8個(gè)字節(jié)數(shù)。點(diǎn)陣字型碼顯示漢字的熟讀很快,但在進(jìn)行放大時(shí)由于使用字塊填充,會(huì)出現(xiàn)明顯的鋸齒邊緣。因此點(diǎn)陣字庫(kù)一邊不用于圖形環(huán)境,常用在字符操作界面中。,1.點(diǎn)陣編碼法,文字輸入到顯示流程,2.矢量編碼法,文字字符的字形信息都是由多個(gè)筆畫(huà)子圖形組成的,適量編碼發(fā)將組成的字符每一筆畫(huà)用一組直線勾勒,然后按一定順序?qū)Ω鞴P畫(huà)一體組適量來(lái)表示.顯示漢字是,首先從矢量庫(kù)中檢索字型碼。矢量編碼法所占存儲(chǔ)空間的字節(jié)數(shù)不是固定的,取決于字符本身的復(fù)雜度,一般來(lái)講,所含筆畫(huà)越多,筆畫(huà)越復(fù)雜的字符,字型碼所占空間越大。矢量字符在顯示時(shí),需要進(jìn)行大量的矢量計(jì)算,耗費(fèi)時(shí)間要長(zhǎng)一些。但矢量字形方法是以幾何方法精確勾畫(huà)輪廓的,因此具有無(wú)級(jí)縮放的優(yōu)點(diǎn)。目前,矢量字形廣泛應(yīng)用在各種圖形用戶(hù)界面的系統(tǒng)以及文本的打印輸出環(huán)境。,計(jì)算機(jī)中的文字表達(dá)方式,,完,- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開(kāi)word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 計(jì)算機(jī) 中的 文字 表達(dá)方式
鏈接地址:http://www.3dchina-expo.com/p-3589358.html