1.漢字的輸入編碼 為了能直接使用西文標(biāo)準(zhǔn)鍵盤把漢字輸入到計算機(jī),就必須為漢字設(shè)計相應(yīng)的輸入編碼方法。當(dāng)前采用的方法主要有以下三類: 數(shù)字編碼 常用的是國標(biāo)區(qū)位碼,用數(shù)字串代表一個漢字輸入。區(qū)位碼是將國家標(biāo)準(zhǔn)局公布的6763個兩級漢字分為94個區(qū),每個區(qū)分94位,實際上把漢字表示成二維數(shù)組,每個漢字在數(shù)組中的下標(biāo)就是區(qū)位碼。區(qū)碼和位碼各兩位十進(jìn)制數(shù)字,因此輸入一個漢字需按鍵四次。
數(shù)字編碼輸入的優(yōu)點是無重碼,且輸入碼與內(nèi)部編碼的轉(zhuǎn)換比較方便,缺點是代碼難以記憶。
拼音碼 拼音碼是以漢字拼音為基礎(chǔ)的輸入方法。使用簡單方便,但漢字同音字太多,輸入重碼率很高,同音字選擇影響了輸入速度。
字形編碼 字形編碼是用漢字的形狀來進(jìn)行的編碼。把漢字的筆劃部件用字母或數(shù)字進(jìn)行編碼,按筆劃的順序依次輸入,就能表示一個漢字。
為了加快輸入速度,在上述方法基礎(chǔ)上,發(fā)展了詞組輸入\聯(lián)想輸入等多種快速輸入方法。但是都利用了鍵盤進(jìn)行“手動”輸入。理想的輸入方式是利用語音或圖象識別技術(shù)“自動”將拼音或文本輸入到計算機(jī)內(nèi),使計算機(jī)能認(rèn)識漢字,聽懂漢語,并將其自動轉(zhuǎn)換為機(jī)內(nèi)代碼表示。目前這種理想已經(jīng)成為現(xiàn)實。
2.漢字內(nèi)碼 漢字內(nèi)碼是用于漢字信息的存儲、交換、檢索等操作的機(jī)內(nèi)代碼,一般采用兩個字節(jié)表示。英文字符的機(jī)內(nèi)代碼是七位的ASCII碼,當(dāng)用一個字節(jié)表示時,最高位為“0”。為了與英文字符能相互區(qū)別,漢字機(jī)內(nèi)代碼中兩個字節(jié)的最高位均規(guī)定為“1”。
注意:有些系統(tǒng)中字節(jié)的最高位用于奇偶校驗位,這種情況下用三個字節(jié)表示漢字內(nèi)碼。
3.漢字字模碼 字模碼是用點陣表示的漢字字形代碼,它是漢字的輸出形式。
根據(jù)漢字輸出的要求不同,點陣的多少也不同。字模點陣的信息量很大,所占存儲空間也很大。因此字模點陣只能用來構(gòu)成漢字庫,而不能用于機(jī)內(nèi)存儲。字庫中存儲了每個漢字的點陣代碼。當(dāng)顯示輸出或打印輸出時才檢索字庫,輸出字模點陣,得到字形。
圖2.1 漢字的字模點陣及編碼
注意,漢字的輸入編碼、漢字內(nèi)碼、字模碼是計算機(jī)中用于輸入、內(nèi)部處理、輸出三種不同用途的編碼,不要混為一談。
機(jī)內(nèi)碼 國標(biāo)碼:是指我國1981年公布的“中華人民共和國國家標(biāo)準(zhǔn)信息交換漢字編碼”,代號為“GB2312-80”。
由連續(xù)的兩個字節(jié)組成。 2.機(jī)內(nèi)碼:在計算機(jī)內(nèi)表示漢字的代碼是漢字機(jī)內(nèi)碼,漢字機(jī)內(nèi)碼由國標(biāo)碼演化而來,把表示國標(biāo)碼的兩個字節(jié)的最高位分別加“1”,就變成漢字機(jī)內(nèi)碼 3.輸入碼:漢字輸入碼是指直接從鍵盤輸入的各種漢字輸入方法的編碼,屬于外碼。
4.字型點陣碼:用點陣方式來構(gòu)造漢字字型,然后存儲在計算機(jī)內(nèi),構(gòu)成漢字字模庫。目的是為了能顯示和打印漢字。
(1)區(qū)位碼先轉(zhuǎn)換成十六進(jìn)制數(shù)表示 (2)(區(qū)位碼的十六進(jìn)制表示)+2020H=國標(biāo)碼; (3)國標(biāo)碼+8080H=機(jī)內(nèi)碼 漢字的機(jī)內(nèi)碼是指在計算機(jī)中表示一個漢字的編碼。機(jī)內(nèi)碼與區(qū)位碼稍有區(qū)別。
漢字區(qū)位碼的區(qū)碼和位碼的取值均在1~94之間,如直接用區(qū)位碼作為機(jī)內(nèi)碼,就會與基本ASCII碼混淆。為了避免機(jī)內(nèi)碼與基本ASCII碼的沖突,需要避開基本ASCII碼中的控制碼(00H~1FH),還需與基本ASCII碼中的字符相區(qū)別。
為了實現(xiàn)這兩點,可以先在區(qū)碼和位碼分別加上20H,在此基礎(chǔ)上再加80H(此處“H”表示前兩位數(shù)字為十六進(jìn)制數(shù))。經(jīng)過這些處理,用機(jī)內(nèi)碼表示一個漢字需要占兩個字節(jié),分別 稱為高位字節(jié)和低位字節(jié),這兩位字節(jié)的機(jī)內(nèi)碼按如下規(guī)則表示: 高位字節(jié)=區(qū)碼+20H+80H(或區(qū)碼+A0H) 低位字節(jié)=位碼+20H+80H(或位碼+AOH) 由于漢字的區(qū)碼與位碼的取值范圍的十六進(jìn)制數(shù)均為01H~5EH(即十進(jìn)制的01~94),所以漢字的高位字節(jié)與低位字節(jié)的取值范圍則為A1H~FEH(即十進(jìn)制的161~254)。
例如,漢字“啊”的區(qū)位碼為1601,區(qū)碼和位碼分別用十六進(jìn)制表示即為1001H,它的機(jī)內(nèi)碼的高位字節(jié)為B0H,低位字節(jié)為A1H,機(jī)內(nèi)碼就是B0A1H。 2603 = 1A03H 區(qū)位碼 + A0A0H = BAA3H 機(jī)內(nèi)碼 漢字的編碼知識 信息編碼各國有各國不同的編碼,國際上統(tǒng)一使用的編碼為ASCII(美國標(biāo)準(zhǔn)信息交換代碼),我國使用的有國標(biāo)碼BG(中文),和BIG5(中文繁體)兩種。
附帶要知道:中文字庫(字庫文件名,大小,擴(kuò)展名,存放位置) 中文輸入方法(語音輸入,鍵盤輸入,手寫輸入,掃描輸入等) 1.漢字的編碼 (1)國標(biāo)碼:是指我國1980年公布的“信息交換漢字編碼字符集”,代號為“GB2312-80”。由連續(xù)的兩個字節(jié)組成。
(2)機(jī)內(nèi)碼:在計算機(jī)內(nèi)表示漢字的代碼是漢字機(jī)內(nèi)碼,漢字機(jī)內(nèi)碼由國標(biāo)碼演化而來,把表示國標(biāo)碼的兩個字節(jié)的最高位分別加“1”,就變成漢字機(jī)內(nèi)碼。 (3)輸入碼:漢字輸入碼是指直接從鍵盤輸入的各種漢字輸入方法的編碼,屬于外碼。
(4)字型點陣碼:用點陣方式來構(gòu)造漢字字型,然后存儲在計算機(jī)內(nèi),構(gòu)成漢字字模庫。目的是為了能顯示和打印漢字。
編碼的轉(zhuǎn)換舉例 漢字 區(qū)位碼 16進(jìn)制 國標(biāo)碼 機(jī)內(nèi)碼 文 4636 2E24H 4E44H CEC4H “文”的區(qū)位碼為4636,區(qū)碼和位碼分別用16進(jìn)制表示即為“2E24H”, 0010 1110 0010 0100轉(zhuǎn)換成國標(biāo)碼“4E44H”,0100 1110 0100 0100機(jī)內(nèi)碼為“CEC4H”, 1100 1110 1100 0100 2.漢字的輸入方法 漢字輸入方法目前有兩大類四種。 (1)鍵盤輸入法。
這是最常用的,利用各種漢字輸入方法的編碼敲擊鍵盤來輸入漢字; (2)非鍵盤輸入法。目前主要有三種方法。
手寫筆輸入法:利用漢字識別技術(shù),通過書寫筆在感應(yīng)板上書寫漢字把其輸入的方法。 語音輸入法:利用語音識別技術(shù),通過口說來輸入漢字。
掃描識別輸入,是將印或?qū)懺诩埳系臐h字通過掃描儀輸入計算機(jī),再經(jīng)相應(yīng)軟件處理后轉(zhuǎn)換成漢字機(jī)內(nèi)碼。 3.漢字字符集的概念 有兩種漢字字符集。
(1)國標(biāo)碼字符集GB2312-80:該字符集收錄了6763個常用漢字,其中一級漢字3755個,二級漢字3008個。另外還收錄了各種符號682個,合計7445個。
(2)GBK漢字集:GBK即漢字?jǐn)U充內(nèi)碼規(guī)范,又稱大字符集,一共收錄了20900個漢字。在Windows簡體中文版中,又增加了101個補充字,一共有21001個字。
它包容了GB2312-80的6763個常用漢字,臺灣BIG5碼收錄了13000多個漢字,是目前見到的收錄漢字最多的漢字系統(tǒng)。
584,5682177778,12234.1798,76868.587129955,829475我發(fā)誓,我要抱你一起去吹吹風(fēng),與你愛相隨。
一起走吧,去溜噠溜噠。我不介意你久久吻我,被愛就是幸福。
1部: 1240最愛是你; 1314一生一世; 1372一廂情愿; 1314925一生一世就愛我; 1392010一生就愛你一個; 1414意思意思; 147一世情; 1573一往情深; 1711一心一意; 2部: 200愛你哦; 20160愛你一萬年; 20184愛你一輩子; 2037為你傷心; 20475愛你是幸福; 20609愛你到永久; 20863愛你到來生; 230愛上你; 246餓死了; 246437愛是如此神奇; 20910愛我久一點; 259695愛我就了解我; 259758愛我就娶我吧; 2627愛來愛去; 282餓不餓; 296愛走了; 2925184愛就愛我一輩子; 3部: 300想你哦; 30920想你就想你; 309420想你就是愛你; 3013想你一生; 32012想念你的愛; 32069想愛你很久; 3207778想和你去吹吹風(fēng); 3399長長久久; 330335想想你想想我; 3344生生世世; 356上網(wǎng)了; 35910想我久一點; 3731真心真意; 4部: 440295謝謝你愛過我; 4457速速回機(jī); 4422335時時刻刻想想我; 456是我啦; 460想念你; 505求救(SOS); 510我依你、我已來; 507680我一定要追你; 51020我依然愛你; 51095我要你嫁我; 51396我要睡覺了; 514無意思; 515206我已不愛你了; 518720我一輩子愛你; 51830我依舊想你; 520我愛你; 520x10000我愛你一萬年; 521我愿意; 52308我愛上你啦; 52406我愛死你了; 526我餓了; 5260我暗戀你; 530我想你; 530184我想你一輩子; 5366我想聊聊; 53406我想死你了; 5376我生氣了; 53517230我想我已經(jīng)愛上你; 53719我深情依舊; 53770我想親親你; 53782我心情不好; 53880我想抱抱你; 53980我想揍扁你; 5406我是你的; 543720我是真心愛你; 54335無事想想我; 5452830無時無刻不想你; 546我輸了; 5460我思念你; 5490我去找你; 54920我始終愛你; 55646我無聊死了; 556520我不能不愛你; 5620我很愛你; 562009487我若愛你我就是白癡; 5670我要娶你; 57350我只在乎你; 57386我去上班了; 574839我其實不想走; 57410我心屬于你; 578補習(xí)班; 58晚安; 586我不來; 584520我發(fā)誓我愛你; 587我抱歉; 592我好餓; 59420我就是愛你; 609到永久; 6120懶得理你; 6785753老地方不見不散; 6868溜噠溜噠; 687對不起; 7部: 70345請你相信我; 706起來吧; 70626請你留下來; 706519184請你讓我依靠一輩子; 7086七零八落; 7087請你別走; 70885請你幫幫我; 721親愛的; 729去喝酒; 7319天長地久; 740氣死你; 737420今生今世愛你; 7408695其實你不了解我; 73748096今生今世伴你左右; 745氣死我; 7474074去死去死你去死; 756辛苦了; 74839其實不想走; 765去跳舞; 7678吃飽了嗎; 770880520親親你抱抱你我愛你; 7731心心相??; 77543猜猜我是誰; 77895緊緊抱著我; 7998去走走吧;。
數(shù)字有四種寫法:
1、中文小寫數(shù)字:一、二、三、四、五、六、七、八、九;
2、中文大寫數(shù)字:零、壹、貳、叁、肆、伍、陸、柒、捌、玖;
3、阿拉伯?dāng)?shù)字:0、1、2、3、4、5、6、7、8、9;
4、羅馬數(shù)字采用七個羅馬字母作數(shù)字,即Ⅰ(1)、X(10)、C (100)、M (1000),V (5)、L(50)、D (500)。
擴(kuò)展資料:
1、進(jìn)位數(shù)碼與大、小寫數(shù)字的對照表
阿拉伯?dāng)?shù)字 :10,20,30,40,50,60,70,80,90,100
中文大寫數(shù)字:拾,貳拾/念,叁拾,肆拾,伍拾,陸拾,柒拾,捌拾,玖拾壹佰
中文小寫數(shù)字:十,二十/廿,三十/卅,四十/卌,五十/圩六十/圓,七十/進(jìn),八十/枯,九十/枠,一百
2、羅馬數(shù)字
(1)相同的數(shù)字連寫,所表示的數(shù)等于這些數(shù)字相加得到的數(shù),如 Ⅲ=3;
(2)小的數(shù)字在大的數(shù)字的右邊,所表示的數(shù)等于這些數(shù)字相加得到的數(shù),如 Ⅷ=8、Ⅻ=12;
(3)小的數(shù)字(限于 Ⅰ、X 和 C)在大的數(shù)字的左邊,所表示的數(shù)等于大數(shù)減小數(shù)得到的數(shù),如 Ⅳ=4、Ⅸ=9;
(4)在一個數(shù)的上面畫一條橫線,表示這個數(shù)增值 1,000 倍,如
=5000。
參考資料:搜狗百科詞條--中文數(shù)字
聲明:本網(wǎng)站尊重并保護(hù)知識產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請在一個月內(nèi)通知我們,我們會及時刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習(xí)鳥. 頁面生成時間:3.694秒