GB2312中的漢字編碼規(guī)則 2008-07-26 21:56:10 標簽:GB2312 漢字編碼規(guī)則 休閑 職場 01-09區(qū)為特殊符號。
16-55區(qū)為一級漢字,按拼音排序。 56-87區(qū)為二級漢字,按部首/筆畫排序。
每個漢字及符號以兩個字節(jié)來表示。第一個字節(jié)稱為“高位字節(jié)”,第二個字節(jié)稱為“低位字節(jié)”。
“高位字節(jié)”使用了0xA1-0xF7(把01-87區(qū)的區(qū)號加上0xA0),“低位字節(jié)”使用了0xA1-0xFE(把01-94加上0xA0)。 例如“啊”字在大多數(shù)程序中,會以0xB0A1儲存。
(與區(qū)位碼對比:0xB0=0xA0+16,0xA1=0xA0+1)。 在附送你個 GB2312 編碼表。
(1)二進制、十進制和十六進制等常用數(shù)制及其相互轉(zhuǎn)換: 由于計算機的存儲器和寄存器是兩態(tài)部件,所以各種信息在計算機中是以二進制的方式存儲和計算的。
數(shù)制是由基數(shù)和基數(shù)個不同的數(shù)碼組成的。 BCD碼:十進制的二進制表示, 0:0000 1:0001 2:0010 3:0011 4:0100 5:0101 6:0110 7:0111 8:1000 9:1001 十進制的202可以表示成BCD碼為0010 0000 0010; 十六進制 二進制:十六進制表示法是用16位二進制數(shù)字組成的,每4位二進制數(shù)字表示一位十六進制數(shù),十六進制的數(shù)字表示從0-9,A,B,C,D,E,F共十六個字符。
十六進制與二進制相互轉(zhuǎn)換就是一位十六進制字符與四位二進制數(shù)字的相互轉(zhuǎn)換過程。 十進制 二進制:十進制向二進制轉(zhuǎn)換分兩步進行:首先把該數(shù)的整數(shù)部分和小數(shù)部分轉(zhuǎn)換為二進制數(shù);然后再把這兩部分合并起來即可。
十進制的整數(shù)部分向二進制轉(zhuǎn)換是通過對十進制不斷的除2取余數(shù)得到,十進制小數(shù)部分通過乘2取整的方法獲得,直到小數(shù)部分為0,所得到的整數(shù)部分就形成了二進制編碼;同樣的,二進制向十進制轉(zhuǎn)換如下所示: 十進制數(shù) N=(RnRn-1。 。
R1R0R-1。
R-m) = Rn *2n+Rn-1*2n-1+。
+R1*2+R0+R-1*2-1。
R-m*2-m 八進制 二進制:二進制向八進制轉(zhuǎn)換的方法是從小數(shù)點開始分別向左右每3位二進制數(shù)編成一組,若不夠3位,則小數(shù)點左側(cè)的最高位和右側(cè)的最低位用0補充,每一組用對應(yīng)的八進制的數(shù)碼表示即可;八進制向二進制轉(zhuǎn)換的方法是從小數(shù)點開始,把每一位八進制的數(shù)碼轉(zhuǎn)換成對應(yīng)的3位二進制即可。 其小數(shù)點左側(cè)的最高位或右側(cè)的最低位的0可以省去。
⑵ 計算機中的二進制數(shù)運算方法: 1.定點數(shù)運算:要判斷是否溢出?( ) 加法:[X+Y]=([X]補+[Y]補) MOD 2 減法:[X-Y]=([X]補+[-Y]補)MOD 2 乘法: 采用原碼比較方便,使用原碼一位乘法來求兩個定點數(shù)的乘積。 運算規(guī)則為: 乘積的符號位等于乘數(shù)和被乘數(shù)的符號位進異或; 乘積的值等于兩數(shù)絕對值之積,即乘數(shù)和被乘數(shù)的絕對值進行移位相加; 除法: 采用原碼比較方便。
運算規(guī)則為: 商的符號位同定點數(shù)原碼乘法的處理方法,由兩數(shù)的符號位進行異或 兩數(shù)的絕對值部分進行相除。 2. 浮點運算 1) 加減法: a) 對階 b) 尾數(shù)進行加、減運算 c) 規(guī)格化 d) 舍入 e) 溢出判斷 2) 乘除法: 浮點相乘,其積的階碼為兩數(shù)階碼相加,積的尾數(shù)為兩尾數(shù)相乘。
浮點數(shù)相除,其商的階碼為兩數(shù)階碼之差,商的尾數(shù)為兩尾數(shù)相除。 其結(jié)果都需要進行規(guī)格化處理,同時還需要進行溢出判斷。
⑶ 邏輯代數(shù)的基本運算和邏輯表達式的化簡: 邏輯表達式就是以邏輯運算符把若干邏輯變量連接在一起表示某種關(guān)系的表達式。一個邏輯函數(shù)往往有多種不同的表達式。
可以利用其本邏輯運算規(guī)律和一些常用的邏輯恒等式對邏輯表達式進行合并項、吸收項、配項、消去項等操作來化簡。 基本的邏輯運算有“與”、“或”、“非”、“異或”。
常用的邏輯運算公式: 交換律:A+B=B+A A*B=B*A 結(jié)合律:A+(B+C)=(A+B)+C 分配律:A*(B+C)=A*B+A*C A+(B*C)=(A+B)*(A+C) 反演律:A+B= A * B 重疊律:A+A=A A*A=A 互補律:A+ A =1 A* A =0 對合律: A =A 0-1律:0+A=A A*A=0。
在計算機硬件中,編碼(coding)是在一個主題或單元上為數(shù)據(jù)存儲,管理和分析的目的而轉(zhuǎn)換信息為編碼值(典型的如數(shù)字)的過程。
在軟件中,編碼意味著邏輯地使用一個特定的語言如C或C++來執(zhí)行一個程序字符編碼:使用二進制數(shù)對字符進行的編碼稱字符編碼。 ASCII碼:美國標準信息交換碼的英文簡稱,是計算機中用二進制表示字母、數(shù)字、符號的一種編碼標準。
ASCII碼有兩種,使用7位二進制數(shù)的稱為基本ASCII碼;使用8位二進制數(shù)的稱為擴展ASCII碼。 漢字編碼:用于表示漢字字符的二進制字符編碼。
漢字編碼根據(jù)其用途不同可分為輸入碼、內(nèi)部碼、字型碼和地址碼等。
計算機常用的信息編碼有文字編碼、語義編碼、電子編碼、PCM編碼、神經(jīng)編碼等。
一、文字編碼
文字編碼(Text encoding)使用一種標記語言來標記一篇文字的結(jié)構(gòu)和其他特征,以方便計算機進行處理。
二、語義編碼
語義編碼(Semantics encoding),以正式語言乙對正式語言甲進行語義編碼,即是使用語言乙表達語言甲所有的詞匯(如程序或說明)的一種方法。
三、電子編碼
電子編碼(Electronic encoding)是將一個信號轉(zhuǎn)換成為一個代碼,這種代碼是被優(yōu)化過的以利于傳輸或存儲。轉(zhuǎn)換工作通常由一個編解碼器完成。
四、PCM編碼
PCM脈沖編碼調(diào)制是Pulse Code Modulation的縮寫(又叫脈沖編碼調(diào)制):數(shù)字通信的編碼方式之一。主要過程是將話音、圖像等模擬信號每隔一定時間進行取樣,使其離散化,同時將抽樣值按分層單位四舍五入取整量化,同時將抽樣值按一組二進制碼來表示抽樣脈沖的幅值。
五、神經(jīng)編碼
神經(jīng)編碼(Neural encoding)是指信息在神經(jīng)元中被如何描繪的方法。
聲明:本網(wǎng)站尊重并保護知識產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請在一個月內(nèi)通知我們,我們會及時刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習(xí)鳥. 頁面生成時間:3.061秒