第1章 信息、傳播與媒體 1
1.1 信息 1
1.1.1 信息的定義 1
1.1.2 信息的屬性 4
1.2 傳播 10
1.2.1 傳播的概念 10
1.2.2 傳播類型 13
1.2.3 人類社會(huì)網(wǎng)絡(luò)與梅特卡夫法則 16
1.3 媒體 17
1.3.1 媒體的一般概念 17
1.3.2 媒體類別 18
1.3.3 媒體演進(jìn) 20
習(xí)題 30
第2章 新媒體印象 35
2.1 新媒體基礎(chǔ):搜索引擎與門戶網(wǎng)站 35
2.1.1 搜索引擎 35
2.1.2 門戶網(wǎng)站 38
2.2 網(wǎng)絡(luò)社交與網(wǎng)絡(luò)社區(qū) 42
2.2.1 BBS 43
2.2.2 QQ 45
2.2.3 微信 45
2.3 網(wǎng)絡(luò)個(gè)人空間 49
2.3.1 博客 49
2.3.2 微博 52
2.3.3 網(wǎng)絡(luò)直播 54
2.3.4 微信公眾號(hào) 56
2.4 傳統(tǒng)媒體的新形態(tài) 57
2.4.1 IPTV 57
2.4.2 播客 58
2.4.3 網(wǎng)絡(luò)出版與手機(jī)出版 60
2.4.4 動(dòng)畫 63
2.4.5 網(wǎng)絡(luò)游戲 66
2.5 其他重要新媒體形態(tài) 69
2.5.1 在線調(diào)查與在線投票 69
2.5.2 MOOC與SPOC 73
2.6 現(xiàn)代新媒體定義 75
2.6.1 基于技術(shù)和傳播工具的新媒體定義 75
2.6.2 基于媒介對(duì)于人的延伸角度的新媒體定義 76
2.6.3 “新媒體”的其他定義 77
2.7 現(xiàn)代新媒體的基本特點(diǎn) 77
2.7.1 現(xiàn)代新媒體的人際關(guān)系特征 78
2.7.2 現(xiàn)代新媒體的媒介特征 78
2.7.3 現(xiàn)代新媒體的時(shí)空特征 79
2.7.4 現(xiàn)代新媒體的傳播特征 79
2.7.5 現(xiàn)代新媒體的行業(yè)特征 81
習(xí)題 82
第3章 新媒體的技術(shù)元素 84
3.1 信息編碼基礎(chǔ) 84
3.1.1 數(shù)值數(shù)據(jù)的0、1編碼 84
3.1.2 西文字符的0、1編碼 87
3.1.3 漢字的0、1編碼 89
3.1.4 文本壓縮 92
3.2 電子數(shù)字計(jì)算機(jī)技術(shù)基礎(chǔ) 93
3.2.1 Neumann計(jì)算機(jī)體系組成 93
3.2.2 電子數(shù)字計(jì)算機(jī)存儲(chǔ)原理 94
3.2.3 計(jì)算機(jī)的運(yùn)算器和寄存器 95
3.2.4 計(jì)算機(jī)控制器的工作原理 96
3.2.5 電子數(shù)字計(jì)算機(jī)的標(biāo)準(zhǔn)輸入輸出 98
3.2.6 操作系統(tǒng)——計(jì)算機(jī)的自我管理 110
3.3 多媒體技術(shù) 114
3.3.1 多媒體技術(shù)概述 114
3.3.2 音頻處理技術(shù) 117
3.3.3 圖形圖像處理技術(shù) 121
3.3.4 動(dòng)畫制作 125
3.3.5 視頻處理技術(shù) 126
3.3.6 非線性編輯 127
3.4 通信技術(shù)基礎(chǔ) 129
3.4.1 通信系統(tǒng)與信號(hào) 129
3.4.2 信道及其類型 130
3.4.3 信道的技術(shù)指標(biāo) 132
3.4.4 多路復(fù)用 135
3.4.5 移動(dòng)通信的基本類型 138
3.5 計(jì)算機(jī)網(wǎng)絡(luò)基礎(chǔ) 140
3.5.1 計(jì)算機(jī)網(wǎng)絡(luò)與Internet 140
3.5.2 IP地址、路由與端口號(hào) 143
3.5.3 接入技術(shù) 145
3.6 Web技術(shù) 149
3.6.1 URI與URL 150
3.6.2 Web的原理 151
3.6.3 搜索引擎與網(wǎng)絡(luò)信息搜索 154
3.7 移動(dòng)通信客戶端技術(shù) 156
3.7.1 手機(jī)網(wǎng)絡(luò)制式 156
3.7.2 智能手機(jī)及其特點(diǎn) 160
3.7.3 智能手機(jī)的軟件系統(tǒng) 162
習(xí)題 163
第4章 新媒體的文化元素 168
4.1 文化與亞文化 168
4.1.1 文化概述 168
4.1.2 亞文化 172
4.2 新媒體亞文化 178
4.2.1 網(wǎng)絡(luò)社區(qū)亞文化 178
4.2.2 粉絲文化 185
4.2.3 網(wǎng)紅文化 186
4.2.4 點(diǎn)贊文化 187
4.2.5 網(wǎng)絡(luò)流行語(yǔ)言 188
4.3 創(chuàng)意文化 193
4.3.1 創(chuàng)意、創(chuàng)意思維與創(chuàng)意設(shè)計(jì) 193
4.3.2 創(chuàng)意思維的形式 193
4.3.3 文化創(chuàng)意產(chǎn)業(yè) 195
4.4 新媒體文化的藝術(shù)細(xì)胞 197
4.4.1 藝術(shù)概述 197
4.4.2 游戲心理與游戲文化 199
4.4.3 新媒體藝術(shù) 204
4.4.4 色彩文化與藝術(shù) 207
習(xí)題 216
第5章 新媒體生態(tài) 222
5.1 新媒體生態(tài)威脅 222
5.1.1 不良行為危害 222
5.1.2 不良信息侵?jǐn)_ 225
5.1.3 網(wǎng)絡(luò)暴力 226
5.1.4 負(fù)面擬像與“電子鴉片”侵害 228
5.1.5 網(wǎng)絡(luò)欺詐 232
5.1.6 知識(shí)產(chǎn)權(quán)侵犯 238
5.1.7 惡意代碼和黑客攻擊 239
5.1.8 偽基站攻擊 242
5.1.9 網(wǎng)絡(luò)黑社會(huì) 245
5.2 新媒體生態(tài)保護(hù) 245
5.2.1 弘揚(yáng)正能量亞文化 245
5.2.2 新媒體指數(shù) 247
5.2.3 新媒體素養(yǎng)與道德規(guī)范 254
5.2.4 新媒體法制環(huán)境 265
5.2.5 新媒體安全技術(shù)與管理 273
習(xí)題 277
附錄A 一組常用的QQ表情包 282
參考文獻(xiàn) 283
第3章 新媒體的技術(shù)元素
新媒體以現(xiàn)代通信與計(jì)算機(jī)技術(shù)為支撐,它的不斷發(fā)展也越來越依賴于這些技術(shù)的進(jìn)步,使得這些技術(shù)越來越成為新媒體不可分割的基本元素。
3.1 信息編碼基礎(chǔ)
數(shù)據(jù)是記錄信息的符號(hào)。用電子數(shù)字計(jì)算機(jī)進(jìn)行信息處理,就是對(duì)符號(hào)形式的數(shù)據(jù)進(jìn)行存儲(chǔ)與處理。電子數(shù)字計(jì)算機(jī)以開關(guān)元件為基礎(chǔ)。開關(guān)元件是具有兩種穩(wěn)定狀態(tài)的電子元件,因此要用電子數(shù)字計(jì)算機(jī)進(jìn)行處理的數(shù)據(jù)必須表示為用代表其電子開關(guān)兩種狀態(tài)的0和1表示的符號(hào)。將其他形式的數(shù)據(jù)符號(hào)轉(zhuǎn)換為0、1表示的符號(hào)的過程,稱為0、1編碼。
3.1.1 數(shù)值數(shù)據(jù)的0、1編碼
1. 二進(jìn)制的基本概念
人們最習(xí)慣的計(jì)數(shù)方法是使用十進(jìn)制。十進(jìn)制具有如下3個(gè)特點(diǎn)。
(1)用0、1、2、3、4、5、6、7、8、9十個(gè)符號(hào)表示數(shù)。
(2)“逢十進(jìn)一”,即在某一位上,當(dāng)夠10時(shí),就要向左邊的位進(jìn)一。因?yàn)槊總(gè)位上最大值只能是9。
(3)十進(jìn)制數(shù)從小數(shù)點(diǎn)往左,依次為十位、百位、千位、萬(wàn)位……從小數(shù)點(diǎn)向右,依次為十分位、百分位、千分位、萬(wàn)分位……即一個(gè)數(shù)字m,在位置i上時(shí),其值為m×10i。10i稱為i位權(quán)。例如,個(gè)位的位權(quán)為100,十位的位權(quán)為101,百位的位權(quán)為102…
相對(duì)于十進(jìn)制,二進(jìn)制具有如下特點(diǎn)。
(1)只能用兩個(gè)符號(hào)表示數(shù)。在中國(guó)的八卦中,這兩個(gè)符號(hào)用“—”和“--”表示;在數(shù)字電路中,這兩個(gè)符號(hào)可以用高電位和低電位、有脈沖和無(wú)脈沖、開和關(guān)等表示。這里,統(tǒng)一用0和1表示。
(2)“逢二進(jìn)一”,即在某一位上,當(dāng)夠2時(shí),就要向左邊的位進(jìn)一。因?yàn)槊總(gè)位上的最大值只能是1。
(3)十進(jìn)制數(shù)從小數(shù)點(diǎn)往左,各位的位權(quán)依次為20、21、22…,即1、2、4、8、16、32、64、128、256、512、1024、2048等;小數(shù)點(diǎn)往右各位的位權(quán)依次為2-1、2-2…,即0.5、0.25、0.125、0.0625、0.03125等。
2. 十進(jìn)制數(shù)與二進(jìn)制數(shù)之間的轉(zhuǎn)換
表3.1為幾個(gè)十進(jìn)制數(shù)與二進(jìn)制數(shù)之間的對(duì)應(yīng)關(guān)系。
表3.1 幾個(gè)十進(jìn)制數(shù)與二進(jìn)制數(shù)之間的對(duì)應(yīng)關(guān)系
十進(jìn)制數(shù)
0
1
2
3
4
5
6
7
8
9
10
16
32
二進(jìn)制數(shù)
0
1
10
11
100
101
110
111
1000
1001
1010
10000
100000
下面介紹一般數(shù)的轉(zhuǎn)換方法。
1)二—十(B→D)進(jìn)制轉(zhuǎn)換
規(guī)則:將1所在的位上的位權(quán)值相加。
例3.1 101.11101B= ?D。
解:
位 權(quán):22 21 20 2-1 2-2 2-3 2-4 2-5
二進(jìn)制數(shù):1 0 1 . 1 1 1 0 1
計(jì) 算:4 + 0 + 1 + 0.5+0.25+0.125 +0 + 0.03125 = 5.90625D
2)整數(shù)十—二轉(zhuǎn)換
規(guī)則:從足夠的位權(quán)值開始,連續(xù)減去各個(gè)位權(quán)值:夠則減該位取1,不夠則不減該位取0;直到減完最后一個(gè)位權(quán)值1。
例3.2 158D=?B。
解:考慮158在128與256之間,則先減128,該位取1,差為30;減64,不足,該位取0;再減32,不足,取0;再減16,夠減,取1,差為14;減8。夠減取1,差為6;減4,夠取1,差為2;減2,夠取1,差為0;減1,不夠取0,結(jié)束。
上述過程如圖3.1所示。
圖3.1 將158轉(zhuǎn)換為二進(jìn)制數(shù)
3)小數(shù)十—二進(jìn)制轉(zhuǎn)換
規(guī)則:從小數(shù)點(diǎn)開始,連續(xù)減各小數(shù)位的位權(quán)值,夠則減該位取1,不夠則不減該位取0,直到減為0或到要求的位數(shù)。
例3.3 0.24D= ?B,到小數(shù)點(diǎn)后4位。
解:計(jì)算過程如圖3.2所示。
圖3.2 將0.24轉(zhuǎn)換為二進(jìn)制數(shù)
注意:第一個(gè)0與小數(shù)點(diǎn)要照寫。
有時(shí),小數(shù)十—二進(jìn)制轉(zhuǎn)換,會(huì)出現(xiàn)轉(zhuǎn)換不完的情況。這時(shí)可按“舍0取1”(相當(dāng)于四舍五入)的原則,取到所需的位數(shù)。
3. 十六進(jìn)制編碼
二進(jìn)制數(shù)書寫太長(zhǎng),難認(rèn)、難記。為了給程序員提供速記形式,使用中常用十六進(jìn)制(Hexadecimal)作為二進(jìn)制的助記符。
十六進(jìn)制記數(shù)符為0、1、2、3、4、5、6、7、8、9、A(a)、B(b)、C(c)、D(d)、E(e)、F(f)。
將二進(jìn)制數(shù)由小數(shù)點(diǎn)起,向兩側(cè)分別以每4位劃一組(最高位與最低位不足4位以0補(bǔ)),每一組便為一個(gè)十六進(jìn)制數(shù)。
例3.4 10110 1110.1111B=?H。
解:
0001 0110 1110 . 1111
補(bǔ)零
1 6 E F
所以 10110 1110.1111B=16E.FH。
4. 符號(hào)的0、1編碼
在計(jì)算機(jī)中不僅要用0、1編碼的形式表示一個(gè)數(shù)的數(shù)值部分,而且正、負(fù)號(hào)也要用0、1編碼來表示。一般用數(shù)的最高有效位(最左邊一位)(Most Significant Bit,MSB)表示數(shù)的正負(fù),通常
MSB=0 表示正數(shù),如+1011表示為01011;
MSB=1 表示負(fù)數(shù),如-1011表示為11011。
一個(gè)數(shù)在機(jī)器內(nèi)的表示形式稱為機(jī)器數(shù)。它把一個(gè)數(shù)連同它的符號(hào)在機(jī)器中用0和1進(jìn)行編碼,這個(gè)數(shù)本身的值稱為該機(jī)器數(shù)的真值。上邊的01011和11011就是兩個(gè)機(jī)器數(shù),它們的真值分別為+1011和-1011。
當(dāng)然,不考慮數(shù)的正、負(fù)時(shí),不需要用1位來表示符號(hào)。這種沒有符號(hào)位的數(shù),稱為無(wú)符號(hào)數(shù)。由于符號(hào)位要占用1位,所以用同樣字長(zhǎng),無(wú)符號(hào)數(shù)的最大值比有符號(hào)數(shù)要大一倍。如字長(zhǎng)為4位時(shí),能表示的無(wú)符號(hào)數(shù)的最大值為1111,即15,而表示的有符號(hào)數(shù)的最大值為111,即7。
5. 實(shí)數(shù)的0、1編碼
在數(shù)學(xué)中實(shí)數(shù)用來測(cè)量連續(xù)的量,在理論上小數(shù)點(diǎn)的右邊是一個(gè)無(wú)窮的數(shù)列(可以是循環(huán)的,也可以是非循環(huán)的)。在實(shí)際應(yīng)用中被近似為一個(gè)有限小數(shù)。在計(jì)算機(jī)中,比起整數(shù)的0、1編碼來,帶小數(shù)的數(shù)的0、1編碼,還要考慮處理的效率問題,因而也就復(fù)雜一些。通常,一個(gè)實(shí)數(shù)可以近似表示成指數(shù)形式。例如,一個(gè)十進(jìn)制數(shù)可以表示為
N1=3.14159=0.314159×101=0.0314159×102
同樣,一個(gè)二進(jìn)制數(shù)可以表示為
N2=0.011B=0.110B×2-1=0.0011B×21
一般地說,一個(gè)任意二進(jìn)制數(shù)N可以表示為
N=2E×M
式中:
E為數(shù)N的階碼;M為數(shù)N的有效數(shù)字,稱為尾數(shù)。為了用二進(jìn)制表示這樣形式的實(shí)數(shù),可以把一個(gè)字長(zhǎng)分為如圖3.3所示的4部分。其中,Ef、S分別稱為階碼E和尾數(shù)M的符號(hào)位,它們一般占1b。使用這種格式的關(guān)鍵是規(guī)定好總的字長(zhǎng)和每部分的長(zhǎng)度。
圖3.3 浮點(diǎn)數(shù)的機(jī)內(nèi)表示
例如,用4B字長(zhǎng),階碼E占4b,-1011.01101可以表示為圖3.4所示的樣子。其中的尾數(shù)M部分為純小數(shù)0.1011 0110 1000 0000 0000 0000。
圖3.4 一個(gè)浮點(diǎn)數(shù)的實(shí)例
3.1.2 西文字符的0、1編碼
1.ASCII字符集
西文字符中最基本、應(yīng)用最多的字符有以下一些。
(1)26個(gè)小寫拉丁字母。
(2)26個(gè)大寫拉丁字母。
(3)約25個(gè)特殊字符,如[、+、-、@、|、# 等。
(4)10個(gè)數(shù)字碼:0、1、2、3、4、5、6、7、8、9。
共計(jì)87個(gè)字符。由于位于64~128之間,所以需要7b的長(zhǎng)度,再用最高位b7作為奇偶校驗(yàn)位,正好是一個(gè)字節(jié)。
1967年美國(guó)國(guó)家標(biāo)準(zhǔn)學(xué)會(huì)(American National Standards Institute,ANSI)提出一套編碼方案作為數(shù)據(jù)傳輸?shù)臉?biāo)準(zhǔn)碼,稱為美國(guó)信息交換標(biāo)準(zhǔn)碼(America Standard Code for Information Interchange,ASCII)。ASCII后來被國(guó)際標(biāo)準(zhǔn)化組織(International Organization for Standardization, ISO)接納,批準(zhǔn)作為國(guó)際標(biāo)準(zhǔn)ISO646。1981年我國(guó)參照ASCII碼頒布了國(guó)家標(biāo)準(zhǔn)《信息處理交換用七單位字符編碼》,與ASCII碼基本相同。ASCII是一個(gè)如 表3.2所示的7b組成的字符集。
表3.2 ASCII碼(7位碼)字符表
在碼表中查找一個(gè)字符所對(duì)應(yīng)的ASCII碼的方法是:向上找b6b5b4,向左找b3b2b1b0。例如,字母J的ASCII碼中的b6b5b4為100B(4H),b3b2b1b0為1010B(AH)。因此,J 的ASCII碼為1001010B(4AH)。
字母和數(shù)字的ASCII碼的記憶是非常簡(jiǎn)單的:只要記住了一個(gè)字母或數(shù)字的ASCII碼(例如,記住A為十進(jìn)制的65,0的ASCII碼為十進(jìn)制的48),知道相應(yīng)的大小寫字母之間差32,就可以推算出其余字母、數(shù)字的ASCII碼。
由于標(biāo)準(zhǔn)ASCII字符集字符數(shù)目有限,在實(shí)際應(yīng)用中往往無(wú)法滿足要求。為此,國(guó)際標(biāo)準(zhǔn)化組織又制定了ISO 2022標(biāo)準(zhǔn),在保持與ISO 646兼容的前提下,將ASCII字符集擴(kuò)充為8b的統(tǒng)一方法。多出的128個(gè)0、1編碼稱為擴(kuò)展ASCII碼(Extended ASCII),以適用于不同國(guó)家和地區(qū)使用。這樣,就形成兩個(gè)ASCII字符集:基本ASCII碼(最高位為0)和擴(kuò)展ASCII碼(最高位為1)。
2.Unicode字符集
擴(kuò)展ASCII碼字符集最多可以提供256個(gè)字符,雖然足夠表示英語(yǔ),但也僅局限于英語(yǔ)的表示,對(duì)于世界大多數(shù)文字,還是無(wú)能為力。為此,國(guó)際標(biāo)準(zhǔn)組織ISO于1984年4月成立ISO/IEC JTC1/SC2/WG2工作組,針對(duì)各國(guó)文字、符號(hào)進(jìn)行統(tǒng)一編碼。Unicode (Universal Multiple Octet Coded Character Set)于1992年6月通過DIS(Draf International Standard)。Unicode字符集采用16b表示字符,能夠表示的字符數(shù)為65?534個(gè),其中包含符號(hào)6811個(gè)、漢字20?902個(gè)、韓文拼音11?172個(gè)、造字區(qū)6400個(gè),保留20?249個(gè)。
為了與ASCII兼容,Unicode設(shè)計(jì)成ASCII的超集,即Unicode字符集中的前256個(gè)字符的編碼與擴(kuò)展ASCII字符集完全一樣。
3. 字符的輸出
西文是拼音文字,計(jì)算機(jī)的鍵盤就是按照這一特點(diǎn)設(shè)計(jì)的。在采用ASCII的系統(tǒng)中,從鍵盤上輸入一個(gè)字符,在計(jì)算機(jī)內(nèi)部存儲(chǔ)的是一個(gè)ASCII碼值——機(jī)內(nèi)碼(在機(jī)器內(nèi)部存儲(chǔ)字符的碼)。但是,如何再將這個(gè)字符輸出呢?并且如何由一個(gè)ASCII碼得到某種字體的該字符呢?
實(shí)際上,不同字體的字符都是一個(gè)圖形。存儲(chǔ)這個(gè)圖形的方法是在一個(gè)柵格中用方塊組成的點(diǎn)陣畫出一個(gè)字符的圖形——稱為字模。圖?3.5?為字符 A的字模。它是一個(gè)8×8的點(diǎn)陣。字模的點(diǎn)陣數(shù)越多,字形就越好看,但占用的存儲(chǔ)空間越大。如一個(gè)8×8點(diǎn)陣字模占用的存儲(chǔ)空間8B,一個(gè)16×16點(diǎn)陣字模占用的存儲(chǔ)空間32B。一般的點(diǎn)陣類型有16×16、24×24、32×32、48×48等。除了點(diǎn)陣組成的字模外,還可以采用矢量或曲線畫出的字模。
一種字體的所有字符的字模,構(gòu)成一個(gè)字模庫(kù)。要進(jìn)行輸出某種字體的一個(gè)字符,就須驅(qū)動(dòng)該字模庫(kù)中需要調(diào)用的字模的存儲(chǔ)地址(或者干脆把某字符對(duì)應(yīng)的ASCII碼值當(dāng)作字庫(kù)的地址),然后控制打印機(jī)的針頭或顯示器的像素(發(fā)光點(diǎn)),打印或顯示出要求字體的要求字符。
3.1.3 漢字的0、1編碼
1. 幾種常用的漢字機(jī)內(nèi)編碼方案
漢字是世界上符號(hào)最多的文字,歷史上流傳下來的漢字總數(shù)有七八萬(wàn)之多。為了解決漢字的編碼問題,人們推出了多種漢字編碼方案。下面介紹常用的幾種常用的漢字編碼方案。
1)GB 2312—1980和GB 2312—1990
GB 2312—1980是1980年發(fā)布的中文信息處理的中國(guó)國(guó)家標(biāo)準(zhǔn),全稱是GB 2312—1980《信息交換用漢字編碼字符集 基本集》,共收錄6763個(gè)簡(jiǎn)體漢字、682個(gè)符號(hào),其中漢字分為兩級(jí):一級(jí)字3755,以拼音排序;二級(jí)字3008,以偏旁排序。
GB 2312—1980為基本漢字編碼,在中國(guó)大陸及海外使用簡(jiǎn)體中文的地區(qū)(如新加坡等)是強(qiáng)制使用的唯一中文編碼。1990年又制定了繁體字的編碼標(biāo)準(zhǔn)GB 12345—1990《信息交換用漢字編碼字符集 第一輔助集》,目的在于規(guī)范必須使用繁體字的各種場(chǎng)合,以及古籍整理等。該標(biāo)準(zhǔn)共收錄6866個(gè)漢字(比GB 2312多103個(gè)字,純繁體的字大概有2200余個(gè)。
GB 2312—1980和GB 2312—1980都是采用雙字節(jié)編碼。為了與系統(tǒng)中基本的ASCII字符集區(qū)分開,所有漢字編碼的每個(gè)字節(jié)的第一位都是1。例如,“啊”字的編碼為0xB0A1。
2)Big5編碼
Big5編碼是目前中國(guó)臺(tái)灣、香港地區(qū)普遍使用的一種繁體漢字的編碼標(biāo)準(zhǔn),包括440個(gè)符號(hào),一級(jí)漢字5401個(gè)、二級(jí)漢字7652個(gè),共計(jì)13?053個(gè)漢字。Big 5 是一個(gè)雙字節(jié)編碼方案,其第一字節(jié)的值在十六進(jìn)制的 A0~FE 之間,第二字節(jié)在 40~7E 和 A1~FE 之間。因此,第一字節(jié)的最高位是 1,第二字節(jié)的最高位則可能是 1,也可能是 0。
3)GBK編碼
GBK全稱“漢字內(nèi)碼擴(kuò)展規(guī)范”(俗稱大字符集),是中國(guó)大陸地區(qū)制定的。GBK工作小組于1995年12月完成GBK規(guī)范。該編碼標(biāo)準(zhǔn)兼容GB?2312,共收錄漢字21?003個(gè)、符號(hào)883個(gè),并提供1894個(gè)造字碼位,簡(jiǎn)、繁體字融于一庫(kù)。
4)Unicode編碼
如前所述,Unicode字符集包含漢字20?902個(gè)。
5)GB 18030—2000
2000年3月,信息產(chǎn)業(yè)部和質(zhì)量技術(shù)監(jiān)督局在北京聯(lián)合發(fā)布了《信息技術(shù)和信息交換用漢字編碼字符集、基本集的擴(kuò)充》,國(guó)家標(biāo)準(zhǔn)號(hào)為GB?18030—2000,收錄了27?484個(gè)漢字,還收錄了藏、蒙、維等主要少數(shù)民族的文字,總編碼空間超過150萬(wàn)個(gè)碼位,為解決人名、地名用字問題提供了方案,為漢字研究、古籍整理等領(lǐng)域提供了統(tǒng)一的信息平臺(tái)基礎(chǔ)。該標(biāo)準(zhǔn)于2000年12月31日強(qiáng)制執(zhí)行。 GB 18030—2000 作為 GBK for Unicode 3.0 的更新而誕生,并且 作為GB 2312—1980《信息交換用漢字編碼字符集基本集》的擴(kuò)展,向下兼容 GBK 和 GB?2312—1980 標(biāo)準(zhǔn)。
GB 18030是1-2-4字節(jié)變長(zhǎng)編碼。
單字節(jié),其值從0到0x7F。
雙字節(jié),第一個(gè)字節(jié)的值從0x81到0xFE,第二個(gè)字節(jié)的值從0x40到0xFE(不包括0x7F)。
四字節(jié),第一個(gè)字節(jié)的值從0x81到0xFE,第二個(gè)字節(jié)的值從0x30到0x39,第三個(gè)字節(jié)的值從0x81到0xFE,第四個(gè)字節(jié)的值從0x30到0x39。
這幾種編碼都是機(jī)內(nèi)碼。
2. 漢字的輸入——漢字外碼
現(xiàn)在使用的計(jì)算機(jī)鍵盤是根據(jù)英文設(shè)計(jì)的,而漢字形狀復(fù)雜,沒有確切的讀音信息,且一字多音、一音多字,要像輸入西文字符那樣在現(xiàn)有鍵盤上利用機(jī)內(nèi)碼進(jìn)行輸入非常困難。為此,不得不設(shè)計(jì)專門用來進(jìn)行輸入的漢字編碼——漢字外碼。常見的輸入法有以下幾類。
(1)按漢字的排列順序形成的編碼(流水碼),如區(qū)位碼。
(2)按漢字的讀音形成的編碼(音碼),如全拼、簡(jiǎn)拼、雙拼等。
(3)按漢字的字形形成的編碼(形碼),如五筆字型、鄭碼等。
(4)按漢字的音、形結(jié)合形成的編碼(音形碼),如自然碼、智能ABC。
輸入碼在計(jì)算機(jī)中必須轉(zhuǎn)換成機(jī)內(nèi)碼,才能進(jìn)行存儲(chǔ)和處理。
3. 漢字的字模
漢字字模的原理與西文字符的字模基本相同,只是由于漢字筆畫復(fù)雜,為了表達(dá)清晰,要比西文字符需要更多的點(diǎn)陣。圖3.6為一個(gè)24×24點(diǎn)陣的漢字字模 示例。
4. 漢字系統(tǒng)的工作過程
圖3.7描畫了一個(gè)計(jì)算機(jī)上從漢字的輸入到輸出(顯示)的過程。
……