色尼玛亚洲综合影院,亚洲3atv精品一区二区三区,麻豆freexxxx性91精品,欧美在线91

php各種編碼集詳解和以及在什么情況下進(jìn)行使用

字符集是多個(gè)字符的集合,字符集種類較多,每個(gè)字符集包含的字符個(gè)數(shù)不同,常見字符集名稱:ASCII字符集、GB2312字符集、BIG5字符集、 GB 18030字符集、Unicode字符集等。計(jì)算機(jī)要準(zhǔn)確的處理各種字符集文字,需要進(jìn)行字符編碼,以便計(jì)算機(jī)能夠識(shí)別和存儲(chǔ)各種文字。

中文文字?jǐn)?shù)目大,而且還分為簡(jiǎn)體中文和繁體中文兩種不同書寫規(guī)則的文字,而計(jì)算機(jī)最初是按英語(yǔ)單字節(jié)字符設(shè)計(jì)的,因此,對(duì)中文字符進(jìn)行編碼,是中文信息交流的技術(shù)基礎(chǔ)。本文將按照字符集的時(shí)間順序討論幾種典型的字符集,選取幾種代表性的中文字符集,研究歷史由來、特點(diǎn)、技術(shù)特征。

  ASCII 字符集

  1.名稱的由來

  ASCII(American Standard Code for Information Interchange,美國(guó)信息互換標(biāo)準(zhǔn)代碼)是基于羅馬字母表的一套電腦編碼系統(tǒng)。

  2.特點(diǎn)

  它主要用于顯示現(xiàn)代英語(yǔ)和其他西歐語(yǔ)言。它是現(xiàn)今最通用的單字節(jié)編碼系統(tǒng),并等同于國(guó)際標(biāo)準(zhǔn)ISO 646。

  3.包含內(nèi)容

  控制字符:回車鍵、退格、換行鍵等。

  可顯示字符:英文大小寫字符、阿拉伯?dāng)?shù)字和西文符號(hào)

  4.技術(shù)特征

  7位(bits)表示一個(gè)字符,共128字符

  5.ASCII擴(kuò)展字符集

  7位編碼的字符集只能支持128個(gè)字符,為了表示更多的歐洲常用字符對(duì)ASCII進(jìn)行了擴(kuò)展,ASCII擴(kuò)展字符集使用8位(bits)表示一個(gè)字符,共256字符。

  ASCII擴(kuò)展字符集比ASCII字符集擴(kuò)充出來的符號(hào)包括表格符號(hào)、計(jì)算符號(hào)、希臘字母和特殊的拉丁符號(hào)。

  GB2312 字符集

  1.名稱的由來

  GB2312又稱為GB2312-80字符集,全稱為《信息交換用漢字編碼字符集?基本集》,由原中國(guó)國(guó)家標(biāo)準(zhǔn)總局發(fā)布,1981年5月1日實(shí)施。

  2.特點(diǎn)

  GB2312是中國(guó)國(guó)家標(biāo)準(zhǔn)的簡(jiǎn)體中文字符集。它所收錄的漢字已經(jīng)覆蓋99.75%的使用頻率,基本滿足了漢字的計(jì)算機(jī)處理需要。在中國(guó)大陸和新加坡獲廣泛使用。

  3.包含內(nèi)容

  GB2312收錄簡(jiǎn)化漢字及一般符號(hào)、序號(hào)、數(shù)字、拉丁字母、日文假名、希臘字母、俄文字母、漢語(yǔ)拼音符號(hào)、漢語(yǔ)注音字母,共 7445 個(gè)圖形字符。其中包括6763個(gè)漢字,其中一級(jí)漢字3755個(gè),二級(jí)漢字3008個(gè);包括拉丁字母、希臘字母、日文平假名及片假名字母、俄語(yǔ)西里爾字母在內(nèi)的682個(gè)全角字符。

  4.技術(shù)特征

  (1)分區(qū)表示:

  GB2312中對(duì)所收漢字進(jìn)行了“分區(qū)”處理,每區(qū)含有94個(gè)漢字/符號(hào)。這種表示方式也稱為區(qū)位碼。

  各區(qū)包含的字符如下:01-09區(qū)為特殊符號(hào);16-55區(qū)為一級(jí)漢字,按拼音排序;56-87區(qū)為二級(jí)漢字,按部首/筆畫排序;10-15區(qū)及88-94區(qū)則未有編碼。

  (2)雙字節(jié)表示

  兩個(gè)字節(jié)中前面的字節(jié)為第一字節(jié),后面的字節(jié)為第二字節(jié)。習(xí)慣上稱第一字節(jié)為“高字節(jié)” ,而稱第二字節(jié)為“低字節(jié)”。

  “高位字節(jié)”使用了0xA1-0xF7(把01-87區(qū)的區(qū)號(hào)加上0xA0),“低位字節(jié)”使用了0xA1-0xFE(把01-94加上0xA0)。

  5.編碼舉例

  以GB2312字符集的第一個(gè)漢字“啊”字為例,它的區(qū)號(hào)16,位號(hào)01,則區(qū)位碼是1601,在大多數(shù)計(jì)算機(jī)程序中,高字節(jié)和低字節(jié)分別加0xA0得到程序的漢字處理編碼0xB0A1。計(jì)算公式是:0xB0=0xA0+16, 0xA1=0xA0+1。

  BIG5 字符集

  1.名稱的由來

  又稱大五碼或五大碼,1984年由臺(tái)灣財(cái)團(tuán)法人信息工業(yè)策進(jìn)會(huì)和五間軟件公司宏 主站蜘蛛池模板: 兰考县| 田东县| 静海县| 东港市| 库尔勒市| 柳州市| 蓝山县| 乐山市| 比如县| 屯门区| 苍溪县| 胶南市| 比如县| 恩施市| 东丽区| 南雄市| 银川市| 茶陵县| 资兴市| 秀山| 宝清县| 昌宁县| 高陵县| 河津市| 喀喇沁旗| 阜阳市| 邵武市| 新建县| 娱乐| SHOW| 健康| 合川市| 金溪县| 抚顺市| 金川县| 长春市| 鄱阳县| 德兴市| 商南县| 新源县| 伊通|